欢迎您光临优德w888!

优德w888 > 战役战争 > 优德w888Z1:第一台祖思机的架构与算法

优德w888Z1:第一台祖思机的架构与算法

时间:2019-12-19 12:17

This is a translation of "The Z1: Architecture and Algorithms of Konrad Zuse's First Computer" with the permission of its author Raul Rojas. Many thanks for the kind support and help from Prof. Rojas. And thanks to my friend Suo, who's currently in the US, for helping me with my English. The translation is completed to the best of my knowledge and ability. Any comments or suggestions would be greatly appreciated.

5.2.3 API ...............................98

三、系统特点解释
1.整合在O32系统中,方便交易员的操作
2.委托主动推送到转换机,交易速度明显提升
3.交易员可以任意选择算法,算法参数界面会自动生成,参数值可保存为模板
4.支持算法交易时的公平交易
5.自动生成算法交易报表,统计算法交易执行的效果
6.支撑远程监控,随时检查使用算法交易订单的运行情况和算法服务器的运行情况


10.3.2 数据模型........................................192

一、系统架构图

9 总结

Z1的原型机毁于1943年12月柏林一场盟军的空袭中。如今已不可能判定Z1的复制品是否和原型一样。从幸存的那些照片上看,原型机是个大块头,而且不那么「规则」。此处我们只能相信祖思本人所言。但我觉得,尽管他没什么理由要在重建的过程中有意识地去「润色」Z1,记忆却可能悄悄动着手脚。祖思在1935~1938年间记下的那些笔记看起来与后来的复制品一致。据他所言,1941建成的Z3和Z1在设计上十分相似。

二十世纪80年代,西门子(收购了祖思的计算机公司)为重建Z1提供了资金。在两名学生的辅助下,祖思在自己家中完成了所有的建造工作。建成之后,为方便起重机把机器吊起来,运送至柏林,结果祖思家楼上拆掉了一部分墙。

重建的Z1是台优雅的计算机,由成千上万的部件组成,但并没有多余。比如尾数ALU的输出可以仅由两个移位器实现,但祖思设置的那些移位器明显以较低的代价提升了算术运算的速率。我甚至发现,Z1的处理器比Z3的更优雅,它更简洁,更「原始」。祖思似乎是在采用了更简单、更可靠的电话继电器之后,反而在CPU的尺寸上「铺张浪费」。同样的事也发生在Z3若干年后的Z4身上。Z4根本就是大版的Z3,有着大版的指令集,而计算机架构是基本一样的,就算它的指令更多。机械式的Z1从未能一直正常运行,祖思本人后来也称之为「一条死胡同」。他曾开玩笑说,1989年Z1的复制品那是相当精确,因为原型机其实不可靠,虽然复制品也可靠不到哪去。可神奇的是,Z4为了节省继电器而使用的机械式内存却非常可靠。1950~1955年间,Z4在瑞士的苏黎世联邦理工学院(ETH Zürich)服役,其机械内存运行良好[7]

最令我惊讶的是,康拉德·祖思是何等年轻,就对计算机引擎给出了如此优雅的设计。在美国,ENIAC或MARK I团队都是由经验丰富的科学家和电子专家组成的,与此相反,祖思的工作孤立无援,他还没有什么实际经验。从架构上看,我们今天的计算机进与1938年的祖思机一致,反而与1945年的ENIAC不同。直到后来的EDVAC报告草案,以及冯·诺依曼和图灵开发的位串行机中,才引进了更优雅的体系结构。约翰·冯·诺依曼(John von Neumann)1926~1929年间居于柏林,是柏林大学最年轻的讲师(报酬直接来自学生学费的无薪大学教师)。那些年,康拉德·祖思和冯·诺依曼许能在不经意间相遇相知。在那疯狂席卷、那黑夜笼罩德国之前,柏林本该有着许多的可能。

图20:祖思早期为Z1复制品设计的草图之一。日期不明。

14.3 离线挖掘数据分片..............................................279

优德w888 1

7 算术指令

前文提过,Z1可以进行四则运算。在下面将要讨论的表格中,约定用字母「L」表示二进制的1。表格给出了每一项操作所需的一系列微指令,以及在它们的作用下处理器中寄存器之间的数据流。一张表总结了加法和减法(用2的补数),一张表总结了乘法,还有一张表总结了除法。关于两种I/O操作,也有一张表:十-二进制转换和二-十进制转换。表格分为负责指数的A部分和负责尾数的B部分。表中各行显示了寄存器Aa、Ab、Ba、Bb的加载。操作所对应的阶段,在标「Ph」的列中给出。条件(Condition)可以在开始时触发或禁用某操作。某一行在执行时,增量器会设置条件位,或者计算下一个阶段(Ph)。

加法/减法

下面的微指令表,既涵盖了加法的情况,也涵盖了减法。这两种操作的关键在于,将参与加减的两个数进行缩放,以使其二进制指数相等。假设相加的两个数为m1×2a和m2×2b。如果a=b,两个尾数就可以直接相加。如果a>b,则较小的那个数就得重写为m2×2b-a×2a。第一次相乘,相当于将尾数m2右移(a-b)位(使尾数缩小)。让我们就设m2'=m2×2b-a。相加的两个数就变成了m1和m2'。共同的二进制指数为2a。a<b的情况也类似处理。

图15:加法和减法的微指令。5个Ph<sup>译者注</sup>完成一次加法,6个Ph完成一次减法。两数就位之后,检测条件位S0(阶段4)。若S0为1,对尾数相加。若S0为0,同样是这个阶段,尾数相减。

译者注:原文写的是「cycle」,即周期,下文也有用「phase」(阶段)的,根据表中信息,统一用「Ph」更直观,下同。

表中(图15),先找出两数中较大的二进制指数,而后,较小数的尾数右移一定位数,至两者的二进制指数相等。真正的相加从Ph4开始,由ALU在一个Ph内完成。Ph5中,检测这一结果尾数是否是规格化的,如果不是,则通过移位将其规格化。(在进行减法之后)有可能出现结果尾数为负的情况,就将该结果取负,负负得正。条件位S3记录着这一符号的改变,以便于为最终结果进行必要的符号调整。最后,得到规格化的结果。

穿孔带读取器附近的符号单元(见图5,区域16)会预先计算结果的符号以及运算的类型。如果我们假设尾数x和y都是正的,那么对于加减法,(在分配好符号之后)就有如下四种情况。设结果为z:

  1. z = +x +y
  2. z = +x -y
  3. z = -x +y
  4. z = -x –y
    对于情况(1)和(4),可由ALU中的加法来处理。情况(1)中,结果为正。情况(4),结果为负。情况(2)和(3)需要做减法。减法的符号在Ph5(图15)中算得。

加法实行如下步骤:

  • 在指数单元中计算指数之差∆α,
  • 选择较大的指数,
  • 将较小数的尾数右移译者注∆α译者注位,
  • 尾数相加,
  • 将结果规格化,
  • 结果的符号与两个参数相同。

译者注:原文写的是左移,根据上下文,应为右移,暂且视为作者笔误,下文减法步骤中同。

译者注:原文写的是「D」,但表中用的是「∆α」,遂纠正,下同。我猜作者在输了一遍「∆α」之后觉得麻烦,打算完稿之后统一替换,结果忘了……全文有不少此类不够严谨的细节,大抵是由于没有正式发表的缘故。

减法执行如下步骤:

  • 在指数单元中计算指数的之差∆α,
  • 选择较大的指数,
  • 将较小的数的尾数右移∆α位,
  • 尾数相减,
  • 将结果规格化,
  • 结果的符号与绝对值较大的参数相同。

符号单元预先算得了符号,最终结果的符号需要与它结合得出。

乘法

对于乘法,首先在Ph0,两数的指数相加(准则21,指数部分)。而后耗时17个Ph,从Bf中二进制尾数的最低位检查到最高位(从-16到0)。每一步,寄存器Bf都右移一位。比特位mm记录着之前从-16的位置被移出来的那一位。如果移出来的是1,把Bg加到(之前刚右移了一位的)中间结果上,否则就把0加上去。这一算法如此计算结果:

Be = Bf0×20×Bg + Bf-1×2-1×Bg

  • ··· + Bf-16×2-16×Bg

做完乘法之后,如果尾数大于等于2,就在Ph18中将结果右移一位,使其规格化。Ph19负责将最终结果写到数据总线上。

图16:乘法的微指令。乘数的尾数存放在(右移)移位寄存器Bf中。被乘数的尾数存放在寄存器Bg中。

除法

除法基于所谓的「不恢复余数法」,耗时21个Ph。从最高位到最低位,逐位算得商的各个比特。首先,在Ph0计算指数之差,而后计算尾数的除法。除数的尾数存放在寄存器Bg里,被除数的尾数存放在Bf。Ph0期间,将余数初始化至Bf。而后的每个Ph里,在余数上减去除数。若结果为正,置结果尾数的相应位为1。若结果为负,置结果尾数的相应位为0。如此逐位计算结果的各个位,从位0到位-16。Z1中有一种机制,可以按需对寄存器Bf进行逐位设置。

如果余数为负,有两种对付策略。在「恢复余数法」中,把除数D加回到余数(R-D)上,从而重新得到正的余数R。而后余数左移一位(相当于除数右移一位),算法继续。在「不恢复余数法」中,余数R-D左移一位,加上除数D。由于前一步中的R-D是负的,左移使他扩大到2R-2D。此时加上除数,得2R-D,相当于R左移之后与D的差,算法得以继续。重复这一步骤直至余数为正,之后我们就又可以减去除数D了。在下表中,u+2表示二进制幂中,位置2那儿的进位。若此位为1,解释加法的结果为负(2的补数算法)。

不恢复余数法是一种计算两个浮点型尾数之商的优雅算法,它省去了存储的步骤(一个加法Ph的时耗)。

图17:除法的微指令。Bf中的被除数逐位移至一个(左移)移位寄存器中。除数保存在Bg中。<sup>译者注</sup>

译者注:原文写的是除数在Bf、被除数在Bg,又是一处明显的笔误。

奇怪的是,Z3在做除法时,会先测试Ba和Bb之差是否可能为负,若为负,就走Ba到Be的一条捷径总线使减去的除数无效(丢弃这一结果)。复制品没有使用这一方法,不恢复余数法比它优雅得多。

11.1.2 系统架构......................................203

二、系统功能解释
    在统一部署式算法交易系统中,交易员选择使用一个算法交易模型之后,通过设置一系列参数,将母单发送给算法交易服务器,算法交易服务器启动算法交易之后,会根据设置的参数,选择合适的时间、合适的价格和合适的数量,将子单发送给O32系统,并报盘至交易所,O32系统在接收到成交回报之后,会将成交回报主动推送给算法交易服务器,保证算法交易服务器能够及时收到交易所的反馈信息。

2 分块结构

Z1是一台时钟控制的机器。作为机械设备,其时钟被细分为4个子周期,以机械部件在4个相互垂直的方向上的移动来表示,如图3所示(左侧「Cycling unit」)。祖思将一次移动称为一次「衔接(engagement)」。他计划实现4Hz的时钟周期,但柏林的复制品始终连1Hz(4衔接/秒)都超不过。以这速度,一次乘法运算要耗时20秒左右。

图3:根据1989年的复制品,所得的Z1(1936~1938年)框图。原Z1的内存容量只有16字,而不是64字。穿孔带由35毫米电影胶卷制成。每一项指令以8比特位编码。

Z1的诸多特性被后来的Z3所采用。以现在的眼光来看,Z1(见图3)中最重要的革新如有:

  • 基于完全的二进制架构实现内存和处理器。

  • 内存与处理器分离。在复制品中,机器大约一半由内存和穿孔带读取器构成。另一半由处理器、I/O控制台和微控制单元构成。原Z1的内存容量是16字,复制品是64字。

  • 可编程:从穿孔带读入8比特长的指令(其中2位表示操作码译者注、6位表示内存地址,或者以3位表示四则运算和I/O操作的操作码)。因此指令只有8种:四则运算、内存读写、从十进制面板读入数据、将结果寄存器里的内容显示到十进制展板。

译者注:应是指内存读写的操作码。

  • 内存和处理器中的内部数据以浮点型表示。于是,处理器分为两个部分:一部分处理指数,另一部分处理尾数。位于二进制小数点后面的尾数占16个比特。(规格化的浮点数)小数点左边那位永远是1,不需要存。指数占7位,以2的补数形式表示(-64~+63)。用额外的1个比特来存储浮点数的符号位。所以,存储器中的字长为24位(16位尾数、7位指数、1位符号位)。

  • 参数或结果为0的特殊情况(规格化的尾数无法表示,它的第一位永远是1)由浮点型中特殊的指数值来处理。这一点到了Z3才实现,Z1及其复制品都没有实现。因此,Z1及其复制品都处理不了中间结果有0的情况。祖思知道这一短板,但他留到更易接线的继电器计算机上去解决。

  • CPU是微代码结构的:操作被分解成一系列微指令,一个机器周期一条微指令。微指令在算术逻辑单元(ALU)之间产生具体的数据流,ALU不停地运作,每个周期都将两个输入寄存器里的数加一遍。

  • 神奇的是,内存和处理器可以分别独立运行:只要穿孔带给出命令,内存就在通信接口写入或读取数据。处理器也将在执行存取操作时在通信接口写入或读取。可以关闭内存而只运行处理器,此时原本来自内存的数据将变为0。也可以关了处理器而只运行内存。祖思因而可以单独调试机器的两个部分。同时运作时,有一根连接两者周期单元的轴将它们同步起来。

Z1的其他革新与后来Z3中体现出来的想法相似。Z1的指令集与Z3几乎一样,但它算不了平方根。Z1利用废弃的35毫米电影胶卷作为穿孔带。

图3展示了Z1复制品的抽象图。注意机器的两个主要部分:上半部分是内存,下半部分是处理器。每部分都有其自己的周期单元,每个周期进一步分为4个方向上(由箭头标识)的机械移动。这些移动可以靠分布在计算部件下的杠杆带动机器的任何部分。一次读入一条穿孔带上的指令。指令的持续时间各不相同。存取操作耗时一个周期,其他操作则需要多个周期。内存地址位于8位操作码的低6位比特中,允许程序员寻址64个地址。

如图3所示译者注,内存和处理器通过彼此各单元之间的缓存进行通信。在CPU中,尾数的内部表示扩到了20位:二进制小数点前加两位(以表示二进制幂21和20),还有两位表示最低的二进制幂(2-17和2-18),旨在提高CPU中间结果的精度。处理器中20位的尾数可以表示21~2-18的二进制幂。

译者注:原文写的是图1,我觉得是作者笔误,应为图3。

解码器从穿孔带读取器获得指令,判断好操作之后开始按需控制内存单元和处理器。(根据加载指令)将数从内存读到CPU两个浮点数寄存器之一。再根据另一条加载指令将数从内存读到另一个CPU寄存器中。这两个寄存器在处理器里可以相加、相减、相乘或相除。这类操作既涉及尾数的相加,也涉及指数的加减(用2的补码加法器)。乘除结果的符号位由与解码器直接相连的「符号单元」处理。

穿孔带上的输入指令会使机器停止,以便操作人员通过拨动机械面板上的4个十进制位输入数据,同时通过一根小杆输入指数和符号。而后操作员可以重启机器。输出指令也会使机器停止,将结果寄存器中的内容显示到十进制机械面板上,待操作员按下某根小杆,机器重新运行。

图3中的微序列器和指数尾数加法单元共同组成了Z1计算能力的核心。每项算术或I/O操作都被细分为多个「阶段(phases)」。而后微序列器开始计数,并在加法单元的12层机械部件中选择相应层片上合适的微操作。

所以举例来说,穿孔带上最小的程序可以是这样的:1) 从地址1(即第1个CPU寄存器)加载数字;2) 从地址2(即第2个CPU寄存器)加载数字;3) 相加;4) 以十进制显示结果。这个程序因而允许操作员预先定义好一坨运算,把Z1当做简单的机械计算器来用。当然,这一系列运算可能长得多:时可以把内存当做存放常量和中间结果的仓库,编写自动化的系列运算(在后来的Z4计算机中,做数学计算的穿孔带能有两米长)。

Z1的体系结构可以用如下的现代术语来总结:这是一台可编程的通用浮点型冯·诺依曼机(处理器和内存分离),有着只读的外部程序,和24位、16字的存储空间。可以接收4位数的十进制数(以及指数和符号)作为输入,然后将转换为二进制。可以对数据进行四则运算。二进制浮点型结果可以转换回科学记数法表示的十进制数,方便用户读取。指令中不包含条件或无条件分支。也没有对结果为0的异常处理。每条指令拆解为机器里「硬接线」的微指令。微序列器规划着微指令的执行。在一个仅存的机器运行的视频中,它宛若一台织布机。但它编织的是数字。

6.3 应用层多播通信(软件lication-Level Multi-Broadcast)........114

6 处理器的数据通路

图12展示了Z1的浮点数处理器。处理器分别有一条处理指数(图左)和一条处理尾数(图右)的数据通路。浮点型寄存器F和G均由记录指数的7个比特和记录尾数的17个比特构成。指数-尾数对(Af,Bf)是浮点寄存器F,(Ag,Bg)是浮点寄存器G。参数的符号由外部的一个符号单元处理。乘除结果的符号在计算前得出。加减结果的符号在计算后得出。

我们可以从图12中看到寄存器F和G,以及它们与处理器其他部分的关系。ALU(算术逻辑单元)包含着两个浮点寄存器:(Aa,Ba)和(Ab,Bb)。它们直接就是ALU的输入,用于加载数值,还可以根据ALU的输出Ae和Be的总线反馈,保存迭代过程中的中间结果。

Z1中的数据总线使用「三态」模式,意即,诸多输入都可以推到同一根数据线(也是个机械部件)上。不需要「用电」把数据线和输入分离开来,因为根本也没有电。因着机械部件没有移动(没有推动)就代表输入0,移动(推动)了就代表输入1,部件之间不存在冲突。如果有两个部件同时往一根数据线上输入,唯一重要的是确保它们能根据机器周期按序执行(推动只在一个方向上生效)。

图12:Z1中的处理器数据通路。左半部分对应指数的ALU和寄存器,右半部分对应尾数的。可以将结果Ae和Be反馈给临时寄存器,可以对它们进行取负值或移位操作。直接将4比特长的十进制数逐位(每一位占4比特)拷至寄存器Ba。而后对其进行十进制到二进制的转换。

程序员能接触到的寄存器只有(Af,Bf)和(Ag,Bg)。它们没有地址:加载指令第一个加载的寄存器是(Af,Bf),第二个加载的是(Ag,Bg)。加载完两个寄存器,就可以开始算术运算了。(Af,Bf)同时还是算术运算的结果寄存器。(Ag,Bg)在一次算术运算之后可以隐式加载,并继续担当新一轮算术运算的第二个参数。这种寄存器的使用方案和Z3相同。但Z3中少了(Ag,Bg)。其主寄存器和辅寄存器之间的协作比Z1更复杂。

从处理器的数据通路可见,独立的寄存器Aa、Ab、Ba和Bb可以加载不同类型的数据:来自其他寄存器的值、常数(+1、-1、3、13)、其他寄存器的取负值、ALU反馈回来的值。可以对ALU的输出进行取负值或移位操作。以代表与2n相乘的矩形框表示左移n位;以与2n相除表示右移n位。这些矩形框代表具有相应的移位或求补逻辑的机械线路。举个例子,寄存器Ba和Bb相加的结果存于Be,可以对其进行多种转换:可以取反(-Be)、可以右移一或两位(Be/2、Be/4)、或可以左移一或三位(2Be、8Be)。每一种转换都在组成ALU的机械层片中有着各自对应的层片。有效计算的相关结果将传回给寄存器Ba或Bb。具体是哪个寄存器,由微控制器指定的、激活相应层片的小杆来指定。计算结果Be也可以直接传至内存单元(图12没有画出相应总线)。

ALU在每个周期内都进行一次加法。ALU算完后,擦除各寄存器Aa、Ab、Ba、Bb,可载入反馈值。

图13:处理器中各项操作的分层式空间布局。Be的移位器位于左侧那一摞上。加法单元分布在最左边那三摞。Bf的移位器以及值为10<sup>-16</sup>的二进制数位于右侧那一摞。计算结果通过右侧标Res的线传至内存。寄存器Bf和Bg从内存获得值,作为第一个(Op1)和第二个操作数(Op2)。

寄存器Ba有一项特殊使命,就是将四位十进制的数转换成二进制。十进制数从机械面板输入,每一位都转换成4个比特。把这些4比特的组合直接传进Ba(2-13的位置),将第一组4比特与10相乘,下一组与这个中间结果相加,再与10相乘,以此类推。举个例子,假设我们想转换8743这个数,先输入8并乘以10。然后7与这个结果相加,所得总数(87)乘以10。4再与结果(870)相加,以此类推。如此实现了一种将十进制输入转换为二进制数的简单算法。在这一过程中,处理器的指数部分不断调整最终浮点结果的指数。(指数ALU中常数13对应213,后文还有对十-二进制转换算法的详述。)

图13还展示了处理器中,尾数部分数据通路各零件的空间分布。机器最左侧的模块由分布在12个层片上的移位器构成。寄存器Bf和Bg(层片5和层片7)直接从右边的内存获得数据。寄存器Be中的结果横穿层片8回传至内存。寄存器Ba、Bb和Be靠垂直的小杆存储比特值(在上面这幅处理器的横截面图中只能看到一个比特)。ALU分布在两摞机械上。层片1和层片2完成对Ba和Bb的AND运算和XOR运算。所得结果往右传,右边负责完成进位以及最后一步XOR运算,并把结果存储于Be。结果Be可以回传、存进内存,也可以以图中的各方式进行移位,并根据要求回传给Ba或Bb。有些线路看起来多余(比如将Be载入Ba有两种方式),但它们是在提供更多的选择。层片12无条件地将Be载入Ba,层片9则仅在指数Ae为0时才这么做。图中,标成绿色的矩形框表示空层片,不承担计算任务,任由机械部件穿堂而过。Bf和Bf'之间的矩形框包含了Bf做乘法运算时所需的移位器(处理时Bf中的比特从最低一位开始逐位读入)。

图14:指数ALU和尾数ALU间的通信。

现在你可以想象出这台机器里的计算流程了:数据从寄存器F和G流入机器,填入寄存器A和B。执行一次加法或一系列的加减(以实现乘除)运算。在A和B中不断迭代中间结果直至得到最终结果。最终结果载入寄存器F,而后开始新一轮的计算。

事实上也是如此,最近几年各种国际顶级会议中,中国人发表的论文比例越来越高可以证明这一点,而很明显这个趋势还会进一步加快。之所以提这个,是因为大数据相关技术研发道理其实也是一样的,尽管目前国内在这方面的实力和国外相比还有很大的差距,优秀的系统和技术方案往往都是谷歌、Amazon、脸书、Linkedin 等这些国际知名互联网公司提出的,国内工业界的技术水准大部分还仅仅停留在能把开源的大数据系统应用起来解决手头碰到的问题这个阶段,但是咱相信在不远的将来,国内会逐步涌现出具有国际水准的大数据系统与解决方案,其中的道理与上面所举的学术进步的例子是一样的。目前大部分优秀系统是开源的,相关技术文献也很容易找到,作为有进取心的技术人员,现在所缺乏的不是没有可参考的学习资料,相反是资料太多但良莠不齐反而让很多人无所适从,不知该如何下手。国内的技术人员只要肯下功夫、会下功夫,有好的职业发展环境和高的自我期许及技术理想,假以时日,越来越多的世界级水准的大数据处理系统出自中国人之手是完全可以指日可待的。我希望本书对于这些技术人员在全面了解吸取并掌握大数据处理的优秀技术过程中,能贡献绵薄之力。沈利也参与了本书的部分编写工作。

摘要

本文首次给出了对Z1的综合介绍,它是由德国发明家康拉德·祖思(Konrad Zuse)1936~1938年期间在柏林建造的机械式计算机。文中对该计算机的主要结构零件、高层架构,及其组件之间的数据交互进行了描述。Z1能用浮点数进行四则运算。从穿孔带读入指令。一段程序由一系列算术运算、内存读写、输入输出的指令构成。使用机械式内存存储数据。其指令集没有实现条件分支。

虽然,Z1的架构与祖思在1941年实现的继电器计算机Z3十分相似,它们之间仍然存在着明显的差异。Z1和Z3都通过一系列的微指令实现各类操作,但前者用的不是旋转式开关。Z1用的是数字增量器(digital incrementer)和一套状态位,它们可以转换成作用于指数和尾数单元以及内存块的微指令。计算机里的二进制零件有着立体的机械结构,微指令每次要在12个层片(layer)中指定一个使用。在浮点数规格化方面,没有考虑尾数为零的异常处理,直到Z3才弥补了这一点。

文中的文化源自对祖思为Z1复制品(位于柏林德国技术博物馆)所画的设计图、一些信件、笔记本中草图的仔细研究。尽管这台计算机从1989年展出至今(停运状态),始终没有关于其体系结构详细的、高层面的阐述可寻。本文填补了这一空白。

《大数据日知录:架构与算法》从架构与算法角度全面梳理了大数据存储与处理的相关技术。大数据技术具有涉及的学问点异常众多且正处于快速演进发展过程中等特点,其技术点包括底层的硬件体系结构、相关的基础理论、大规模数据存储系统、分布式架构设计、各种不同应用场景下的差异化系统设计思路、机器学习与数据挖掘并行算法以及层出不穷的新架构、新系统等。《大数据日知录:架构与算法》对众多纷繁芜杂的相关技术文献和系统进行了择优汰劣并系统性地对相关学问分门别类地进行整理和介绍,将大数据相关技术分为大数据基础理论、大数据系统体系结构、大数据存储,以及包含批处理、流式计算、交互式数据分析、图数据库、并行机器学习的架构与算法以及增量计算等技术分支在内的大数据处理等几个大的方向。通过这种体系化的学问梳理与解说,相信对于读者整体和系统地了解、吸取和掌握相关的优秀技术有极大的帮助与促进作用。

参考文献

[1] Horst Materna, Die Geschichte der Henschel Flugzeug-Werke in Schönefeld bei Berlin 1933-1945, Verlag Rockstuhl, Bad Langensalza,

  1. [2] Zuse, K., Der Computer – Mein Lebenswerk, Springer-Verlag, Berlin, 3rd Edition, 1993.
    [3] Rojas, R., "Konrad Zuse's legacy: the architecture of the Z1 and Z3", Annals of the History of Computing, Vol. 19, N. 2, 1997, pp. 5–16.
    [4] Ursula Schweier, Dietmar Saupe, "Funktions- und Konstruktionsprinzipien der programmgesteuerten mechanischen Rechenmaschine Z1", Arbeitspapiere der GMD 321, GMD, Sankt Augustin, August 1998.
    [5] Rojas, R. (ed.), Die Rechenmaschinen von Konrad Zuse, Springer-Verlag, Berlin, 1998.
    [5] Website: Architecture and Simulation of the Z1 Computer, http: http://zuse-z1.zib.de/, last access: July 21st, 2013.
    [6] Konrad Zuse, "Rechenvorrichtung aus mechanischen Schaltglieder", Zuse Papers, GMD 019/003 (undated), http://zuse.zib.de/, last access July 21st, 2013.
    [7] Bruderer, H.: Konrad Zuse und die Schweiz: Wer hat den Computer erfunden?, Oldenbourg Wissenschaftsverlag, Munich, 2012.
    [8] Goldstine, H.: "The Electronic Numerical Integrator and Computer (ENIAC)", Annals of the History of Computing, Vol. 18 , N. 1, 1996, S. 10–16.

9.1.2 数据副本管理与数据恢复................................170

3 机械部件的布局

柏林的Z1复制品布局非常清晰。所有机械部件似乎都以完美的方式布放。我们先前提过,对于处理器,祖思至少设计了6个版本。但是主要部件的相对位置一开始就确定了,大致能反映原Z1的机械布局。主要有两个部分:分别是的内存和处理器,由缝隙隔开(如图3所示)。事实上,它们分别安装在带滚轮的桌子上,可以扯开了进行调试。在水平方向上,可以进一步把机器细分为包含计算部件的上半部分和包含所有同步杠杆的下半部分。参观者只有弯腰往计算部件下头看才能看到Z1的「地下世界」。图4是设计图里的一张绘稿,展示了处理器中部分计算和同步的层片。请看那12层计算部件和下侧区域的3层杠杆。要理解那些绘稿是有多难,这张图纸就是个绝好的例子。上面尽管有不少关于各部件尺寸的细节,但几乎没有其功用方面的注解。

图4:Z1(指数单元)计算和同步层片的设计图

图5是祖思画的Z1复制品俯视图,展示了逻辑部件的分布,并标注了每个区域的逻辑功能(这幅草图在20世纪90年代公开)。在上半部分,咱们可以看到3个存储仓。每个仓在一个层片上可以存储8个8比特长的字。一个仓有8个机械层片,所以总共能存64字。第一个存储仓(10a)用来存指数和符号,后两个(10b、10c)存低16位的尾数。用这样的比特分布存放指数和尾数,只需构建3个完全一样的8位存储仓,简化了机械结构。

内存和处理器之间有「缓存」,以与处理器(12abc)进行数据交互。不能在穿孔带上直接设常数。所有的数据,要么由用户从十进制输入面板(图右侧18)输入,要么是计算机自己算得的中间结果。

图中的所有单元都仅仅展示了最顶上的一层。切记Z1可是建得犹如一坨机械「三明治」。每一个计算层片都与其上下层片严格分离(每一层都有金属的地板和天花板)。层间的通信靠垂直的小杆实现,它们可以把移动传递到上层或下层去。画在表示计算层片的矩形之间的小圆圈就是这些小杆。矩形里那些稍大一点的圆圈代表逻辑操作。我们可以在每个圆圈里找见一个二进制门(纵贯层片,每个圆圈最多有12个门)。根据此图,我们可以估算出Z1中逻辑门的数量。不是所有单元都一样高,也不是所有层片都布满着机械部件。保守估计,共有6000个二进制零件组成的门。

图5:Z1示意图,展示了其机械构造的分区。

祖思在图5中给机器的不同模块标上号。各模块的作用如下:

内存区域

  • 11a:6位内存地址的解码器
  • 11b:穿孔带读取器和操作码解码器
  • 10a:7位指数和符号的存储仓
  • 10b、10b:尾数小数部分的存储仓
  • 12abc:加载或存储操作下与处理器交互的接口

处理器区域

  • 16:控制和符号单元
  • 13:指数部分中两个ALU寄存器的多路复用器
  • 14ab:ALU寄存器的多路复用器,乘除法的1比特双向移位器
  • 15a:指数的ALU
  • 15bc:规格化尾数的20位ALU(18位用于小数部分)
  • 17:微代码控制
  • 18:右侧是十进制输入面板,左侧是输出面板

不难想象这幅示意图中从上至下的计算流程:数据从内存出来,进入两个可寻址的寄存器(我们称为F和G)。这两个寄存器是沿着区域13和14ab分布的。再把它们传给ALU(15abc)。结果回传给寄存器F或G(作为结果寄存器),或回传到内存。可以使用「反译」(从二进制转换为十进制)指令将结果显示为十进制。

下面我们来看看各个模块更多的细节,集中讨论主要的计算部件。

16.5.2 谱聚类....................................356

1 康拉德·祖思与Z1

德国发明家康拉德·祖思在19361938年期间建造了他的第一台计算机<sup>注1</sup>(19341935年期间做过一些小型机械线路的实验)。在德国,祖思被视为计算机之父,尽管他在第二次世界大战期间建造的计算机在毁于火灾之后才为人所知。祖思的专业是夏洛腾堡工学院(Technische Hochschule Charlottenburg)(现今的柏林工业大学)的土木工程。他的第一份工作在亨舍尔公司(Henschel Flugzeugwerke),这家企业恰巧从1933年开始建造军用飞机[1]。这位25岁的小年轻,负责完成生产飞机部件所需的一大串结构计算。而他在学生时代,就早已开始考虑机械化计算的可能性[2]。所以他在亨舍尔才干了几个月就辞职,建造机械计算机去了,还开了自己的企业,事实也正是世界上第一家计算机公司。

注1:康拉德·祖思建造计算机的精确年表,来自于他从1946年3月起手记的小本子。本子里记载着,V1建造于1936~1938年间。

在1936~1945年期间,祖思根本停不下来,哪怕被两次短期地召去前线。每一次都最终被召回柏林,继续从事在亨舍尔和自己公司的工作。在这九年间,他建造了如今我们所知的6台计算机,分别是Z1、Z2、Z3、Z4,以及专业领域的S1和S2。后四台建造于第二次世界大战开始之后。Z4是在世界大战结束前的几个月里建好的。祖思一开始给它们的简称是V1、V2、V3、V4(取自实验模型或者说原型(Versuchsmodell)的首字母)。战争结束之后,他把V改成了Z,原因很明显译者注。V1(也就是后来的Z1)是项迷人的黑科技:它是台全机械的计算机,却没有用齿轮表示十进制(前个世纪的巴贝奇这么干,正在做霍尔瑞斯制表机的IBM也这么干),祖思要建的是一台全二进制计算机。机器基于的部件里用小杆或金属板的直线移动表示1,不移动表示0(或者相反,因部件而异)。祖思开发了新型的机械逻辑门,并在他父母家的客厅里做出第一台原型。他在自传里提到了发明Z1及后续计算机背后的故事[2]

译者注:祖思把V改成Z,是为了避免与韦纳·冯·布劳恩(Wernher von Braun)研制的火箭的型号名相混淆。

Z1身为机械,却竟也是台现代计算机:基于二进制,使用浮点型表示数据,并能进行四则运算。从穿孔带读入程序(虽然没有条件分支),计算结果可以写入(16字大小的)内存,也可以从内存读出。机器周期在4Hz左右。

Z1与1941年建成的Z3十分相像,Z3的体系结构在《Annals of the History of Computing》中已有描述[3]。然而,迄今仍没有对Z1高层架构细节上的阐述。最初那台原型机毁于1943年的一场空袭。只幸存了一些机械部件的草图和照片。二十世纪80年代,康拉德·祖思在退休多年之后,在西门子和其他一些德国赞助商的赞助之下,建造了一台完整的Z1复制品,今藏于柏林的技术博物馆(如图1所示)。有两名做工程的学生帮着他完成:那几年间,在德国欣费尔德的自家里,他备好全套图纸,精心绘制每一个(要从钢板上切割出来的)机械部件,并亲自监工。Z1复制品的第一套图纸在1984绘制。1986年4月,祖思画了张时间表,预期能在1987年12月完成机器的建造。1989年,机器移交给柏林博物馆的时候,做了不少次运行和算术运算的演示。然而,Z1复制品和之前的原型机一样,从来都不够可靠,无法在无人值守的情况下长时间运行。甚至在揭幕仪式上就挂了,祖思花了几个月才修好。1995年祖思去世之后,这台机器就再没有启动过。

图1:柏林Z1复制品一瞥(来自[Konrad Zuse Internet Archive](

尽管我们有了柏林的Z1复制品,命运却第二次同我们开了玩笑。除了绘制Z1复制品的图纸,祖思并没有正儿八经地把有关它从头至尾的详尽描述写出来(他本意想交给当地的大学来写)。这事儿本是相当必要的,因为拿复制品和1938年的Z1照片对比,前者明显地「现代化」了。80年代高精密的机械仪器使祖思得以在建造机器时,把钢板制成的层片排布得更加紧密。新Z1很明显比它的前身要小得多。而且有没有在逻辑和机械上与前身一一对应也不好说,祖思有可能吸取了Z3及其他后续机器的经验,对复制品做了改进。在19841989年间所画的那套机械图纸中,光加法单元就出现了至少6种不同的设计方案,散布于58个、最终乃至12个机械层片之间注2。祖思没有留下详细的书面记录,我们也就莫名其妙。更糟糕的是,祖思既然第二次建造了Z1,却还是没有留下关于它综合性的逻辑描述。他就像那些著名的钟表匠,只画出表的部件,不做过多阐释——一流的钟表匠确实也不需要过多的解释。他那两个学生只帮忙写了内存和穿孔带读取器的文档,已经是老天有眼[4]。柏林博物馆的参观者只能看着机器里头成千上万的部件惊叹。惊叹之余就是绝望,即使专业的计算机科学家,也难以设想这头机械怪物内部的工作机理。机器就在这儿,但很不幸,只是尸体。

注2:你可以在我们的网页「Konrad Zuse Internet Archive」上找到Z1复制品的所有图纸。

图2:Z1的机械层片。在右侧可以看见八片内存层片,左侧可以看见12片处理器层片。底下的一堆杆子,用来将时钟周期传递到机器的每个角落。

为写这篇论文,我们仔细研究了Z1的图纸和祖思记事本里零散的笔记,并在现场对机器做了大量的观察。这么多年来,Z1复制品都没有运行,因为里头的钢板被压弯了。我们查阅了超过1100张机器部件的放大图纸,以及15000页的笔记本内容(尽管里头只有一小点有关Z1的信息)。我只能看到一段计算机一部分运作的短视频(于几近20年前录制)。慕尼黑的德意志博物馆收藏了祖思论文里出现的1079张图纸,柏林的技术博物馆则收藏了314张。幸运的是,一些图纸里包含着Z1中部分微指令的定义和时序,以及一些祖思一位一位手写出来的例子。这些例子可能是祖思用以检验机器内部运算、发现bug的。这些信息犹如罗塞塔石碑,有了它们,我们得以将Z1的微指令和图纸联系起来,和我们充分理解的继电器计算机Z3(有全套线路信息[5])联系起来。Z3基于与Z1一样的高层架构,但仍存在一些重要差异。

本文由浅入深:首先,了解一下Z1的分块结构、机械部件的布局,以及祖思用到的一些机械门的例子。而后,进一步深入Z1的核心零件:时钟控制的指数和尾数加法单元、内存、算术运算的微序列器。介绍了机械零件之间如何相互作用,「三明治」式的钢板布局如何组织计算。研究了乘除法和输入输出的过程。最后简要总结了Z1的历史地位。

4.2.4 资源分配粒度(Allocation Granularity) .............76

本文是对论文《The Z1: Architecture and Algorithms of Konrad Zuse’s First Computer》的中文翻译,已征得原编辑Raul Rojas的同意。感谢Rojas教授的支撑与帮助,感谢在美留学的好友——锁在英语方面的指导。本人英文和专业水平有限,不妥之处还请批评指正。

4.3.1 集中式调度器(Monolithic Scheduler).......................78

5 Z1的序列器

Z1中的每一项操作都可以分解为一系列微指令。其过程根据一种叫做「准则(criteria)」的表格实现,如图11所示,表格由成对放置的108块金属板组成(在此我们只能看到最顶上——即层片12——的一对板。剩下的位于这两块板下面,合共12层)。用10个比特编排表格中的条目(金属板本身):

  • 比特Op0、Op1和Op2是指令的二进制操作码
  • 比特S0和S1是条件位,由机器的其他部分设置。举个例子,当S0=1时,加法就转换成了减法。
  • 比特Ph0、Ph1、Ph2、Ph3、Ph4用于对一条指令中的微周期(或者说「阶段」)计数。比如,乘法运算消耗20个阶段,于是Ph0~Ph4这五个比特在运算过程中从0增长到19。

这10个比特意味着,理论上我们可以定义多达1024种不同的条件或者说情况。一条指令最多可占32个阶段。这10个比特(操作码、条件位、阶段)推动金属销(图11中涂灰者),这些金属销hold住微控制板以防它们弹到左边或右边(如图所示,每块板都连着弹簧)。微控制板上分布着各异的齿,这些齿决定着以当前10根控制销的位置,是否可以阻止板的弹动。每块控制板都有个「地址」。当这10位控制比特指定了某块板的地址,它便可以弹到右边(针对图11中上侧的板)或左边(针对图11中下侧的板)。

控制板弹到右侧会按到4个条件位(A、B、C、D)。金属板根据相应准则切割,从而按下A、B、C、D不同的组合。

由于这些板分布于机器的12个层片上, 激活一块控制板自然也意味着为下一步的操作选好了相应的层片。指数单元中的微操作可以和尾数单元的微操作并行开始,毕竟两块板可以同时弹动:一块向左,一块向右。其实也可以让两个不同层片上的板同时朝右弹(右侧对应尾数控制),但机械上的局限限制了这样的「并行」。

图11:控制板。板上的齿根据Op2~Ph0这10个比特所对应的金属销(灰色)的位置,hold住板。指定某块板的「地址」,它便在弹簧的作用下弹到右边(针对上侧的板)或左边(针对下侧的板)。从12层板中指定一块板的同时意味着选出了执行下一步操作的层片。齿状部分A、B、C或D可以裁剪,从而实现在按下微控制单元里的销钉后,只实行必要的操作。图中,上侧的板已经弹到了右侧,并按下了A、C、D三根销钉。

因此控制Z1,就相当于调整金属板上的齿,以使它们可以响应具体的10比特组合,去作用到左右侧的单元上。左侧控制着处理器的指数部分。右侧控制着尾数部分。选项A、B、C、D是互斥的,意即,微控制板只选其一(就是唯一不被按下的那个)。

17.3.1 整体架构.........................................375

8 输入和输出

输入控制台由4列、每列10块小盘构成。操作员可以在每一列(从左至右分别为Za3、Za2、Za1、Za0)上拨出数字09。意即,能输入任意的四位十进制数。每拨一位数,便相应生成等效的、4比特长的二进制值。因而,该输入控制台相当于一张4×10的表,存着10个09的二进制值。

而后Z1的处理器负责将各十进制位Za3、Za2、Za1、Za0通过寄存器Ba(在Ba-13的位置,对应幂2-13)传到数据通路上。先输入Za3(到寄存器Ba),乘以10。再输入Za2,再乘以10。四个位,皆如是重复。Ph7过后,4位十进制数的二进制等效值就在Be中诞生了。Ph8,如有需要,将尾数规格化。Ph7将常数13(二进制是LL0L)加到指数上,以确保在尾数-13的位置上输入数。

用一根小杆设置十进制的指数。Ph9中,这根小杆所处的位置代表了输入时要乘多少次10。

图18:十-二进制转换的微指令。通过机械设备输入4位十进制数。

图19中的表展示了如何将寄存器Bf中的二进制数转换成在输出面板上显示的十进制数。

为免遇到要处理负十进制指数的情况,先给寄存器Bf中的数乘上10-6(祖思限制了机器只能操作大于10-6的结果,即便ALU中的中间结果可以更小些)。这在Ph1完成。这一乘法由Z1的乘法运算完成,整个过程中,二-十进制译者注转换保持「挂起」。

译者注:原文写的十-二进制,目测笔误。

图19:二-十进制转换的微指令。在机械设备上显示4位十进制数。

此后,尾数右移两位(以使二进制小数点的左边有4个比特)。尾数持续位移,直到指数为正,乘3次10。每乘一次,把尾数的整数部分拷贝出来(4个比特),把它从尾数里删去,并根据一张表(Ph4~7中的2Be'-8Be'操作)转换成十进制的形式。各个十进制位(从最高位开始)显示到输出面板上。每乘一次10,十进制显示中的指数箭头就左移一格位置。译者注

译者注:说实话这一段没完全看懂,翻译可能与原意有出入。

8.4.1 行式存储........................................151

4 机械门

理解Z1机械结构的最好办法,莫过于搞懂那几个祖思所用的二进制逻辑门的简单例子。表示十进制数的经典方式一向是旋钮表盘。把一个齿轮分为10个扇区——旋转齿轮可以从0数到9。而祖思早在1934年就决定使用二进制系统(他跟着莱布尼兹称之为「the dyadic system」)。在祖思的技术中,一块平板有两个位置(0或1)。可以通过线性移动从一个状态转移到另一个状态。逻辑门根据所要表示的比特值,将移动从一块板传递到另一块板。这一结构是立体的:由堆叠的平板组成,板间的移动通过垂直放置在平板直角处的圆柱形小杆或者说销钉实现。

我们来看看三种基本门的例子:合取、析取、否定。其主要思想可以有多种机械实现,而有创意如祖思总能画出适应机器立体结构的最佳方案。图6译者注展示了祖思口中的「基本门(elementary gate)」。「使动板(actor plate)」可以视作机器周期。这块板循环地从右向左再向后移动。上面一块板含着一个数据位,起着控制作用。它有1和0两个位置。贯穿板洞的小杆随着平板水平移动(自身保持垂直)。如果上面的板处于0位置,使动板的移动就无法传递给受动板(actuated plate)(见图6左)。如果数据位处于1位置,使动板的移动就可以传递给受动板。这就是康拉德·祖思所谓的「机械继电器」,就是一个可以闭合机械「电流」的开关。该基本门以此将数据位拷贝到受动板,这个数据位的移动方向转了90度。

译者注:原文「Fig. 5」应为笔误。

图6:基本门就是一个开关。如果数据位为1,使动板和受动板就建立连接。如果数据位为0,连接断开,使动板的移动就传递不了。

图7展示了这种平板布局的俯视图。可以看到使动板上的洞口。绿色的控制板可以将圆圈(小杆)拉上拉下。当小杆处于能被使动板扯动的位置时,受动板(红色)才可以左右移动。每一张机械俯视图右侧都画有等效的逻辑开关。数据位能开闭逻辑门,推拉使动板(如箭头所示)。祖思总是习惯把开关画在0位置,如图7所示。他习惯让受动板被使动板推动(图7右),而不是拉动(图7左)。至此,要构建一个非门就很简单了,只需数据位处于0时闭合、1时断开的开关(如图7底部两张图所示)译者注

译者注:相当于与图6的逻辑相反。

有了机械继电器,现在可以直接构建余下的逻辑操作了。图8用抽象符号展示了机器中的必备线路。等效的机械装置应该不难设想。

图7:几种基本门,祖思给出了机械继电器的抽象符号,把继电器画成了开关。习惯上,数据位始终画在0位置。箭头指示着移动方向。使动板可以往左拉(如图左)或往右推(如图右)。机械继电器的初始位置可以是闭合的(如图下两幅图所示)。这种情况下,输出与数据位相反,继电器就是非门。

图8:一些由机械继电器构建的逻辑门。图中,最底部的是一个XOR,它可由包含两块受动板的机械继电器实现。等效的机械结构不难设计。

现在谁都可以构建自己的祖思机械计算机了。基础零件就是机械继电器。可以设计更复杂的连接(比如包含两块受动板的继电器),只是相应的机械结构只能用平板和小杆构建。

构建一台完整的计算机的关键难题是把所有部件相互连接起来。注意数据位的移动方向总是与结果位的移动方向正交。每一次完整的逻辑操作都会将机械移动旋转90度。下一次逻辑操作又把移动旋转90度,以此类推。四门之后,回到最初的移动方向。这就是为什么祖思用东南西北作为周期单位。在一个机器周期内,可以运行4层逻辑计算。逻辑门既可简单如非门,也可复杂如包含两块受动板(如XOR)。Z1的时钟表现为,4次衔接内完成一次加法:衔接IV加载参数,衔接I和II计算部分和与进位,衔接III计算最终结果。

输入的数据位在某层上移动,而结果的数据位传到了别层上去。意即,小杆可以在机器的层片之间上下传递比特。我们将在加法线路中看到这一点。

至此,图5的内涵就更丰富了:各单元里的圆圈正是祖思抽象符号里的圆圈,并反映着逻辑门的状态。现在,我们可以从机械层面拔高,站在更逻辑的高度探讨Z1。

Z1的内存

内存是目前我们对Z1理解最透彻的部分。Schweier和Saupe曾于20世纪90年代对其有过介绍[4]。Z4——康拉德·祖思于1945年完成的继电器计算机——使用了一种非常类似的内存。Z4的处理器由电话继电器构建,但其内存仍是机械式的,与Z1相似。如今,Z4的机械式内存收藏于德意志博物馆。在一名学生的辅助下,我们在计算机中仿真出了它的运作。

Z1中数据存储的主要概念,就是用垂直的销钉的两个位置来表示比特。一个位置表示0,另一个位置表示1。下图展示了如何通过在两个位置之间来回移动销钉来设置比特值。

图9:内存中的一个机械比特。销钉放置于0或1的位置。可读取其位置。

图9(a)译者注展示了内存中的两个比特。在步骤9(b)中,纵向的控制板带着销钉上移。步骤9(c)中,两块横向的使动板中,下侧那块被销钉和控制板推动,上侧那块没被推动。步骤9(d)中,比特位移回到初始位置,而后控制板将它们移到9(a)的位置。从这样的内存中读取比特的过程具有破坏性。读取一位之后,必须靠9(d)的回移还原比特。

译者注:作者没有在图中标出abcd,左上为(a),右上为(b),左下为(c),右下为(d)。另,这组插图有点抽象,我也是盯了好久才看懂,它是俯视图,黑色的小正方形是销钉,纵向的长方形是控制板,销钉在控制板上的长方形洞里移动(两个位置表示0和1),横向的两块带尖齿的长方形是使动板。

通过解码6位地址,寻址字。3位标识8个层片,另外3位标识8个字。每一层的解码线路是一棵典型的三层继电器二进制树,这和Z3中一样(只是树的层数不同)。

我们不再深究机械式内存的结构。更多细节可参见文献[4]。

Z1的加法单元

战后,康拉德·祖思在一份文档里介绍过加法单元,但Z1复制品中的加法单元与之不同。那份文档[6]中,使用OR、AND和恒等(NOT-XOR)逻辑门处理二进制位。而Z1复制品中,加法单元使用两个XOR和一个AND。

前两步计算是:a) 待相加的两个寄存器按位XOR,保存结果;b) 待相加的两个寄存器按位AND,保存结果。第三步就是根据前两步计算进位。进位设好之后,最后一步就是对进位和第一步XOR的结果进行按位XOR运算。

下面的例子展示了如何用上述步骤完成两数的二进制相加。

康拉德·祖思发明的计算机都使用了「预进位」。比起在各二进制位之间串行地传递进位,所有位上的进位可以一步完成。上面的例子就解释了这一过程。第一次XOR产生不考虑进位情况下两个寄存器之和的中间结果。AND运算产生进位比特:进位要传到左边的比特上去,只要这个比特在前一步XOR运算结果是1,进位将继续向左传递。在示例中,AND运算产生的最低位上的进位造成了三次进位,最后和第一次XOR的结果进行XOR。XOR运算产生的一列连续的1犹如火车头,牵引着AND所产生的进位,直到1的链条断裂。

图10所示就是Z1复制品中的加法线路。图中展示了a杆和b杆这两个比特的相加(假设a是寄存器Aa中的第i个比特,b是寄存器Ab中的第i个比特)。使用二进制门1、2、3、4并行进行XOR和AND运算。AND运算作用于5,产生进位ui+1,与此同时,XOR运算用6闭合XOR的比特「链」,或让它保持断开。7是将XOR的结果传给上层的辅助门。8和9计算最后一步XOR,完成整个加法。

箭头标明了各部件的移动。4个方向都上阵了,意即,一次加法运算,从操作数的加载到结果的生成,需要一整个周期。结果传递到e杆——寄存器Ae的第i位。

加法线路位于加法区域的第1、2、3个层片(如后头的图13所示)。康拉德·祖思在没有正式受过二进制逻辑学培训的情况下,就整出了预进位,实在了不得。连第一台大型电子计算机ENIAC采用的都只是十进制累加器的串行进位。哈佛的Mark I用了预进位,但是十进制。

图10:Z3的加法单元。从左至右完成运算。首先按位AND和XOR(门1、2、3、4)。衔接II计算进位(门5和6)。衔接III的XOR收尾整个加法运算(门8和9)。

2.3.3 任意节点更新......................................32

14.2 常见图挖掘问题..........................................277

大数据是当前最为流行的热点概念之一,其已由技术名词衍生到对很多行业产生颠覆性影响的社会现象,作为最明确的技术发展趋势之一,基于大数据的各种新型产品必将会对每个人的日常生活产生日益重要的影响。

感谢我的妻子、岳父、岳母,以及爸爸、妈妈,尽管历时3 年才得以完成本书,但是若是没有你们的全身心支撑,这本书2020 年也无法面世。

11.2.2 过滤模式(Filtering Pattern) ................208

14.4.2 GAS 编程模型...........................................285

8.3.4 HayStack 存储系统的实现...............................148

9.1.1 RAMCloud 整体架构................................169

16.1.2 并行随机梯度下降(Parallel Stochastic Gradient Descent)............341

6.2.2 Kafka .......................111

4.2.1 资源异质性与工作负载异质性............................74

4.4.3 能力调度器(Capacity Scheduler) ..........................82

12.2.2 数据流..............................................226

2.4.1 两阶段提交协议(Two-Phrase Commit,2PC)..........................33

参考文献..............................................90

2.1.1 原教旨CAP 主义..............................................21

定价:69.00元

7.2.1 Databus............................125

3.1.4 应用............................................54

2.2.7 单调写一致性.....................................................30

12.1.3 Samza 架构..........................................224

7.1 Log 数据收集.................................120

16.3.3 分布式LambdaMART........................................351

8.3.3 HayStack 缓存...........................................148

16.6.1 深度学习概况........................................359

4.6 YARN......................................87

 陈运文

以上所述是本书诞生的大背景,目前市面上陆陆续续已经有不少讲大数据的书,有面向大众的概念普及类图书,也有解说大数据技术的书,本书属于第二类,专注于与大数据处理有关的架构与算法,我相信这是一本比较全面地分门别类梳理大数据技术的书籍。从大约2010 年年底起我开始关注并收集整理这方面的技术资料,当然那时还没有听说过大数据的概念,现在的所谓大数据已经是后来的事情了。最初引起咱关注的是与NoSQL 相关的技术,尤其是谷歌和亚马逊的一系列相关工作,当时隐约地觉得这是一种新的技术发展趋势,甚至是一次技术范型的大转换,所以逐步开始投入越来越多的精力到其中,这包括将相关技术资料分门别类地进行收集、阅读和整理,利用业余时间开始一章一节地慢慢写本书,以及在实际工作中尽可能地应用这些技术和系统等若干方面。

17.3 Kineograph ............................374

3.3 LSM 树........................................58

5.1.3 会话与KeepAlive 机制...............................95

2.2.2 最终一致性........................................28

17.1 增量计算模式...........................367

2.2.4 “读你所写”一致性....................................29

2.4.5 Raft 协议.............................................45

本书内容紧跟技术前沿,解说深入浅出,适合大数据领域所有技术人员。

4.4.1 FIFO 调度策略..........................................81

4.2.2 数据局部性(Data Locality) ........................................75

时间是我们的朋友,也是我们的敌人,希望你们能够原谅我。

编辑概况

3.4.2 Dynamo 中的应用.........................................63

第1 章 数据分片与路由.............................................. 9

大数据已成为上到国家领导人,下到媒体会议必谈话题,但大数据的应用时代才刚刚开始,各大互联网公司都奇缺熟悉Hadoop、分布式系统开发和数据分析挖掘的人才,张俊林这本书全面展示了大数据相关的技术,理论算法和实践,有广度有深度,对于希望掌握大数据技术的开发者是必备利器。

第6 章 分布式通信..............................106

第11 章 大规模批处理系统...................................199

16开

第4 章 集群资源管理与调度.......................................71

15.1.2 数据并行VS.模型并行.....................................316

17.1.2 Hadoop 平台下增量计算的一般模式.............................368

8.2.3 NameNode 联盟........................143

2.2.5 会话一致性....................................29

张俊林是技术书籍《这就是搜索引擎:核心技术详解》(该书荣获全国第十二届输出版优秀图书奖)的作者,目前担任畅捷通智能平台总监。在此之前,张俊林曾经在阿里巴巴搜索技术中心、百度商务搜索部凤巢广告平台以及新浪微博搜索部及数据系统部担任资深技术专家,新浪微博技术委员会成员,负责算法策略方向。他还曾是智能信息聚合网站“玩聚网”的联合创始人之一。他的研发兴趣集中在:搜索技术、引荐系统、社交挖掘、自然语言处理与大数据算法架构等方面,并在以上领域有多年工业界实践经验。

13.1 Hive 系数据仓库.................................242

目前看仿佛有此迹象,当一个概念火爆到从街头随便抓一个路人,他都能跟你滔滔不绝地侃侃而谈;当一个新名词铺天盖地而来,让你熟悉到再见一次就要吐的程度,这些确实是典型的泡沫将破的征兆。目前业已出现越来越多的质疑声音,在这种狂热的氛围下,理性的质疑是最难能可贵的,毕竟大数据归根结底是少数派的游戏,而现状好像是人人都处于大数据进行时的状态,这让其看上去显得不甚理性。

14.5.1 Pregel..........................292

14.4 离线挖掘计算模型...................................284

16.1 计算广告:逻辑回归.......................................338

13.3.2 PowerDrill ..........................258

1.1 抽象模型.......................................................10

2.1 基本原则与设计理念............................21

《大数据日知录:架构与算法》的读者对象包括对NoSQL 系统及大数据处理感兴趣的所有技术人员,以及有志于投身到大数据处理方向从事架构师、算法工程师、数据科学家等相关职业的在校本科生及研究生。

2.2 一致性模型分类.................................................26

  刘子正

10.3.3 数据读/写与备份.................................193

16.1.3 批学习并行逻辑回归..................................341

14.2.3 二部图最大匹配.............................279

12.3.2 MillWheel 的“恰好送达一次”机制...........................233

参考文献......................................19

10.4.2 数据模型.........................................196

14.3.1 切边法(Edge-Cut)......................................280

大数据丛书

14.5.4 PowerGraph.......................307

8.3.2 目录服务..................................147

11.2.1 求和模式(Summarization Pattern)................207

附录A 硬件体系结构及常用性能指标......................................378

16.3.2 LambdaMART.................................349

3.1.3 改进:计数Bloom Filter....................................53

15.2 分布式机器学习范型.....................317

13.3.1 Dremel...........................255

8.2.2 HA 方案..............................140

4.4.2 公平调度器(Fair Scheduler)......................81

参考文献..............................................................377

16.2.1 矩阵分解方法.......................................344

12.3.1 Storm 的送达保证机制.................................230

2.1.5 CAP/ACID/BASE 三者的关系...........................25

盛大文学首席数据官

参考文献.........................................364

10.2 PNUTS 存储系统........................................186

15.2.3 BSP 计算模型...................................321

11.2 MapReduce 计算模式...........................206

15.1.1 机器学习概况.............................................314

15.3.2 Spark 及MLBase ..........................................327

第10 章 列式数据库...........................................176

3.6.2 应用:SILT 存储系统.........................................68

0.3 大数据商业炼金术................................ 6

参考文献...........................................218

15.3.3 参数服务器(Parameter Server).............332

4.3 资源管理与调度系统范型.............................77

前言

16.4 自然语言处理:文档相似性计算.......................................352

2.2.3 因果一致性.............................28

这是一本心血之作,历时3年,质量上乘。

17.1.1 两种计算模式...............................367

参考文献..............................................197

第9 章 内存KV 数据库...................................168

10.4.3 TrueTime ...........................................196

12.4 状态持久化...........................................234

5.2.2 数据模型(Data Model) .............................97

13.3.3 Impala.................................261

11.1.1 计算模型.......................................201

4.2.5 饿死(Starvation)与死锁(Dead Lock)问题...........................76

张俊林本科毕业于天津大学管理学院,1999年至2004年在中科院软件所直接攻读博士学位,研究方向是信息检索理论与自然语言处理,就学期间曾在ACL/COLING/IJCNLP等国际顶级会议发表多篇学术论文,另外,他在此期间领导设计的搜索系统曾在美国国防部DARPA主持的TREC第二届高精度检索系统评测中在17支国际高水平研究团队激烈竞争中胜出,并取得综合排名第一名的优异成绩。

10.1.1 BigTable 的数据模型..........................177

10.2.3 子表控制器与数据路由器..................................187

14.3.2 切点法(Vertex-Cut)...............................282

8.1.5 Colossus ........................137

14.5.2 Giraph...............................299

第15 章 机器学习:范型与架构.........................................313

13.1.2 StingerInitiative ................................250

第3 章 大数据常用的算法与数据结构....................................51

张俊林

11.2.3 组织数据模式(Data Organization Pattern) .....................210

4.2.3 抢占式调度与非抢占式调度...................................75

  蒋涛

404页

11.3.2 Dryad .......................................215

本书的内容

参考文献............................................238

12.4.2 Storm 的状态持久化.......................................236

13.2.3 数据共同分片.........................................254

4.1.1 概念模型....................................72

2014 年3 月于北京优德w888 2

9.2 Redis....................................172

13.4 混合系数据仓库......................................265

11.3 DAG 计算模型..........................................214

新浪微博平台及大数据总经理

12.4.1 容错的三种模式....................................234

12.1 流式计算系统架构....................................222

8.3.1 HayStack 整体架构.................................146

大数据日知录:架构与算法(大数据领域专家力作,专注大数据架构和算法,全面梳理大数据相关技术)

2.1.3 ACID 原则...............................................24

13.1.1 Hive .....................................242

6.1.1 Protocol Buffer 与Thrift .....................108

13.2.1 Shark 架构.........................................252

3.5.1 LZSS 算法.............................................65

8.1.1 GFS 设计原则...........................................132

8.1.4 系统交互行为.................................136

1.3 范围分片(Range Partition) ......................................18

16.2.3 并行版ALS-WR 算法..............................347

12.4.3 MillWheel 和Samza 的状态持久化......................237

2.3.2 主从式更新.....................................31

2.2.6 单调读一致性..............................................30

16.6 深度学习:DistBelief .............................................358

5.1.2 数据模型..................................94

你无数人生的第一次带给我太多欢乐,而我陪你的时间又太少太少。每次听到你用小手咚咚敲着书房紧闭的门,这经常让我感到惶惑,不知道这么狠心对你是对还是错,但是又不得不狠下心来。我相信将来一定会悔恨没有给你更多的时间,把你介绍给这色彩斑斓而残酷的世界,嘱咐它在今后的日子里能善待你一些。我多想陪你直到你白发苍苍的岁月:在初秋的午后阳光下,看到你坐在院中的婆娑树影里,给你的儿孙讲故事,浅笑依然,仿似今天。我可以清楚地想象那时的场景,清晰得就像一切就发生在眼前。虽然我深切地知道这是永不可实现的奢望,但这个梦想会永远放在我心里,就像你清澈的目光和纯真的笑容一样。

2.3.1 同时更新..........................................30

16.5.3 并行版谱聚类..........................................358

11.3.3 FlumeJava 和Tez ........................................217

12.2 DAG 拓扑结构..........................................224

2.3 副本更新策略...........................30

所以,归根结底,大数据概念是个短期内炒得过热,但是从长期来看炒得不足的领域。再过十年如果回望现在,也许会发现:咱们今天正在巍峨群山的山脚徘徊,试图找出一条通往山顶的羊肠小道,如此而已。我们当然不能盲目跟风不断追逐切换热点,但是忽视趋势的力量同样也不是一个理性的选择。

8.5 纠删码(Erasure Code).............................158

中国科学院信息工程研究所研究员、博士生导师

10.4.1 SpanServer 软件栈.........................................195

内容提要

5.2 ZooKeeper ................................96

3.1 布隆过滤器(Bloom Filter) ............................51

17.2.1 事务支撑..........................................371

第2 章 数据复制与一致性................................................20

16.3 搜索引擎:机器学习排序................................347

9.3 MemBase ...............................173

5.2.4 ZooKeeper 的典型应用场景..................................98

17.3.2 增量计算机制....................................375

                                                                       张栋

4.3.2 两级调度器(Two-Level Scheduler) .........................79

6.2.1 常见的消息队列系统......................................110

12.2.3 拓扑结构..................................226

8.5.3 HDFS-RAID 架构.........................166

11.2.4 Join 模式(Join Pattern)......................212

14.4.1 以节点为中心的编程模型..........................284

第13 章 交互式数据分析...................................240

10.2.2 存储单元...............................187

4.3.3 状态共享调度器(Shared-State Scheduler) ....................79

7.1.1 Chukwa........................121

致谢

6.2 消息队列.....................................110

断断续续完成本书花了大约3 年左右的时间,和最初预估的时间还是比较吻合的,这一方面是由于我可投入的时间本身就不多,但是还是希望能够写出一本高质量的技术书籍,所以不得不慢工出细活;另外一方面是由于大数据处理作为一个新领域,其涉及的方方面面的技术点实在太多,而且正处于快速的发展过程中。这个领域是我接触过的领域中学问涵盖面最广的,从底层的硬件开始,到涉及基础理论、大规模数据存储系统、分布式架构设计、各种不同适用场景下的差异化系统设计思路、机器学习与数据挖掘并行算法、层出不穷的新架构和新系统等,说无所不包有些夸张但是所需掌握学问点之多确实是很少见的。而且因为其处于快速发展的过程当中,所以各种技术纷繁芜杂,并无一个成熟的学问分类体系可供参考,需要不断梳理相关学问点之间的相互区别和联系并进行分门别类,如何将纷杂多样的技术梳理成清晰合理的章节内容曾让我头疼不已,当然发展到目前,整个大数据技术体系脉络已经日渐明晰,我相信参考本书目录可以清晰地发现这一点。另外一个阻碍是可参考的资料和系统多而杂,且质量良莠不齐,需要从中汰劣余优,尽可能选出有代表性及有发展潜力的理论、方案和系统,这也是很耗费精力的过程,尽管本书每章后只列出了很少一部分参考资料,但是实际参考的文献与系统要数倍于此,只列出精华部分是为了缩短读者选择高质量文献的过程。

10.2.4 雅虎消息代理.............................188

10.3 MegaStore..................................................190

2.1.6 幂等性(Idempotent)........................................26

4.5 Mesos .................................84

11.3.1 DAG 计算系统的三层结构............................214

12.1.2 P2P 架构.....................................................223

第12 章 流式计算........................................219

1.2.2 虚拟桶(Virtual Buckets) ..........................12

参考文献...................................................70

8.1.3 GFS 主控服务器..................................134

13.3 Dremel 系数据仓库...................................254

参考文献..........................118

14.2.2 单源最短路径(Single Source Shortest Path) ..................278

14.5.3 GraphChi ............................301

5.1 Chubby 锁服务...............................92

参考文献.................................269

7.2.2 Wormhole .......................127

4.1.2 通用架构...............................................73

9.1 RAMCloud ..............................169

11.1.3 MapReduce 计算的特点及不足......................................206

3.2 SkipList............................................55

作者推荐

14.4.4 异步执行模型...................................290

15.2.4 SSP 模型............................323

10.4 Spanner .........................................194

但是,从社会发展趋势的角度,很明显大数据会是目前肉眼可及的视野范围里能看到的最大趋势之一。从传统IT 业到互联网、互联网到移动互联网,从以智能手机和Pad 为主要终端载体的移动互联网到可穿戴设备的移动互联网,然后再到万物互联的物联网,这一定是不可违抗的发展规律和前进方向。伴随着这个趋势必然有越来越多、形态越来越丰富的超量数据不断产生,而大数据明显是由此衍生出来的明确且必然的发展趋势。

8.5.1 Reed-Solomon 编码...............................159

17.2 Percolator................................370

我和俊林接触不多但神交已久,几年前我看过他一本搜索方面的技术书籍,觉得写得相当不错,从此俊林的书都是必然要收藏的。看了这本书,感觉和上一本一样出色。和其他介绍大数据技术的书相比,这本书的涉及面相当广,覆盖了当前大数据技术(分布式计算、大规 模文件系统、NoSQL数据库、常用数据结构和算法、批处理和流式计算、图数据库、分布式机器学习等)的方方面面。实在且实用,咱想是这本书最大的特点,诚挚引荐对大数据技术感兴趣的读者阅读。

对了,还有我的女儿,亲爱的雪晴,从蹒跚迈出人生第一步,到咿咿呀呀说出第一句话,我总是想起,小小的你,迷茫地站在这遍布新奇的世界里,东张西望时无助的样子,这总是令人心疼。

2.4.2 向量时钟(Vector Clock) ..............................38

附录B 大数据必读文献....................................380

1.2.3 一致性哈希(Consistent Hashing) ...........................13

13.2 Shark 系数据仓库..................................251

3.1.2 误判率及相关计算..........................................52

2.1.4 BASE 原则.................................................24

15.3.1 MapReduce 系列..................................325

6.1.2 Avro...............................109

10.3.1 实体群组切分......................191

12.3 送达保证(Delivery Guarantees)..............................229

6.1 序列化与远程过程调用框架..................................107

5.1.1 系统架构........................................93

11.1 MapReduce 计算模型与架构................................200

14.1 在线查询类图数据库...........................272

10.1.5 子表服务器(Tablet Server) ....................182

14.1.1 三层结构.........................272

3.4.1 Merkle 树基本原理..................................................62

7.2 数据总线......................................123

10.2.5 数据一致性.........................................189

8.1 谷歌 文件系统(GFS) .................................132

15.1 分布式机器学习...........................................314

第0 章 当谈论大数据时我们在谈什么................ 1

3.4 Merkle 哈希树(Merkle Hash Tree) .............................62

4.2 调度系统设计的基本问题.....................................74

第7 章 数据通道.........................................120

参考文献...................................104

那么,大数据是否会像很多曾经火热现在已难觅踪迹的流行概念一样,将来某日,人们静心抬眼,发现风已去而水波不兴,徒留夕阳下波光粼粼的涟漪,让人不禁哀叹其亡也忽焉?

目录

17.2.2 “观察/通知”体系结构...........................373

8.4 文件存储布局.........................................150

4.4 资源调度策略...............................................81

《大数据》《信息检索导论》译者

书中还列有作者优选的高质量文献,能为读者节省选择的时间,绝对值得一读。

14.1.2 TAO 图数据库.................................273

张俊林 著  

10.1 BigTable....................................177

12.2.1 计算节点.....................................................225

本书的背景

8.2 HDFS ..........................138

从架构与算法的角度,比较全面地分门别类梳理了大数据相关技术。

6.3.2 Gossip 协议...........................115

本书区别于市场上已有的众多大数据概念类书籍,重点讲述了解决大数据问题的算法与架构,全书逻辑清晰,重点突出,讲述复杂算法时图文并茂,可以看出作者将实际工作经验结合理论,在本书上花了很多心血,相信能帮助从事大数据工作的所有工程技术人员。

3.5.2 Snappy..........................................67

8.4.2 列式存储...........................................151

此书内容跨度很大,可称为大数据领域“从入门到精通”的教科书,非常全面且系统化。人人都在谈论大数据,但事实上并没有人告诉大家大数据到底是什么、涵盖哪些方面,而此书可以给出答案。 

15.2.2 MapReduce 迭代计算模型........................319

2014年9月出版

10.2.1 PNUTS 的整体架构..............................186

2.1.2 CAP 重装上阵(CAP Reloaded).............................23

3.1.1 基本原理.............................................52

16.5 社交挖掘:谱聚类.................................355

5.2.1 体系结构...........................................96

5.2.5 ZooKeeper 的实际应用.......................................103

2.4.3 RWN 协议.................................................40

原百度科学家,凤巢系统架构师;原谷歌研究员,机器学习专家

1.2.1 Round Robin....................................11

0.4 “大数据”在路上................................................... 7

1.2 哈希分片(Hash Partition) ..............................11

参考文献.......................................311

8.2.1 HDFS 整体架构.................................139

10.1.2 BigTable 的整体结构................................178

5.1.4 客户端缓存.......................................95

17.4 DryadInc ....................................376

参考文献................................................335

0.2 大数据之翼:技术范型转换......................................... 4

4.4.4 延迟调度策略(Delay Scheduling)............................82

4.1 资源管理抽象模型...................................72

第17 章 增量计算..........................................366

8.3 HayStack 存储系统....................................145

2.4.4 Paxos 协议.............................................42

12.1.1 主从架构............................................222

16.2 引荐系统:矩阵分解................................................344

本书的写作

6.3.1 概述...............................114

14.4.3 同步执行模型.....................................286

8.1.2 GFS 整体架构..............................133

10.1.4 主控服务器(Master Server)......................181

第8 章 分布式文件系统....................................131

3.4.3 比特币中的应用..................................................63

2.2.1 强一致性............................................27

2.4 一致性协议...........................................................32

14.2.1 PageRank 计算.......................................278

这是一本大数据技术的百科全书——从大数据的存储结构、内容管理,讲到集群任务调度、分布式数据通信、流行的各类新式数据库的介绍,还有基于机器学习技术的大数据实现以及大数据挖掘应用范例等内容,既包罗万象,又深入浅出。俊林的这本心血之作,是大数据研发人员绝好的技术向导。

7.3 数据导入/导出...........................................128

参考文献.....................................166

3.6.1 基本原理...............................................68

参考文献................................................49

13.2.2 部分DAG 执行引擎(PDE) ........................253

15.2.1 三种范型...................................318

3.5 Snappy 与LZSS 算法..........................................65

14.5 离线挖掘图数据库.................................292

16.5.1 社交挖掘实例...............................355

8.5.2 LRC 编码.....................................164

15.3 分布式机器学习架构...................................324

10.1.3 BigTable 的管理数据.............................179

16.1.1 逻辑回归(Logistic Regression,LR).............................338

第16 章 机器学习:分布式算法...............................337

13.3.4 Presto...............................264

参考文献.............................129

像移动互联网、O2O、可穿戴设备等概念一样,“大数据”从甫一提出到飓风般席卷并风靡全球,从最初的技术名词到形成渗透各行各业的社会现象,所耗时间仅几年而已,其兴也勃焉。

16.6.2 DistBelief.....................360

4.4.5 主资源公平调度策略(Dominant Resource Fair Scheduling).............82

十几年前当我还在中国科学院读书的时候,就对互联网的蓬勃发展及其对生活和工作各方面的影响感慨不已。当时最直观的感受是最新的国际会议论文很容易获得,往往是会议一开完就能从网上下载到感兴趣的文献,有时候会议没开有些编辑就把论文先放在网上供人参考。觉得有了互联网这么强大的全球范围信息便捷分享工具,尽管当时国内科研水平不算高,在最好的国际顶级会议发表论文还是较难的事情,但是随着互联网的普及,科研水准应该能够获得极为快速长足的发展,因为从追踪最新技术进展的角度看大家的起跑线是一样的,而中国人多的优势慢慢应该能够发挥出来。

3.6 Cuckoo 哈希(Cuckoo Hashing) ..................................67

第14 章 图数据库:架构与算法................................271

  王斌

7.1.2 Scribe......................122

参考文献................................................175

8.4.3 混合式存储........................................156

ISBN 978-7-121-24153-6

第5 章 分布式协调系统...................................91

16.3.1 机器学习排序概况.................................348

4.2.6 资源隔离方法........................................77

0.1 大数据是什么.......................... 2

16.2.2 ALS-WR 算法............................................346

媒体评论

CSDN总裁、《程序员》杂志创始人

上一篇:凌烟阁故事之李孝恭——王爷的喜与悲(中) 下一篇:优德w888为什么《道德经》版本会出现异同?