专栏名称: 大数据实验室
宽客俱乐部旗下美国大数据实验室,大数据研究应用。
目录
相关文章推荐
大数据文摘  ·  超强AI代理上线!OpenAI推出“Deep ... ·  2 天前  
玉树芝兰  ·  对科研工作者来说,OpenAI Deep ... ·  2 天前  
天池大数据科研平台  ·  3步,0代码!一键部署DeepSeek-V3 ... ·  2 天前  
数据派THU  ·  使用Python实现基于矩阵分解的长期事件( ... ·  4 天前  
51好读  ›  专栏  ›  大数据实验室

无穷大的数字

大数据实验室  · 公众号  · 大数据  · 2018-05-09 07:30

正文


一、你能数到多少?


有这么一个故事,说的是两个匈牙利贵族决定做一次数数游戏——谁说出的数字大谁赢。 


“好,”一个贵族说,“你先说吧!” 


另一个绞尽脑汁想了好几分钟, 后说出了他所想到的 大数字:“3”。


现在轮到第一个动脑筋了。苦思冥想了一刻钟以后,他表示弃权说:“你赢啦!” 


这两个贵族的智力当然是不很发达的。再说,这很可能只是一个挖苦人的故事而已。然而,如果上述对话是发生在原始部族中,这个故事大概就完全可信了。有不少非洲探险家证实,在某些原始部族里,不存在比3 大的数词。如果问他们当中的一个人有几个儿子,或杀死过多少敌人,那么,要是这个数字大于3,他就会回答说“许多个。”因此,就计数这项技术来说,这些部族的勇士们可要败在我们幼儿园里的娃娃们的手下了,因为这些娃娃们竟有一直数到十的本领呢!


现在,我们都习惯地认为,我们想把某个数字写成多大,就能写得多大——战争经费以分为单位来表示啦,天体间的距离用英寸来表示啦,等等——只要在某个数字的后面接上一串零就是了。你可以一直这样写下去,直到手腕发酸为止。这样,尽管目前已知的宇宙①中所有原子的数目已经很大,等于300 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 

000 000 000,但是,你还可以写出比这更大的数目来。


上面这个数可以改写得短一些,即写成

在这里,10 的右上角的小号数字74 表示应该写出多少个零。换句话说,这个数字意味着3 要用10 乘上74 次。


但是在古代,人们并不知道这种简单的“算术简示法”。这种方法是距今不到两千年的某个佚名的印度数学家发明的。在这个伟大发明——这确实是一项伟大的发明,尽管我们一般意识不到这一点——出现之前,人们对每个数位上的数字,是用专门的符号反复书写一定次数的办法来表示的。例如,数字8732 在古埃及人写来是这样的:

而在凯撒(Julius Caeser)②的衙门里,他的办事员会把这个数字写成

MMMMMMMMDCCXXXII

这后一种表示法你一定比较熟悉,因为这种罗马数字直到现在还有些用场——表示书籍的卷数或章数啦,各种表格的栏次啦,等等。不过,古代的计数很难得超过几千,因此,也就没有发明比一千更高的数位表示符号。一个古罗马人,无论他在数学上是何等训练有素,如果让他写一下“一百万”,他也一定会不知所措。他所能用的 好的办法,只不过是接连不断地写上一千个M,这可要花费几个钟点的艰苦劳动啊(图1)。


在古代人的心目中,那些很大的数目字,如天上星星的颗数、海里游鱼的条数、岸边沙子的粒数等等,都是“不计其数”,就像“5”这个数字对原始部族来说也是“不计其数”,只能说成 

图1 凯撒时代的一个古罗马人试图用罗马数字来写“一百万”,墙上挂的那块板恐怕连“十万”也写不下


“许多”一样。

阿基米德(Archimedes),公元前3 世纪大名鼎鼎的大科学家,曾经开动他那出色的大脑,想出了书写巨大数字的方法。在他的论文《计沙法》中这样写着:


有人认为,无论是在叙拉古③,还是在整个西西里岛,或者在世界所有有人烟和无人迹之处,沙子的数目是无穷大的。也有人认为,这个数目不是无穷大的,然而想要表达出比地球上沙粒数目还要大的数字是做不到的。很明显,持有这种观点的人会更加肯定地说,如果把地球想像成一个大沙堆,并在所有的海洋和洞穴里装满沙子,一直装到与最高的山峰相平,那么,这样堆起来的沙子的总数是无法表示出来的。但是,我要告诉大家,用我的方法,不但能表示出占地球那么大地方的沙子的数目,甚至还能表示出占据整个宇宙空间的沙子的总数。


阿基米德在这篇著名的论文中所提出的方法,同现代科学中


表达大数目字的方法相类似。他从当时古希腊算术中最大的数“万”开始,然后引进一个新数“万万”(亿)作为第二阶单位,然后是“亿亿”(第三阶单位)、“亿亿亿”(第四阶单位),等等。


写个大数字,看来似乎不足挂齿,没有必要专门用几页的篇幅来谈论。但在阿基米德那个时代,能够找到写出大数字的办法,确实是一项伟大的发现,使数学向前迈出了一大步。


为了计算填满整个宇宙空间所需的沙子总数,阿基米德首先得知道宇宙的大小。按照当时的天文学观点,宇宙是一个嵌有星星的水晶球。阿基米德的同时代人,著名的天文学家,萨摩斯④的阿里斯塔克斯(Aristarchus)⑤求得从地球到天球面的距离为10 000 000 000 斯塔迪姆⑥,即约为1 000 000 000 英里。


阿基米德把天球和沙粒的大小相比,进行了一系列足以把小学生吓出梦魇症来的运算, 后他得出结论说:


很明显,在阿里斯塔克斯所确定的天球内所能装填的沙子粒数,不会超过一千万个第八阶单位⑦。


这里要注意,阿基米德心目中的宇宙的半径要比现代科学家们所观察到的小得多。十亿英里,这只不过刚刚超过从太阳到土星的距离。以后我们将看到,在望远镜里,宇宙的边缘是在5 000 000 000 000 000 000 000 英里的地方,要填满这样一个已被观测到的宇宙,所需要的沙子数超过粒(即1 的后面有100 个零)。


这个数字显然比前面提到的宇宙间的原子总数3×1074 大多了,这是因为宇宙间并非塞满了原子。实际上,在一立方米的空间内,平均才只有一个原子。


要想得到大数目字,并不一定要把整个宇宙倒满沙子,或进行诸如此类的剧烈活动。事实上,在很多乍一看来似乎很简单的问题中,也常会遇到极大的数字,尽管你原先决不会想到,其中会出现大于几千的数字。


有一个人曾经在大数目字上吃了亏,那就是印度的舍罕王(Shirham)。根据古老的传说,舍罕王打算重赏象棋⑧的发明人和进贡者,宰相西萨·班·达依尔(Sissa Ben Dahir)。这位聪明大臣的胃口看来并不大,他跪在国王面前说:“陛下,请您在这张棋盘的第一个小格内,赏给我一粒麦子;在第二个小格内给两粒,第三格内给四粒,照这样下去,每一小格内都比前一小格加一倍。陛下啊,把这样摆满棋盘上所有64 格的麦粒,都赏给您的仆人罢!” 


“爱卿。你所求的并不多啊。”国王说道,心里为自己对这样一件奇妙的发明所许下的慷慨赏诺不致破费太多而暗喜。“你当然会如愿以偿的。”说着,他令人把一袋麦子拿到宝座前。


计数麦粒的工作开始了。第一格内放一粒,第二格内放两粒,第三格内放四粒,……还没到第二十格,袋子已经空了。一袋又一袋的麦子被扛到国王面前来。但是,麦粒数一格接一格地增长得那样迅速,很快就可以看出,即便拿来全印度的粮食,国王也兑现不了他对西萨·班·达依尔许下的诺言了,因为这需要有18 446 744 073 709 551 615 颗麦粒⑨呀! 


这个数字不像宇宙间的原子总数那样大,不过也已经够可观了。1 蒲式耳⑩小麦约有5 000 000 颗,照这个数,那就得给西萨· 班·达依尔拿来4 万亿蒲式耳才行。这位宰相所要求的,竟是全世界在2000 年内所生产的全部小麦!


这么一来,舍罕王发觉自己欠了宰相好大一笔债。什么办?要么是忍受西萨·班·达依尔没完没了的讨债,要么是干脆砍掉他的脑袋。据我猜想,国王大概选择了后面这个办法。


另一个由大数目字当主角的故事也出自印度,它是和“世界末日”的问题有关的。偏爱数学的历史学家鲍尔(Ball)是这样讲述这段故事的⑴:


在世界中心贝拿勒斯⑵的圣庙里。安放着一个黄铜板,板上插着三根宝石针。每根针高约1 腕尺(1 腕尺大约合20 英寸)。像韭菜叶那样粗细。梵天⑶在创造世界的时候,在其中的一根针上从下到上放下了由大到小的64 片金片。这就是所谓梵塔。不论白天黑夜,都有一个值班的僧侣按照梵天不渝的法则,把这些金片在三根针上移来移去:一次只能移一片,并且要求不管在哪一根针上,小片永远在大片的上面。当所有64 片都从梵天创造世界时所放的那根针上移到另外一根针上时,世界就将在一声霹雳中消灭,梵塔、庙宇和众生都将同归于尽。 


图3 是按故事的情节所作的画,只是金片少画了一些。你不妨用纸板代表金片,拿长钉代替宝石针,自已搞这么一个玩具。不难

图3 一个僧侣在大佛像前解决“世界未日”的问题。为了省事起见,这里没有画出64 片金片来


发现,按上述规则移动金片的规律是:不管把哪一片移到另一根针上,移动的次数总要比移动上面一片增加一倍。第一片只需一次,下一片就按几何级数加倍。这样,当把第64 片也移走后,总的移动次数便和西萨·班·达依尔所要求的麦粒数一样多了⑷! 

把这座梵塔全部64 片金片都移到另一根针上,需要多长时间呢?一年有31 558 000 秒。假如僧侣们每一秒钟移动一次,日夜不停,节假日照常干,也需要将近5800 亿年才能完成。


把这个纯属传说的寓言和按现代科学得出的推测对比一下倒是很有意思的。按照现代的宇宙进化论,恒星、太阳、行星(包括地球)是在大约30 亿年前由不定形物质形成的。我们还知道,给恒星,特别是给太阳提供能量的“原子燃料”还能维持100 亿~150 亿年(见“创世的年代”一章)。因此,我们太阳系的整个寿命无疑要短于200 亿年,而不像这个印度传说中所宣扬的那样长!不过,传说毕竟只是传说啊! 


在文学作品中所提及的 大数字,大概就是那个有名的“印刷行数问题”了。 


假设有一台印刷机器可以连续印出一行行文字,并且每一行都能自动换一个字母或其他印刷符号,从而变成与其他行不同的字母组合。这样一架机器包括一组圆盘,盘与盘之间像汽车里程表那祥装配,盘缘刻有全部字母和符号。这样,每一片轮盘转动一周,就会带动下一个轮盘转动一个符号。纸张通过滚筒自动送入盘下。这样的机器制造起来没有太大的困难,图4 是这种机器的示意图。 


现在,让我们开动这架印刷机,并检查印出的那些没完没了的东西吧。在印出的一行行字母组合当中,大多数根本没有什么意思,如:

aaaaaaaaaaaa…

或者

boobooboobooboo…

或者

zawkpopkossscilm…

但是,既然这台机器能印出所有可能的字母及符号的组合,我们就能从这堆玩艺儿中找出有点意思的句子。当然,其中又有许多是胡说八道,如:

图4 一台刚刚印出一行莎士比亚诗句的自动印刷机


horse has six legs and…(马有六条腿,并且……)

或者

I like apples cooked in terpentin…

(我喜欢吃松节油煎苹果……)。

不过, 只要找下去, 一定会发现莎士比亚(William Shake- spare)⑸的每一行著作,甚至包括被他扔进废纸篓里去的句子!实际上,这台机器会印出人类自从能够写字以来所写出的一切句子:每一句散文,每一行诗歌,每一篇社论,每一则广告,每一卷厚厚的学术论文,每一封书信,每一份订奶单……


不仅如此,这架机器还将印出今后各个世纪所要印出的东西。从滚筒下的纸卷中,我们可以读到30 世纪的诗章,未来的科学发现,2344 年星际交通事故的统计,还有一篇篇尚未被作家们创作出来的长、短篇小说。出版商们只要搞出这么一台机器,把它安装在地下室里,然后从印出的纸卷里寻找好句子来出版就是了—— 他们现在所干的不也差不多就是这样嘛!为什么人们没有这样干呢?


来,让我们算算看,为了得到所有字母和印刷符号的组合,该印出多少行来。 


英语中有26 个字母、十个数码(0,1,2,…,9)、还有14 个常用符号(空白、句号、逗号、冒号、分号、问号、惊叹号、破折号、连字符、引号、省略号、小括号、中括号、大括号),共50 个字符。再假设这台机器有65 个轮盘,以对应每一印刷行的平均字数。印出的每一行中,排头的那个字符可以是50 个字符当中的任何一个,因此有50 种可能性。对这50 种可能性当中的每一种,第二个字符又有50 种可能性,因此共有50×50=2 500 种。对于这前两个字符的每一种可能性,第三个字符仍有50 种选择。这样下去,整行进行安排的可能性的总数等于

(65 个)

50×50×50×…×50

或者,即等于

要想知道这个数字有多么巨大,你可以设想宇宙间的每个原子都变成一台独立的印刷机,这样就有3×1074 部机器同时工作。再假定所有这些机器从地球诞生以来就一直在工作,即它们已经工作了30 亿年或1017 秒。你还可以假定这些机器都以原子振动的频率进行工作,也就是说,一秒钟可以印出1015 行。那么,到目前为止,这些机器印出的总行数大约是

这只不过是上述可能性总数的三千分之一左右而已。


看来,想要在这些自动印出的东西里面挑选点什么,那确实得花费非常非常长的时间了! 

从普通研究员到资深研究员进修课程 

(黑色系产业研究)


本课程在原有网络课程基础之上,融入了林老师亲自设计、亲自讲解、手把手教给学员的系列课程。

系统学完本课程之后,一个普通研究员将跃升为资深黑色系产业研究员

报名电话/微信:18516600808


①这是指目前用最大的望远镜所能探测到的那部分宇宙。

②凯撒(公元前100~前44 年)是古罗马帝国的统治者。——译者

③叙拉古是古代的城市国家,位于意大利西西里岛东南部。——译者

④萨摩斯是希腊的一个岛。——译者

⑤阿里斯塔克斯是公元前3 世纪的希腊天文学家。——译者

⑥斯塔迪姆是古希腊的长度单位,1 斯塔迪姆为606 英尺6 英寸,或188 米。

⑦用我们现在的数学表示法,这个数字是:


一千万       第二阶         第三阶         第四阶

(10 000 000)×(100 000 000)×(100 000 000)×(100 000 000)× 

第五阶       第六阶         第七阶         第八阶

(100 000 000)×(100 000 000)×(100 000 000)×(100 000 000) 也可以简写成(即在1 的后面有63 个零)。


⑧这里的象棋指的是国际象棋。整个棋盘是由64 个小方格组成的正方形。双方的棋子(每方16 个,包括王一枚,王后一枚、相两枚、马两枚,车两枚、兵八枚)在格内移动,以消灭对方的王为胜。棋盘的形状可参见插图2。——译者


⑨这位聪明的宰相所要求的麦子粒数可写为

在数学上,这类每一个数都是前一个数的固定倍数的数列叫做几何级数(在我们这个例子里,这个倍数为2)。可以证明,这种级数所有各项之和,等于固定倍数(在本例中为2)的项数次方幂(在本例中为64)减去第一项(此例中为1)所得到的差除以固定倍数与1 之差。这就是:

直接写出结果来就是

18 446 744 073 709 551 615

⑩蒲式耳是欧美的容量单位(计算谷物专用)。1 蒲式耳约合35.2 升。——译者

⑴引自W.W.R.Ball, Mathmatical Recreations and Essays(《数学拾零》)。

⑵贝拿勒斯是佛教的圣地,位于印度北部。——译者

⑶梵天是印度教的主神。——译者

 

⑷如果只有7 片,则需要移动的次数为

当金片为64 片时,需要移动的次数则为

这就和西萨•班•达依尔所要求的麦粒数相同了。

⑸莎士比亚(1564~1616 年),文艺复兴时代的著名英国剧作家及诗人。——译者


二、怎样计数无穷大的数字


上一节我们谈了一些数字,其中有不少是毫不含糊的大数。但是这些巨大的数字,例如西萨·班·达依尔所要求的麦子粒数,虽然大得难以令人置信,但毕竟还是有限的,也就是说,只要有足够的时间,人们总能把它们从头到尾写出来。


然而,确实存在着一些无穷大的数,它们比我们所能写出的无论多长的数都还要大。例如,“所有整数的个数”和“一条线上所有几何点的个数”显然都是无穷大的。关于这类数字,除了说它们是无穷大之外,我们还能说什么呢?难道我们能够比较一下上面那两个无穷大的数,看看哪个“更大些”吗?


“所有整数的个数和一条线上所有几何点的个数,究竟哪个大些?”——这个问题有意义吗?乍一看,提这个问题可真是头脑发昏,但是著名数学家康托尔(Georg Cantor)首先思考了这个问题。因此,他确实可被称为“无穷大数算术”的奠基人。 


当我们要比较几个无穷大的数的大小时,就会面临这样一个问题:这些数既不能读出来,也无法写出来,该怎样比较呢?这下子,我们自己可有点像一个想要弄清自己的财物中,究竟是玻璃珠子多,还是铜币多的原始部族人了。你大概还记得,那些人只能数到3。难道他会因为数不清大数而放弃比较珠子和铜币数目的打算?根本不会如此。如果他足够聪明,他一定会通过把珠子和铜币逐个相比的办法来得出答案。他可以把一粒珠子和一枚铜币放在一起,另一粒珠子和另一枚铜币放在一起,并且一直这样做下去。如果珠子用光了,而还剩下些铜币,他就知道,铜币多于珠子;如果铜币先用光了,珠子却还有多余,他就明白,珠子多于铜币;如果两者同时用光,他就晓得,珠子和铜币数目相等。


康托尔所提出的比较两个无穷大数的方法正好与此相同:我们可以给两组无穷大数列中的各个数一一配对。如果 后这两组都一个不剩,这两组无穷大就是相等的;如果有一组还有些数没有配出去,这一组就比另一组大些,或者说强些。


这显然是合理的、并且实际上也是唯一可行的比较两个无穷大数的方法。但是,当你把这个方法付诸实施时,你还得准备再吃一惊。举例来说,所有偶数和所有奇数这两个无穷大数列,你当然会直觉地感到它们的数目相等。应用上述法则,也完全合理,因为这两组数间可建立如下的一一对应关系:

在这个表中,每一个偶数都与一个奇数相对应。看,这确实再简单、再自然不过了! 

但是,且慢。你再想一想:所有整数(奇偶数都在内)的数目和单单偶数的数目,哪个大呢?当然,你会说前者大一些,因为所有的整数不但包含了所有的偶数,还要加上所有的奇数啊。但这只不过是你的印象而已。只有应用上述比较两个无穷大数的法则,才能得出正确的结果。如果你应用了这个法则,你就会吃惊地发现,你的印象是错误的。事实上,下面就是所有整数和偶数的一一对应表:

按照上述比较无穷大数的规则,我们得承认,偶数的数目正好和所有整数的数目一样大。当然,这个结论看来是十分荒谬的,因为偶数只是所有整数的一部分。但是不要忘了,我们是在与无穷大数打交道,因而就必须做好遇到异常的性质的思想准备。


在无穷大的世界里,部分可能等于全部!关于这一点,著名德国数学家希尔伯特(David Hilbert)有一则故事说明的再好不过了。据说在他的一篇讨论无穷大的演讲中,他曾用下面的话来叙述无穷大的似非而是的性质:①


我们设想有一家旅店,内设有限个房间,而所有的房间都已客满。这时来了位新客,想订个房间。旅店主说:“对不起,所有的房间都住满了。”现在再设想另一家旅店,内设无限多个房间,所有房问也都客满了。这时也有一位新客来临,想订个房间。


“不成问题!”旅店主说。接着,他就把一号房间里的旅客移至二号房间,二号房间的旅客移到三号房间,三号房间的旅客移到四号房间,等等,这一来,新客就住进了已被腾空的一号房间。


我们再设想一座有无限个房间的旅店,各个房间也都住满了。这时,又来了无穷多位要求订房间的客人。


“好的,先生们请等一会儿。”旅店主说。


他把一号房间的旅客移到二号房间,二号房间的旅客移到四号房间,三号房间的旅客移到六号房间,如此,如此。


现在,所有的单号房间都腾出来了。新来的无穷多位客人可以住进去了。


由于希尔伯特讲这段故事时正值世界大战期间,所以,即使在华盛顿,这段话也不容易被人们所理解②。但这个例子却确实举到了点子上,它使我们明白了:无穷大数的性质与我们在普通算术中所遇到的一般数字大不一样。

按照比较两个无穷大数的康托尔法则,我们还能证明,所有的普通分数(如等)的数目和所有的整数相同。把所有的分数按照下述规则排列起来:先写下分子与分母之和为2 的分数,这样的分数只有一个,即;然后写下两者之和为3 的分数,即;再往下是两者之和为4的,即。这样做下去,我们可以得到一个无穷的分数数列,它包括了所有的分数(图5)。现在,在这个数列旁边写上整数数列,就得到了无穷分数与无穷整数的一一对应。可见,它们的数目又是相等的! 

图5 原始人和康托尔教授都在比较他们数不出来的数目的大小


你可能会说“是啊,这一切都很妙,不过,这是不是就意味着,所有的无穷大数都是相等的呢?如果是这样,那还有什么可比的呢?”


不。事情并不是这样。人们可以很容易地找出比所有整数或所有分数所构成的无穷大数还要大的无穷大数来。 


如果研究一下前面出现过的那个比较一条线段上的点数和整数的个数的多少的问题,我们就会发现,这两个数目是不一样大的。线段上的点数要比整数的个数多得多。为了证明这一点,我们先来建立一段线段(比如说1 寸长)和整数数列的一一对应关系。 


这条线段上的每一点都可用这一点到这条线的一端的距离来表示,而这个距离可以写成无穷小数的形式,如

        





请到「今天看啥」查看全文