从一到无穷

有一个问题一直困扰着我,接受过严格数学训练的人,会有什么不同?是什么样的认识让他们与众不同?现在,我大概有些了解了,是无穷,是牵涉三大数学危机的无限与可得。

第一次数学危机起于公元前,讨论的问题是,什么是数,根号2是一个数吗?如果数狭义地表示自然数1、2、3,及其比例1/3、2/3,那么根号2不是一个数。我们无法找到一个点,用自然数或者它们的比例,来表示根号2。利用自然数的奇偶性,很容易证明这一点。从先知的视角看,构成有理数的自然数和自然比,只是数的一部分。如果数指的是无理数或者实数,那么根号2就是一个数了。这一次危机让人们开始重新考虑,数的定义。

古人之所以把根号2这样的数叫做无理数,是因为它是不可计算的,无法和有理数一样,用基本的加减乘除演算下去。他们感到不可理解。直到19世纪下半叶,康托尔创立了集合论,发明了无穷可数序列这一技巧,一切才开始变得清晰起来。

最基本的无穷可数序列是自然数,其次是奇偶数。如下面表示, A: 1, 2, 3, 4, ... B: 2, 4, 6, 8, ... C: 1, 3, 5, 7, ... 所有无穷可数序列都可以这样排列下去,并且和基本的自然数一一对应上,就像数数一样。由此引发了第一个无穷“悖论”,序列B、C和序列A 具有相同的大小。可是,自然数是包括了奇偶数的。在有限情况下,10以内的自然数明显多于10以内的偶数。但是在无限情况下,通过排列比对,无穷大以内的自然数却是等同于无穷大以内的偶数。这个反直觉的结论有多种可能性,也许是结论错了,也许是大脑天生就不适应无穷的存在。之后,花了一代人的时间,人们才完全接受了它,把自然数的存在,作为无穷公理。

无穷可数序列的核心是自然数和一一对应。如果再加上收敛性,那么它就变成了无穷可数的收敛序列。这种极限收敛性,是在第二次数学危机中,为解决微积分的无穷小问题而产生的。它本质是数0。 A: 1, 2, 3, 4, ... O: 0, 0, 0, 0, ... D: ½, ¼, 1/8, 1/16, ... 序列A的末端是无穷大,序列O的末端是0,序列D的末端是无穷小。序列D是最简单的收敛序列,它收敛到0。如果在平面坐标图上画出来,序列D是无限逼近序列O的。由于这种内在联系,微积分有时也叫无穷小分析。

到现在,无理数的大门已经踏进了,因为无理数就是一条无穷可数的收敛序列。比如根号2, A: 1, 2, 3, 4, ... E: 3/2, 17/12, 577/408, 665857/470832, ... F: 9/4, 289/144, 332929/166464, 443365544449/221682772224, ... G: 2, 2, 2, 2, ... H: ¼, 1/144, 1/166464, 1/221682772224, ... 通过比对,序列F是收敛于2的,或者说序列F减去序列G,得到了一条类似于序列D的无穷小序列H,即 序列F – 2 = 0。又由于序列E的平方等于序列F,所以序列E收敛到的极限不是其他,就是根号2。

为什么序列E是收敛的?这由它的生成算法保证, y = 1/x + x/2, 其中y是x的后继。其本质上是求解方程 f(x) = x * x – 2 = 0. 让g(x)=2x表示f(x)的导数,再利用一阶泰勒展开 f(y) = f(x) + g(x)(y-x) = 0, 最后通过归约,得到上述算法。这种算法收敛速度很快,在数值分析中叫切线法,在最优化中叫牛顿法。因为生成算法的公式只包含加减乘除基本运算,所以只要第一个数是有理数,所有的后继数都是有理数。这就是数学归纳原理,可数性的本义。

上面的构造不是偶然,所有的无理数都可以表示成一条有理数序列。也因此,受过严格数学训练的人,眼中的数不再是一个点,而是一条线。这应该就是最大的不同。