康托
现代意义上的集合概念是德国数学家康托(G.Cantor,1845~1918)给出的,他在研究三角级数收敛问题时发现,如果对于一个给定区间[a,b]中的任何一点x,当n→∞时,这个级数中的一般项
ansin(nx)+bn cos(nx)
都趋向于0,则系数所构成的数列{an}和{bn}就必须都趋向于0。可是,如果还有其他的系数的数列,比如说{cn}和{dn}也满足这个性质,那么,这些系数的数列之间将具有什么关系呢?为了讨论问题的方便,分别用A,B,C和D表示这四个系数构成的数列,那么用现在的语言说,这就形成了四个“点集”。按照康托后来的定义,这四个集合代表的数列是等价的,我们将在这一讲的《无穷的度量与连续统》中详细地讨论这个问题。
第一个集合论公理系统是德国数学家策梅罗(E.Zermelo,1871~1953)于1908年给出的,他的著名论文《关于集合论基础的研究》是这样开始的:
“集合论是这样一个数学分支,它的任务就是从数学上以最为简单的方式来研究数、序和函数等基本概念,并借此建立整个算术和分析的逻辑基础,因此构成了数学科学的必不可少的组成部分,但是在当前这门学科的存在本身似乎受到某种矛盾或者悖论的威胁,而这些矛盾和悖论似乎是从它的根本原理导出来的,而且一直到现在,还没有找到适当的解决办法。面对着罗素关于‘所有不包含以自己为元素的集合的集合’的悖论,事实上,它今天似乎不能再容许任何逻辑上可以定义的概念‘集合’或‘类’为其外延。按照康托原来的关于集合的定义,把我们直观或者我们思考所确定的不同的对象作为一个总体,现在看来,这个定义肯定要求加上某种限制,虽然到现在为止还没有成功地用另外同样简单的定义代替它,而不引起任何疑虑。在这种情况下,我们没有别的办法,而只能尝试反其道而行之。也就是从历史上存在的集合论出发,来得出一些原理,而这些原理是作为这门数学科的基础所要求的。这个问题必须这样解决,使得这些原理足够的狭窄,足以排除掉所有的矛盾。同时,要足够的宽广,能够保留这个理论所有有价值东西。”
策梅罗
我们知道,集合论是现代数学的基础,可是,从上面的论述中可以发现,作为科学典范的数学的论证基础,从诞生的那个时刻开始就不平静,各种猜疑、非议,甚至悖论、批评相继出现。我想,对数学进行的研究,至少对数学教育,认真分析这些争论的核心问题是有必要的,因为这对把握现代数学的论证思路和推理模式是有益处的。策梅罗在上文中所说的罗素的悖论和康托原来的定义都是最为核心的问题,我们将详细地讨论这两个问题,通过对这两个问题的讨论来探讨如何给出集合的定义,从而分析集合论公理化系统的本质。
在日常生活和生产实践中,有许多名词经常使用,人们对这些名词似乎有了约定俗成的理解,借助这些理解人们就能够进行很好的交流,甚至可以作出很好的研究,但要给出这些名词确切的定义非常困难,“集合”这个名词就是如此。在前几讲中,我们曾经反复地使用了集合的概念,并且借助元素与集合之间、集合与集合之间的包含关系很好地分析了推理的过程,构建了一些推理的模式。可是,如何给出“集合”一个确切的定义呢?
在我们使用集合这个概念的时候,头脑中认定的集合大概是:所要研究问题对象的全体。但在许多场合这个概念是模糊的,比如我们曾经举例提到过的“北方人”、“辣的菜”、“费时的工作”等等。因此,在上述对于集合认定的基础上至少还要加上一个限定词:可分辨的。于是大概可以认定集合是:可分辨的、所要研究问题对象的全体。也就是说,对于每一个所要研究问题的对象x,我们能够明确地知道这个对象x是否属于这个集合。这又似乎变成了性质而不是定义了。
进一步用符号表示。所谓“可分辨的”应当指:讨论问题对象所具有的某种特性。我们用P表示这种特性,那么可以规定:如果x具有特性P则认为x属于集合。从上述策梅罗的文章的述说中可以看到,这个规定已经非常接近康托最初的定义了。但是这个定义引发了许多悖论。首先是罗素于1902年给出的一个悖论,因为图书的目录也可以装订成书,因此对于有些图书馆,“图书馆图书的目录”这个集合可以包括图书目录本身,于是罗素认为:
“集合可以分为两类,一类是构建集合的特性包含了集合本身,比如图书目录,称为R集,还有一类是构建集合的特性不包含集合,称为非R集。我们把所有非R集的集合总括为一个新的集合,用M表示,现在的问题是:M属于R集还是属于非R集?如果属于R集,不符合M的定义;如果属于非R集,那么按照R集的定义,M又应当属于R集。于是就出现了矛盾”
20世纪最伟大的数学家希尔伯特曾经说过,这个悖论对数学界具有灾难性的后果。德国逻辑学家弗雷格(G.Frege,1848 - 1925)正准备把他的著作《基本法则》的第二卷交付印刷时收到了罗素的来信,信中提及上述悖沦。弗雷格在那本准备交付印刷的著作中,把整个算术重新建立在集合沦的基础上,而他认为的集合就是康托所描述的那样的集合,当他收到罗素的有关悖论的信之后非常紧张,马上重新审阅了书稿,他在最终出版厂的这部著作的附言中,详细地述说了当时的心情:
“在一项研究接近尾声时,其基础突然坍塌,对于一个科学家,再也没有比这更令人沮丧的了。这本书在交付印刷时罗素先生的信就使我陷入了这样的境地。”
罗素
1918年,罗素把这个悖论表述得更加通俗,就是广为人知的“理发师悖论”:
“一个喜欢自夸的乡村理发师宣称,他不给村里自己刮脸的人刮脸,但给所有不自己刮脸的人刮脸。后来他遇到了尴尬,他是否应当给自己刮脸呢?如果他给自己刮脸,那么按照他宣称的前一半,就不应当给自己刮脸;如果他不给自己刮脸,那么按照他宣称的后一半,就应当给自己刮脸。理发师陷入了逻辑两难的困境。”
包括罗素本人在内的大部分逻辑学家认为,上面所说的两个悖论是一致的,是没有本质差异的。但我认为,这两个悖论是有本质差异的:第一个悖论是与集合论公理体系有关的;第二个悖论涉及的并不是集合论本身的问题,而涉及的是论证的哲学原理。我们来分析这个问题。
第一个悖论是由“图书目录的目录仍然是目录”所引发的,提出的是“集合是否可以包含集合本身”这样的问题。因此只要规定:集合A不包含集合A本身,就像我们将要在下一节讨论集合论公理体系中所规定的那样,就可以化解这个问题。事实上,在现在测度论的教科书中,已经把由集合的子集(包括集合本身)组成的类称为“域”或者“代数”,后来康托证明了就无穷多个元素而言,“域”所含元素的个数比原来集合所含元素的个数多一个数量级。
第二个悖论是由“理发师的工作特征与自己的述说之间的矛盾“所引发的,提出的是“判断者是否可以进入判断系统”的问题。这是一个相当复杂的问题,这样的问题在西方哲学中是少见的,因此称其为悖论,但这样的问题在东方哲学特别是中国古代哲学中却是常见的。事实上,我想,我们在《推理的对象:命题》和《命题的基础:定义》中曾经讨论过的,哥德尔论证的“一个公理系统的相容性不能通过该系统论证”这个命题的哲学原理也正在于此:通过系统自身的逻辑体系来评价这个体系的全貌是不可能的。
如果康托关于集合的定义或者说关于集合的描述是不可行的,是可以出现悖论的,那么,到底应当如何定义集合呢?
回想我们在《图形与图形关系德抽象》中关于平面几何中基本概念的讨论,比如对点、线、面的讨论。最初是古希腊学者泰勒斯(Thales,约前624~前546)直观地研究了这些概念,并且给出了最初的平面几何的定理。后来,欧几里得抽象出了几何学所要研究对象的定义:点是没有部分的,线只有长度没有宽度,面只有长度和宽度。可以看到,欧几里得的定义并没有完全摆脱经验层面的东西,我们曾经称这种定义为第一步抽象。随着研究的逐渐深入,特别是非欧几何的出现,人们发现了欧几里得定义的缺陷,于是又有了希尔伯特的关于定义的第二次抽象,那就是符号化:用大写字母A,B,C表示点,小写字母a,b,c表示线,希腊字母α,β,γ表示平面。然后,希尔伯特通过构建几何公理化体系来确定点、线、面之间的关系。我们曾经说过,数学概念第二次抽象的特点是:数学表达的符号化和数学论证的形式化;并且我们说过,尽管第二次抽象在形式上是美妙的,但就功能而言,第一次抽象发现了新的知识,第二次抽象合理地解释了新的知识。