文字整理:智源社区 熊宇轩 常政
编辑 | 陈大鑫
北京智源大会是北京智源人工智能研究院主办的年度国际性人工智能高端学术交流活动,以国际性、权威性、专业性和前瞻性的“内行AI大会”为宗旨。
2020 北京智源大会开幕式上,“贝叶斯网络之父”、图灵奖获得者 Judea Pearl 总结其毕生之所学与所思,发表了名为「The New Science of Cause and Effect with reflections on data science and artificial intelligence」的精彩演讲,启迪人们从数据革命走向因果革命,让人工智能系统由果溯因、学会思考有关「WHY」的问题。
而在本届大会的最后一场主旨演讲中,SmallTalk 之父、图灵奖获得者 Alan Kay 基于其近期发表的力作「HOW?」从宏观、未来的角度,介绍了人类社会面临的12个重大挑战,并指出解决它们的关键来自于打破常规的思维模式。
美国科研和信息技术腾飞的内因是什么?如何孕育科学技术发展的土壤?如何培养下一代的卓越科研人员、机构和社区?针对以上问题,Alan Kay 在本次演讲中都给出了自己的答案。在演讲后的圆桌讨论中,Alan Kay 和北京智源人工智能研究院理事长张宏江、北京智源人工智能研究院院长黄铁军,就人工智能发展中的趋势性话题等进行了深入交流,Alan Kay 认为目前我们仅仅触及了人工智能的冰山一角,并建议年轻一代学者应该摈弃“唯论文”、“唯学位”等功利心态,回归本心去迎接真正的挑战。
从「WHY」到「HOW」,两位大师站在不同的角度给出了自己对于人工智能未来发展方向的思考,分别展现了他们严谨理性和浪漫宏大的科学观和世界观。
下面,我们对 Alan Kay 本次的主旨演讲以及圆桌讨论进行了整理,希望可以启迪并激励人工智能相关行业的从业者在下一个十年中勇立潮头,把握时机,在这个最具有活力的科学研究领域中做出真正具有革命性的伟大成果。同时为了帮助大家深入理解演讲的内容,推荐大家参阅 Alan Kay 于 2019 年在英国的麦克阿瑟基金会峰会发布的题为「How?」的白皮书(https://internetat50.com/references/Kay_How.pdf),
本次演讲的部分内容、思想正是节选自这篇白皮书。
1 Alan Kay演讲问题引入
图 1:演讲大纲
首先, Alan Kay 介绍了他讨论问题的纲要,主要包含如下5个方面:
我们可以从人类解决各种「重大问题」的历史中学到什么?
当前科研和工程领域的生态存在什么问题?
对于政府来说,应该如何使用科研经费,如何构建新一代的研发机构?
如何建立学者的评价机制?
下一代「研究社区」
2 理解世界的思维框架:7个语境+12个重大挑战
步入讨论正题后,Alan Kay 介绍了他问题视野的起点——文化视野,认为它能将所有的人类问题囊括其中。目前全世界已经存在着数以千计的不同文化,而我们中的每个人都生活在自己的文化系统中。Alan Kay 认为我们都应该对社会承担责任,比如除了日常做的事情之外,还需分配出时间来思考一些关于学校教育、关于如何塑造下一代孩子价值观的问题,毕竟人类很多分歧即使是善意的分歧,都是由不同的世界观造成的。Alan Kay 于是提出了「丰富性」概念,它指的是扩展我们与事物产生情感上的联系的能力。当然了,这里也存在一个最基本的问题:我们如何谋生,以满足我们日复一日的基本需求。综上所诉,Alan Kay介绍了他思考问题的七个语境:「人文」、「社会」、「下一代」、「世界观」、「学校教育」、「丰富性」、「谋生」(如图2所示),以及彼此之间的逻辑。
图 2:思考世界的更广阔的语境。图中的条目分别为「人文」、「社会」、「下一代」、「世界观」、「学校教育」、「丰富性」、「谋生」。
接下来,Alan Kay 进一步归纳了人类社会亟待解决的12个重大问题:健康、食物、气候、水资源、居住环境、能源、教育、生态、污染、合作、人口、权利,并将之前梳理的7个语境概念嵌入每个问题之中,便形成了如下图3所示的思想框架。
图 3:当今世界面临的重大挑战。图中列举出了 12 种重大挑战——健康、食物、气候、水资源、居住环境、能源、教育、生态、污染、合作、人口、权利。
Alan Kay指出,我们需要认真应对这些问题,但实际上很难只专心处理其中的某一个问题(而不同时考虑其它的问题)。例如,「健康」问题是十分重要的,但它也会被地球上的其它问题所干扰,比如我们居住的星球自己也正在以各种方式「走向死亡」,比如健康问题背后还隐藏着对人类有着更大影响的问题——气候问题。
3 用“新思维”解决“旧思维”制造的问题
那么,我们该如何面对和解决这些重大问题的挑战呢?Alan Kay认为关键在于思维模式的变革,他在演讲中引用了爱因斯坦的一句名言:我们不能用制造问题时所用的相同思维来解决问题。
图 4:我们无法用创造问题时所用的相同思维来解决问题。
面对人类社会如今的局面,我们的思维往往也是常规的。既然「常规思维」解决这些问题行不通的,我们便需要学着如何以一种更好的方式学会「疯狂地思考」。Alay Kay 以这个问题“假设一些孩子在今年出生,到本世纪末年至八旬的成长过程中,地球会变得更好还是更差呢?”为例,解释了该如何打破常规思维。
图 5:记忆中童年的绿色世界。
首先,在我们很多人童年的记忆中,我们的绿色星球是这样的(如图5的视角 1)。
图 6:透过眼镜看到过去的绿色世界。
但现在,我们认为地球已经没有以前那样的「绿色」了(如图6的视角 2),但如果我们戴上眼镜,我们假设仍然可以看到过去的绿色景象。
图 7:三种看待世界的视角——过去的绿色世界,当今的灰色世界,未来可能被破坏的世界。
而当我们想象未来的情况时,眼镜中的景象又有可能成为右边眼镜中的情景(如图7的视角 3,由于疫情或者我们之前提到过的气候等问题所造成)。Alan Kay 认为,我们在思考“地球是否变好时”,需要发挥想象力,能够同时处理这三种视角。
图 8:由于威胁而产生的「非常规」思维。
Alan Kay 指出,尽管科学是我们想象力的放大器,但是大多数人并非科学家(尤其是欧美国家选举出的政客们),并不喜欢跳出他们的「常规思维」。从另一个角度来看,多年以来经常会发生的一种现象是:每当有某种「威胁」,比如战争、流行疾病等被公众(包括政客在内)所承认,往往会招致很强烈的反应,会催化出一些「非常规」思维。
到这里,我们不妨补充参考一下Alan Kay在白皮书「How ?」关于新思维模式的描述,比较有代表性的是“全系统思维”(Whole Systems Thinking),“以最大的尺度和最复杂的方式看待大多数事物”。
接下来,Alan Kay 列举了历史上一系列基于“威胁”而诞生的重大项目:因为“大萧条”而产生的「帝国大厦」。
图9:工程的杰作——帝国大厦。
Alan Kay首先介绍的是「帝国大厦」,他认为建造帝国大厦是历史上最杰出的设计和规划工作。帝国大厦,从拆除之前的场所到建造起整个新的建筑只用了不到一年的时间,而完成这项工程的建造者也不超过 3,000 名。这项工程之所以能以这样的方式被完成,是由于「大萧条」严重打击了美国,而此时正是帝国大厦需要资金的时候。所以建造帝国大厦的动机,一方面是(由于资金紧张)需要尽快完成这项工程;另一方面,需要向人们展示建造这样一座高耸入云的摩天大楼的真实过程是怎样的——通过工程的力量提振人们的信心。
接下来,Alan Kay 介绍了「第二次世界大战」期间的项目,包括「原子能计划」、「布莱切利公园密码破译」、美国和英国共同参与的「雷达」项目等。而到了和「冷战」期间,美国有大量的资金继续提供给了此类项目:1957 年,其中一部分资金用于资助美国国防部高级研究计划局(ARPA),而在 1962 年 ARPA 成立了信息处理技术办公室(IPTO),这是一个深入研究信息系统的、非结构化(Non-Structured)、与众不同的研究部门,采用了自下而上的研究组织方式。
结合白皮书「How ?」,Alan Kay关注这些项目的主要原因在于:这些项目规模庞大,动用了大量人力物力财力。它们都解决了以前认为不切实际或异想天开的问题,完成速度之快令人瞠目结舌。这些项目涉及各行各业的顶尖人才,他们可以自由选择发现和解决问题的方式和方法,并且随时获得相应的资金支持。
概而言之,它们都是基于“非常规”思维的工作模式下取得了杰出成果。接下来,Alan Kay 以1971年成立的施乐帕克(Xerox PARC)为例,从多个角度阐释了构建优秀科研团队、科研社区以及相关评价机制的全新思维方法,这些思想之光、经验法则对于我们探索当前的AI科学研究,非常值得借鉴。
4 施乐帕克的科研奇迹
研究结果的好坏与资助者密切相关
施乐帕克是施乐公司资助的一个研究小组,如下图 10中右侧的「冷战」部分所示,它脱胎自之前ARPA 的雷达研究小组,该小组从之前的项目中学到了如何大规模地将科学与工程相结合,从而将科学研究与未知事物相结合。
图 10:向 ARPA 社区投资的巨大回报。
如图10右下方所示,Alan Kay 列举出了PARC的「8.5」个重要发明:Modern Personal Computer (个人电脑)、 The GUI(图形用户界面)、WYSIWYG & DTP(所见即所得文本编器)、Real OOP(面向对象)、Laser Printer(激光打印机)、Outline Fonts & Postscript(大纲字体和页面描述语言)、Ethernet(以太网)、Peer-Peer & Client-Server(点对点&客户机服务器),还有Internet(因特网)因为是合作项目,便算0.5个。
令人惊讶的是,所有这些成果只不过是 25 个左右的研究人员在大约 5 年的时间内完成的。同时,完成这些研究所花费的经费并不高昂,按照现在的标准来计算,它们不过花费了 1,200 万-1500 万美元。但是这些研究成果带来的巨大收益已经超过了 40 兆美元。这些成果创造了一系列崭新的「工业种类」,而不是仅仅对现有行业做了「加法」。由于这些发明,诞生了许多股市估值非常高的美国公司。
Alan Kay 认为PARC的成功,充分说明了「结果的好坏与资助者的好坏密切相关」,这里的「好」(Goodness)并不是指钱,而是指资助者真正明白本次演讲中所讨论的「如何达成我们从未见过的目标」有何意义。
「愿景」而非「目标」
Alan Kay 认为 施乐帕克的研究理念深受Licklider的影响。
图 11:Licklider 的愿景为 PARC 带来自由开放的学术风气
Licklider 于 1962 年创立了 ARPA IPTO,他十分有远见,但对于心中的愿景,不会设定具体的目标。
Alan Kay 指出正是 Licklider 的愿景才造就了我们今天的生活。Licklider 认为「计算机注定要成为遍及全球的所有人类的交互式智能放大器」。但这就是他所说的全部「愿景」,如果你问他将如何做到这一点,他会说「我也不知道,但是我只需要将钱投给那些可以帮助我们实现这一愿景的人」。如果这其中 30% 或 40% 的资助结果是成功的,那么我们就将彻底改变世界。而事实正是如此!
所以,这些「愿景」就好比高山背后所隐藏的磁场,研究人员可以感知到这些磁场,所有的研究人员都会朝着磁场驱使的方向运动。而你实现这种「愿景」的方式可能有很多种。所以当你陷入困境时,你需要明白大多数对问题的描述都是在当下的环境下产生的,但是大多数情况下,你需要创造新的环境才能找到解决方案。所以,你需要从具体的目标和问题退回到宏大的愿景,愿景会还以事情本来的面貌,并且让你能够有更广阔的思维。
图 12:ARPA 的科学家管理文化,以及对「愿景」的坚守。
那么,当时这些愿景发挥了怎样的作用呢?如上图所示,这是美国国防部的五角大楼和国会(每个国家都有相类似的机构)。1957 年,苏联发射了人造卫星,美国感到国家安全受到了威胁,这种恐惧促使美国在 同一年设立了 ARPA。当时所有的 ARPA 研究主管都是科学家(尤其是物理学家),而不是官员。随后,ARPA 设立了 IPTO,它仍然由科学家所领导,领导人员每 2 年更换一次。他们认为,如果领导者在位太长时间,那这份事业就会变成他的「工作」,而他真正的工作应该是做一名科学家。在这里,人们要做的只是为国家所服务,在为国家服务两年之后,你就可以离开了。否则你就可能会开始买房并且因为按揭而分心,你会开始担心会不会丢掉自己的「工作」(不能纯粹地为愿景而努力)。
这里还面临的一个关键问题是:ARPA 认为实现自己的「愿景」需要花费10、15 年,甚至 20 年的时间,这势必需要花费大量经费来培养下一代研究人员,让他们继承这一愿景,这难免会面临来自国会的压力,但ARPA最终贯彻了这一路线。Alan Kay 回忆,施乐 PARC 实验室中几乎所有的计算机研究人员都来自于 ARPA 项目,当时大家都很年轻,Alan Kay 作为组里年纪最大的也仅仅 30 岁。
决策不应只是自上而下
PARC 采用的是自下而上项目管理模式,这同样追溯到ARPA。Alen Kay介绍,美国国会曾经想过对ARPA扮演一个监督机构的角色,自上而下对项目进行管理。他们会让你说明清楚为什么你在 ARPA 所从事的这些工作与国防部有关。但与现在不同,当年ARPA的主管们会直接告诉国会「不,这并不是你们该问的问题」,因为他们并不在乎被解雇。他们认为,真正该问的问题是「这些工作是否对国家、对技术本身、对我们的社会和文化有所帮助」。比如IPTO的研究主管之一 Bob Taylor 会勇敢地站出来,以礼貌、文明的方式批驳他们的短视。
下面是一段1966年前后, Bob Taylor 与当时ARPA负责人 Charles herzfield 的对话。Charles 问 Bob:「你想要的是什么?」Bob 答道:「我想做的就是这样的网络」。Charles 并没有继续问这个网络是什么。他只是说,好吧!Bob 后来回顾这段往事,他说「毫不夸张地说,这是一段时长仅仅为 15 分钟的对话」。Charles 当时直接问 Bob 需要多少启动资金。Bob 说大概需要 100 万美元(相当于今天的 600-700 万美元)。在这次会谈之后,Bob 立刻开始专心研究,好几个月都没有收到 ARPA 任何的官方指示。而这里 Bob 研发的「网络」,正是我们如今熟知的互联网。有趣的是,「互联网」这种如今在地球的各个角落都在使用的技术,在立项的时候竟然没有一份申报书。「互联网」的诞生是由于两个科学家之间互相信任,以及 LIcklider 那样的「愿景」。值得注意的是,在这之后,Bob Taylor 成为了施乐 PARC计算机科学实验室的创始人和主管,将这一套工作模式运用到了工业界的实验室,并邀请了包括Alan Kay 在内的美国20多位顶尖计算机科学家加盟了PARC。
将「责任」与「控制」分开 图 13:自顶向下的控制会扼杀「与众不同」的研究。
下面,Alan Kay 归纳了一个自认为很关键的论点:「负责」并不意味着试图「控制」,他认为这是传统官僚机构中的主管们往往都会犯的一个错误。如果你买了房子,你就会担心自己被解雇,所以你需要对你的老板绝对负责。但是,你基本上无法做到「控制」。因为在「与众不同」的研究中,如果你是资助者,往往会对项目了解不足,因而想不出什么好问题。你会在错误的位置上做错误的工作。
因此,你无法自顶向下地管理这样的项目。对于那些提出了绝妙的研究目标并作出了卓越工作的人,你所需要做的就是支持他们。作为负责人,你需要放手去资助这些用于思考的人,而不要想结果应该是如何。你要知道,大约 60% 的工作都不会成功。
不要进行「同行评审」
对于科研项目的评价机制,Alan Kay 认为,卓越的研究者往往会对其它卓越的研究者的工作给出较差的评价,这可能是由于他们之间存在竞争,或者他们的研究背景不同。对于这种顶级的研究而言,同行评审机制是行不通的。同行评审只对普通的研究工作有意义,而找到真正意义上的「同行」也是十分困难的。
只资助最优秀的人和团队
图 14:开展与众不同的研究的三要素——与众不同的资助者、研究管理者、研究人员。
那么,如何做出「与众不同」的研究呢?Alen Kay 指出这需要与众不同的资助者、研究管理者,以及非同寻常的研究人员。上世纪 60、70 年代,在 ARPA、ONR 和 PARC,有着 Licklider、Sutherland、Bob 这样与众不同的研究管理人员。有趣的是,与众不同的研究人员要相对容易找到一些。但如果没有前两者作为保障,这些研究人员也无法成功。如果你想组建一只冠军足球队,你可以雇佣世界上最好的球员(比如,贝克汉姆),只要你不是随意雇佣球员就行。对于施乐 PARC 实验室来说,他们找到了 Butler(编者注:即Butler Lampson,PARC的软件开发负责人,因在分布式个人计算环境及其实现技术领域的贡献获得1992年图灵奖)。如果你仔细观察上图中左下角的钟形曲线,当你为你的研究实验室寻找出色的研究人员时,这些人有的是千里挑一,有的是万里挑一,有的则是千万里挑一。而在中国,这样千万里挑一的研究人员有大约 140 人,这个比例大约处于正态分布 5σ 的位置。如果你想要组建好的实验室,你需要找到这些人并且好好培养他们。
图 15:左手艺术,右手科学。
有一些研究者是顶级的科学家,有的是顶级的工程师。如上图所示,这是Alan Kay 在40 年前建议苹果公司做的一则广告,它展示了我们的个人电脑是怎样的。而Alan Kay 则希望它成为下面这样:
图 16:艺术与科学的交融,多元化思维的碰撞。
在这里,左脑和右脑之间并没有很明显的界限;在这里,真正的思维过程应该是能够流畅地将不同种类的思维模式融合在一起,将美学思想融入到科学思想之中。
疯狂的科研投资——不计回报
图 17:科技公司的疯狂学术投资——以施乐PARC 为例。
需要指出的是,上述关于施乐帕克的种种研究理念,均精选自Alan Kay 的白皮书「How?」(https://internetat50.com/references/Kay_How.pdf),Alan Kay 总共归纳了十九条经验法则,感兴趣的朋友们不妨查阅全文。在本次演讲中,Alan Kay 最后还着重了介绍了其白皮书并未提及的一个新概念:Mad Money「疯狂的投资」,它指的是如果投资的项目并不成功,你也不在乎,这种投资并不针对任何目的。所以,我们首先要问的一个问题是:对于任何的组织或者国家来说,Mad Money 的体量应该有多大?对于一些组织程度极高的国家来说,他们可能会说「我们不存在 Mad Money,我们对每一分钱都有计划」。这对于创新来说是不利的!对于大多数公司来说,它们想向股东证明它们明智地使用了这笔钱,并带来了投资回报。它们不喜欢展示 5 年内还没有投资回报的项目。
Alan Kay指出,对于科技公司而言,研发的费用往往占收益的 5%-15%,这些钱大多数都用在了产品上。而其中 Mad Money 则占研发预算的 1%-5%。所以,Mad Money 只占公司全部收益中极小的一部分。今天,施乐 PARC 实验室的这项预算为 1,500 万美元。即使以最低的标准(研发预算占公司总收益的 5%,Mad Money 占研发预算的 1%)进行计算,《财富》排行榜上名列 418 也可以负担起施乐 PARC 的 Mad Money 费用。而事实上,并不只有一家这样的机构。如果以更高的标准(研发预算占公司总收益的 15%,Mad Money 占研发预算的 5%)来计算,想要负担起施乐 PARC 的 Mad Money 费用,《财富》排行榜名列 1,000 左右的公司也可以做到。
图 18:科技大国的疯狂学术投资。
我们再来看看各个国家对「Mad Money」的投入。对于日本和德国这样的科技大国来说,它们每年会投入 1,000 亿到 5,000 亿美元用于国家的科技研发,中国每年大概投入了 2,400 到 2,500 美元,美国大概会投入 5,000 亿美元左右。无论具体数额如何,这一比例往往占大国 GDP 的 2%。如果我们将其中相同的比例(1%-5%)分配给 Mad Money。那么 Mad Money 的下限就达到了 10 亿到 50 亿美元。此时,你不应该担心这些投资的结果会如何。那么对于每个 Mad Money 预算达到 10 亿美元的国家来说,就可以建立 66 个以上的施乐 PARC 实验室。而对于中国和美国这样体量更大的国家来说,他们一年可以建立 330 到 1650 个施乐 PARC 实验室。这看起来很值得去做,不是吗?
5
用非传统方式迎接全球的巨大挑战
图 19:全人类联合起来就足以应对各种重大挑战,但是人们意识到了吗?
顺着Mad Money的思路,Alan Kay 进一步发出了这样的倡议:全球各国家(尤其是各个大国)共同行动起来,共享大量的研究基金、潜在的科研人才,从而以一种非传统的方式应对这些我们所面临的巨大挑战。但问题是,世界上的大多数人并没有意识到我们面临着这些问题,或者他们看不到这些问题带来的威胁、恐惧或其它的代价。
Alan Kay 由此用爱因斯坦的一句名言作为结尾,他认为这句话不仅概括了过去40、50年中计算机科学研究领域的弊端,而且对于我们面临的大多数问题,尤其是上文提及的全球12各个重大问题来说,值得用来警示的。这句话便是:
愚蠢之处在于,我们一遍又一遍做同样的事,却期待不同的结果发生。
6 张宏江、黄铁军与Alan Kay 对话精彩实录
Alan Kay 演讲结束后,北京智源人工智能研究院理事长张宏江、北京智源人工智能研究院院长黄铁军,与 Alan Kay 进行了深入的交谈。下面是他们部分对话内容的精彩实录:
张宏江:在您的文章「How?」中,已经对刚才演讲中的诸多观点进行了很好的总结。在这篇文章中,您列举出了 19 条关于研发和如何应对挑战的规则,这些在您刚才的演讲中也有所提及。但是也有一些您在演讲中没有提到的部分,即对于那些想遵循您提出的 19 条规则的人来说,仍然存在着很大的障碍(例如所谓的「鸵鸟悖论」),您能谈谈对这些障碍的看法吗?
Alan Kay:相关的参考资料请参阅维基百科有关「认知障碍」(Cognitive Bias)的文章。认知障碍与大约 200 种人脑中的错误思维有关,这是人类学、心理学在过去几百年中的研究成果,它解释了一些有趣的问题,例如「我们的思考能力为什么如此之弱」、「为什么我们需要经过大量的训练才能很好地进行思考」、「为什么科学只在过去的 200 多年才得以迸发,而在数百年前或数千年前却没有得到迅速的发展」。「确认性偏差」(Confirmation Bias)是科学家们所熟知的一种认知偏差,而科学家们也会犯这样的错误。「确认性误差」指的是,如果你坚信某种理论,你就会有意识地寻找能够巩固这种信念的证据,并且赋予这种证据的权重要远远大于你赋予那些反对该信念的证据的权重。在大家对疫情的反应中,我们也看到了「鸵鸟综合征」(Ostrich Syndrome)的存在。这些问题都是根植于所有哺乳动物中的。大多数动物在遇到危险时,可能基本上会选择躲藏起来或者进行反击,这些同样也是人类本能的一部分。然而,人类应该学习克服这些本能,比如令人恐惧的战争。
张宏江:正如您刚才在演讲中提到的,当人们真正感到恐惧或危险时,会采取行动,比如美国在苏联的威胁(发射卫星)下建立了 ARPA。那么我的问题是,当前已经持续了数月的新冠疫情已经造成了许多经济层面、民生层面上的问题,你认为这是一个足够大的威胁吗?它是否能唤醒人们?人们是否已经开始采取正确的应对措施?
Alan Kay:是的,它似乎正是一种这样的威胁。而对新冠疫情的处理与政府的组织形式有关。新西兰行动得就很快很好,而美国至今为止仍然在一条错误的道路上渐行渐远。但总体上来看,我们希望主流的人们能做出正确的应对。人们往往不能想象(新冠的后果),直到他们的亲朋好友患上这种疾病、孩子死于这种疾病,或者自己患病。(以战争为例)战争在人类历史上屡见不鲜,过去人们常常受到它的威胁,因此,英国人(二战前)开始研制雷达,用一些雷达阵列来感知国境之外的战役,当时其它一些国家并不相信将会与德国发生战争——政治家们都试图避免战争的发生。但是雷达的创造者们还是完成了这项发明工作,并成为该领域的领导者。当年,我的同事们也对此做出了反应,在基金的资助下开展了雷达的研制工作。但直到二战真正到来之前,雷达在英国、美国都不是政府优先考虑的项目,但雷达还是在这两个国家建立了起来。在美国,由于政府的资助,一些创建雷达的人已经成为了亿万富翁。这些项目在美国实际参战之前由一些物理学家完成,包括MIT也参与了其中。但当时这个项目并没有能启发美国国会应对当下的问题。在那段日子里,美国奉行的是孤立主义。
张宏江:您在演讲中提及了现代计算机的发展历史,您怎么看过去 60 年的人工智能的发展?
Alan Kay:这个问题很好回答。如果你是一名生物学家,你就会对人脑的工作方式有所了解。人的大脑中有大量非逻辑的部分,就像机器学习本质上是一些运算的很快的相关因素一样。而现在我们要想完成一些工作,需要真正的通用人工智能。所以这是现在我们做错的了的地方。对于那些想要继续在这个领域进行研究的人来说,他们应该关注更加困难的部分,即「认知部分」。而在过去的 40 年中,在美国,认知科学研究人员受资助的情况就要差得多。机器学习这些年来取得的成绩令人钦佩。但是令人疑惑的是,对于整个人工智能领域来说,必要的进展还很小。
张宏江:本届大会的主题是「人工智能的下一个十年」,请问您对人工智能下一个十年的预测、期望、愿景是什么呢?
Alan Kay:首先,我们应该严肃地看待「智能」一词。就像在「计算机科学」一词中,我们需要认真对待「科学」。在上世纪 60 年代我们将其称之为「科学」,但 70 年代之后大部分美国 CS 专业毕业生学到的是「工程」。当 CS 在施乐帕克实验室取得成功之后,许多人都想加入到这一领域中来,从成功中分一杯羹。有趣的是,现在一些研究人员会很快地写出一篇研究论文,机器学习领域也是如此,因为论文中一些表示矩阵数学的部分,其实对应的是相同的感知机。如果你仔细看这些论文的数学细节,会发现它们并没有那么有趣。Judea Pearl 将现在的机器学习称作「曲线拟合器」。但如果你从事的是人工智能工作,就需要做更多的事情。我们不能将人工智能的冰山一角等同于「AI」(即使你用到了大量的计算机、芯片)。我想对年轻的研究人员说,请保持本心!不要在意论文的发表,不要在意你的博士学位,那些真正做出巨大突破的人并不在意这些事情。我并不反对资助者资助其它的人,但是如果资助者忽视了那些能做出突破性贡献的人,那将是一场灾难。我认为,在过去的 20-25 年中,计算机领域经历了许多这样的灾难。
张宏江:当您在 PARC 从事图形化用户界面(GUI)的相关工作时,有些人认为这其中并没有太多数学上的工作,比如它并没有用到太多微分方程的知识。请问您是如何说服自己的领导,告诉他们这是一项重大突破,并会彻底改变计算机的交互模式,从而导致今天我们在互联网领域的移动设备的革新?
Alan Kay:我从没有说服我的老板关于任何事。因为 Bob Taylor 只是出于直觉就雇佣了我。Bob Taylor 从来没有告诉 PARC 中的研究人员应该如何去做某个项目。
张宏江:请问您如何引导您的想法被研究社区所广泛接受?
Alan Kay:大多数我的想法并没有被社区所接受。
张宏江:那么面向对象编程(OOP)和图形化用户界面(GUI)呢?
Alan Kay:你们口中所说的 OOP 大部分都与我最初描述的 OOP 大相径庭,我失去了它。在 PARC 诞生的 GUI ,则是另一个很有趣的故事。Steve Jobs 使用的是施乐帕克实验室所放弃的技术。
人们可以看到 Jobs 与众不同的思维。如果我们也可以做到这一点,我们会被我们能在 PPT 和 Keynote 中所做的事情所震惊。此时所有的东西都活了起来,它们并不是一成不变的演示结果,它们所有的部件都是可编程、可验证的。如果你纵观这些从 PARC 中诞生的技术,你会发现它们(即使是在想法上)都没有竞争者。激光打印机就是其中一个例子,所以公司立刻开发了对它的研发工作。以太网也是如此,当时也没有任何与它相似的东西,所有人都在试图构建一个局域网,而以太网是唯一行得通的方案。人们都认为现在我们有了与当年 PARC 所发明技术不同的新(OOP)编程技术和语言,其实那是基于我们的技术,通过使用接口改造而成的一个子集。而令人遗憾的一件事情是,目前的网页和网页浏览器,与我们 80 年代所放弃的技术相比,都显得太弱了。
张宏江:Steve Jobs 窃取了你的 GUI 技术,并将其用在了 Mac 中,你欣赏这种做法吗?
Alan Kay:我们开发的是公众可见的技术,在 Steve Jobs 发布带有 GUI 的 Mac 的前两年,我在 「科学美国人」上的相关论文就已经发表了。我对 Steve Jobs 和 Bill Gates 都提到过该技术,这并不是什么秘密。我希他们能把完整的 GUI 想法都用上,而不要只使用其中的一部分,从而把事情弄糟。我们在 PARC 工作过的人,没有一个是想要变得富有的。不要使用「x,y,z」来衡量你自己,我根据自己的品质和向某件工作中投入的努力来评价我自己。我只能控制这一点,而无法控制别人对我的看法。此外,在 PARC 工作过的人(或者将范围扩大到整个 ARPA 社区),彼此都有着很稳定的联系,我们都很热爱 Licklider 提出的「愿景」。记得在招聘时,Taylor Bob 会倾向于寻找那些拥有很深厚科学背景的艺术家。
张宏江:2015 年,你曾经访问过企业孵化器 Y Combinator,你在他们的标语上「涂鸦」了几笔。他们的标语是「Make something people want」,而你在「want」(想要)上画了个叉,将其改成了「need」(需要),请问你有何见解?
Alan Kay:我们会想要(want)糖、脂肪、盐,也想要陪伴,这是我们的生理需求。生财之道在于,是为人类任何想要的东西制造一个技术放大器。而这种技术放大器在技术革命的过程中,实际上也制造了违禁的药物。我们不得不拥有这些东西。而我们所需要(need)的东西则是类似于教育之类的事物,所有人都需要深入的教育,而并非所有的孩子都想要接受这种教育。营销人员并不喜欢「需要」这种概念,而喜欢销售人们「想要」的东西。教育者们试图弄清楚人们「需要」什么,并试图找到帮助人们得到「需要」之物的方法。涉及人们「需要」之物的工作要远远比涉及人们「想要」之物的工作繁重得多。如今,我们的社会陷入了一种困境,即失去了在人们「想要」之物和「需要」之物之间的平衡。
张宏江:最后,我想问一个问题,您认为过去 20 年间最伟大的产品是什么?请用一句话概括。
Alan Kay:我们可以在网上找到大多数有趣的东西,在公司中,这些东西可能就会成为产品,现在你可以免费地使用这些产品。在过去的 20 年间,在计算机领域,我认为最有趣的东西是「Croquet」,目前的版本是过去 20 年中五项深度研究工作的产物。它是一种检验麻省理工学院在上世纪 70 年代撰写的论文理论是否有用的系统。这个系统涉及到像互联网一样庞大的内容,以及大规模的拟时间计算的部署工作。这项工作的重要性与 TCP/IP 协议是同一级别的。(编者注:关于Croquet项目详细资料,可参阅:https://en.wikipedia.org/wiki/Croquet_Project)
黄铁军:在中国,即使我们每年有 5% 的预算用于「疯狂的投资」(Mad Money),但是中国仍然没有诞生 PARC实验室这样的机构,这是为什么呢?
Alan Kay:我认为问题在于,研究者需要思考他们真正的目标是什么。
黄铁军:我认为,造成这种现状的原因是,与你所提到的 Mad money 相比,其余 95% 的投资是「常规投资」(Normal Money)。但是聪明的人是有限的,大多数聪明的人接受的是 Normal Money,他们无法将自己的时间用于自由探索,这是中国没有诞生 PARC 和真正创新工作的原因。
Alan Kay:微软的创始人之一 Paul Allen 曾经决定捐赠它的数十亿资产,参照施乐 PARC 的成功经验,雇佣了一些施乐的前员工,成立了 Interval 研究院。之后,他们邀请我参观了 Interval,我发现研究院中的大部分事情与 PARC 是完全不一样的。我环顾四周,一些之前在 PARC工作效率很高的人到了这里却十分低产。Paul 不仅仅满足于资助公司,他想成为公司团队中的一员。我跟 Paul 说,你已经成功的成为了亿万富翁,但是难道你不承认你在一生中从未做过任何真正的计算机科学研究吗?你现在应该已经发现这个问题了。你不应该在公司中多管闲事,这样的话你在 Interval 中无法达成 PARC 曾经的成就。对于美国研究生院毕业的年轻科学家来说,房地产市场的形势并不乐观,通货膨胀使得房价十分高。这意味着,斯坦福毕业的研究生在找到工作时也无法负担起在帕洛阿尔托买房的费用。他们必须去谷歌上班拿高薪,即使是这样,他们也很难买得起房子。几乎没有人愿意待在家中做研究,因为这样的话,谁能资助你呢?计算机领域的资助几乎都需要工程项目申请书之类的东西,在申请书中,你需要写出你将如何解决问题。而在 ARPA 中,我们可以在信封上随手写下我们想要研究的问题,而如果他们觉得你是个不错的研究者,他们就会资助你,这就是他们对这个问题的回应。在 ARPA,没有人让我去证明任何一件事情,无论是当我在读研究生或是在 PARC 工作时都是如此。当我博士毕业一年后,他们就给了我相当于一年 200 万美元的预算。他们认为我有潜力。当你的研究没有成功时,这些支出不是失败,而是开销。而官僚机构存在的一大问题就是,他们雇佣了大量处于钟形曲线中间区域的普通员工,这些员工需要被管理。突然之间,人与人之间有了等级差异,你也就负有了一定的义务。美国有一个麦克阿瑟基金,他们设立了天才奖学金,用于资助 35 名艺术家 5 年内的开支,而并不在乎这些艺术家做了什么。事实上,「Artist can not do their art」(艺术家不能完成他们自己的艺术),这正是艺术家的定义。我们应该吸引最好的艺术家们,然后为我们获得的 30% 的产出而感到高兴!
7 结语
从「李约瑟问题」到「钱学森之问」,我们不停地在探索培养新一代中国杰出科学家的道路。如今,Alan Kay 在本届智源大会上提出的诸多观点也从另一个角度给出了破局之法。从人文社会的宏大思考到科学研究的针砭时弊,Alan Kay 发表了自己对于人类未来科学发展走向的野望,留下了一代大师对「后浪」们的期许。
2020 北京智源大会已然落下帷幕,同时也开启了中国人工智能研究下一个十年的浩大画卷,我们期待人类科学迎来百花齐放的春天。人工智能,这颗人类现代科技桂冠上的明珠,正静待着它新的主人!
[博文视点赠书福利]
AI科技评论联合博文视点赠送周志华教授“森林树”十五本,在“周志华教授与他的森林书”一文留言区留言,谈一谈你和集成学习有关的学习、竞赛等经历。
AI 科技评论将会在留言区选出15名读者,每人送出《集成学习:基础与算法》一本。
活动规则:
1. 在“周志华教授与他的森林书”一文留言区留言,留言点赞最高的前 15 位读者将获得赠书。获得赠书的读者请联系 AI 科技评论客服(aitechreview)。
2. 留言内容会有筛选,例如“选我上去”等内容将不会被筛选,亦不会中奖。
3. 本活动时间为2020年8月23日 - 2020年8月30日(23:00),活动推送内仅允许中奖一次。