作者 | 周熠
上海脑科学与类脑研究中心
张江实验室脑与智能科技研究院
三十年河东,三十年河西
虽然只有短短60多年的历史,但人工智能已经经历过数次大起大落。这主要缘于对人工智能的本质和特性缺乏深刻的认识。
虽然只有短短60多年的历史,但人工智能已然历经数次大起大落。对整个人工智能领域来说,自其诞生起,大致可以认为经历了三次波峰(1956—1974、1980—1987、2011至今),两次波谷(1974—1980、1987—1993)以及一次相对平稳期(1993—2011)。
现在,我们正经历人工智能第三次波峰。
第一次波峰(约1956—1974)
在人工智能诞生的初期,面对初现的新大陆,科学家们发觉很多地方都可以探索,而且很多探索都容易取得新成果。麻省理工学院、斯坦福大学、卡耐基梅隆大学和爱丁堡大学等成为了人工智能高速发展的前沿阵地。
早期的研究和探索遍地开花,可喜的进展发生在几乎所有人工智能子领域:自动定理证明、下棋、机器翻译、模式识别、搜索与通用问题求解、规划、自然语言处理和机器翻译、知识表示与推理、计算机视觉、机器人,等等。科学家们激动不已,信心满满——1958年,西蒙(H. Simon)和纽威尔(A. Newell)预测十年之内机器能够打败国际象棋冠军;1965年,西蒙声称20年内机器能够做任何人类能做的事情;1967年,明斯基(M. Minsky)也附和了这个观点,认为人工智能的解决也只是一代人的事情,甚至在1970年还把这个时间缩短到了3—8年。与此同时,资助机构也把相当大量的资金投入人工智能研究。
第一次波谷(约1974—1980)
人工智能只能处理玩具问题
很快,困难就开始降临,人工智能开始了第一段寒冬。
在初期爆发之后,人工智能研究遇到了很大的瓶颈,很多子领域进展缓慢,许多科研项目也没有达到预期的目标。届时,大家普遍认为,人工智能只能处理“玩具”问题(“toy” problems)。因此,资助机构大幅度削减甚至停止了对人工智能的资助。人们马上从相当乐观变成了相当悲观。回望人工智能60余年历程发现,这种冰火两重天的景观竟是人工智能很有意思的特性之一。
除了一些其他方面的因素,包括计算能力的不足以及数据的欠缺等,人工智能在基础理论上也遇到了重要的挑战。其中之一是明斯基对于基于神经网络的联接流派的批评,如双层神经网络不能表达异或函数(Xor)[1],普遍认为这直接导致联接流派在很长一段时间内一蹶不振。符号流派也遇到很大困难,包括计算复杂性和组合爆炸问题、常识知识问题和框架问题等等。一些外行也趁机对人工智能大加鞭笞,这无疑让人工智能雪上加霜。
即使是在冬天,人工智能也并非裹足不前。在这段时期,人工智能在逻辑程序设计、知识表示与推理上取得了一些进展。虽然以神经网络为代表的联接流派遭遇了第一次黑暗时代,但仍有一部分科学家在坚守阵地。很多人认为,这段寒冬和之前对人工智能过于乐观有很大关系,期望越大,失望也越大。但是,个人认为,对人工智能的本质和特性缺乏深刻的认识才是最主要的原因。
明斯基和“异或问题”
常识知识
状态空间爆炸
第二次波峰(约1980—1987)
在部分科学家的坚持下,人工智能终于熬过了第一段冬天,迎来了第二春。这主要得益于符号流派中的专家系统(expert system)[2]和逻辑程序语言Prolog(Programming in Logic的缩写)[3]。
专家系统期望用机器来表示某特定领域的专家知识,然后通过机器自动推理来模拟专家在领域中的作用。专家系统早期的工作可追溯到费根鲍姆(E. A. Feigenbaum)及其学生所做的系统DENDRAL[3]。该系统试图帮助化学领域进行结构分析,其输入为质谱仪的数据,输出为物质的化学结构。在此之后,另一个有代表性的专家系统是MYCIN[4],用来诊断传染性血液疾病。随着这两个系统的成功,众多专家系统如雨后春笋般涌现出来,包括卡耐基梅隆大学开发的XCON[5]。这些专家系统也确确实实能够有所帮助,由此也诞生了许多人工智能初创公司(这点和当前的状况几乎雷同)。这段时期,知识工程和基于知识的系统成为了人工智能的主流。就连与领域专家知识相对应的常识知识,也开始了新一轮的尝试,其中包括莱纳特所领导的Cyc项目[6]。
费根鲍姆与“专家系统”
这些成功导致了资金再次回流。资助机构重新对人工智能投入大量的资金,其中包括很有影响力的日本雄心勃勃的“五代机计划”(the Fifth Generation project)。五代机采用科瓦尔斯基(R.Kowalski)等人所提出的逻辑程序语言Prolog为核心,期望能将人类的知识都表示成规则,然后通过这些规则的自动推理来解决问题,最后通过自然语言等和人类直接交流。美国、英国和欧洲大陆也启动了类似的计划。
科瓦斯基与“逻辑程序Prolog”
联接流派在这段期间也有一定的复苏。例如,霍普菲尔德(J. J. Hopfield)提出了新的神经网络模型[7];鲁姆哈特(D. Rumelhart)、欣顿(G. E. Hinton)、威廉斯(R. J. Williams)、韦伯斯(P. Werbos)等提出了反向传播(back propagation)学习机制,同时也说明了三层的神经网络能够解决异或问题[8,9]。
五代机计划
第二次波谷(约1987—1993)
然而,历史再度重演。
专家系统和五代机遇到了与之前的人工智能技术一样的问题:取得一定的进展相对容易,但深入下去则越来越困难。人工智能不可避免地又遇到了第二次冬天。资助机构大幅度削减对人工智能的投入;人工智能公司纷纷倒闭;各国雄心勃勃的人工智能大计划纷纷搁浅……
值得一提的是,在这段时期,对符号流派的失望也间接导致了行为流派的崛起。布鲁克斯(R. A. Brooks)等人从机器人学的角度认为,人工智能并不一定需要采用从上到下的研究方法论,先研究高级的智能行为如常识推理等等,人工智能也可以从底向上出发,首先需要一个机器身体,考虑其如何在环境中感知和移动等等[10]。虽然现在这是一个大家都比较认可的观点,但是在当时,这个观点还是有点非主流。而布鲁克斯是一位实干家,推出了机器爬虫Genghis来佐证他的观点。
布鲁克斯与“包容式体系结构”
第一次相对平稳期(约1993-2011)
在此之后,人工智能进入一段相对平稳的时期。逐渐,人们更加深入地认识了人工智能的特性。其中很重要的一点是:最初的终极目标,即达到人类水准的人工智能,事实上是一件非常困难的事情。另一方面,虽然人工智能在商业和应用上并没有取得想象中的巨大成功,但也绝非毫无用处。很多人工智能技术,如搜索、专家系统、语音和图像方面的模式识别还是取得了相当大的成功,当然这种成功也是建立在计算能力飞速发展的基础之上的。
但是,比较尴尬的一件事情是有关人工智能另一个特性的,即当某项人工智能技术被了解的相对比较透彻之后,很多人往往不再认为这是人工智能,因为这和人们所想象的类人智能有所出入。最典型的例子就是搜索和基于规则的系统。个人认为,这对人工智能非常之不公平,这类技术当然应该算人工智能的功劳,即使它们和人类“想象中的”人工智能也许并不一致。联接流派在这段时期又陷入了一定的低潮,主要源于其表现不如统计流派的支持向量机模型[11]。
瓦普尼克与“支持向量机”
这段时期,人工智能应用领域取得了一些里程碑式的突破。其中比较非凡的一件事情是IBM开发的深蓝(Deep Blue)于1997年战胜了国际象棋人类世界冠军卡斯帕罗夫[12]。西蒙和纽威尔的预言终于在迟到三十年之后实现了。此外,由DARPA孕育的自动驾驶项目也取得了一定的进展。一个来自斯坦福大学的团队于2005年完成了131英里的路程。2011年,IBM推出了沃森(IBM Watson),在智力问答比赛“危险边缘”(Jeopardy!)中战胜了人类冠军[13]。有意思的是,IBM并没有称其为人工智能,而强调其为认知计算(cognitive computing)。也许是因为人工智能这个名词在这段时期已经被认为是好高骛远了吧。这不得不说是人工智能的一种悲哀。
第三次波峰(约2011— )
三十年河东,三十年河西。人工智能在沉寂了相当长的一段时期后,终于又开始爆发。这主要归功于深度学习,一种基于联接流派的神经网络技术。简而言之,与之前的浅层(如三层)全联接神经网络相比,深度学习最重要的特点就是使用层数较深的非全联接神经网络结构,如深度卷积网络、长短程记忆网络,等等。严格意义上,深度学习的基础理论在多年前已经逐步成型,可以追溯到上世纪80年代和90年代。之所以深度学习有如此大的影响力,主要是其在应用层面全面开花,在图像和视频识别、语音识别、自然语言处理等众多领域,都取得了骄人的战绩[14]。而其成功的关键,除了更好的网络结构和更强的计算能力之外,还必须归功于大量的标注好的数据的出现。当前的人工智能技术在很多任务上,包括人脸识别、语音识别、字符识别等标准数据集,都取得了比人类还要好的效果。而在机器翻译、问答和某些领域医疗诊断等领域也交出了令人相对满意的答卷。此外,人工智能在游戏领域的表现也相当引人注目,例如:2017年,Google Deepmind推出的AlphaGo系列在围棋领域击败了人类世界冠军[15];2019年,Open AI推出的OpenAI Five在Dota 2中也达到了相当高的职业水平。
深度学习技术引领人工智能第三次波峰
无尽的追寻
人工智能,是人类发明史上的皇冠,人类至简至深的追寻;它萌发于文明初始自然而直接的想象,也许,也将是人类明日最后的一个梦。
为了这个梦想,先贤们付出了艰辛的努力,勇敢地进行了一些尝试,虽然这些尝试在很长一段时间内并未取得革命性的突破。电子计算机的出现点燃了人工智能梦想的火花,让很多不可能变为可能。借助于计算机的发展,人工智能取得了很多重要的成功,但是人工智能的发展远非一帆风顺。在短短60多年时间里,人工智能经历过数次大起大落:漫漫长夜中看见柳暗花明;盛装华彩时惊觉,梦醒后无路可走。围绕人工智能,一直存在无数聚焦、无数争议、无数预测、无数希望和无数失望。
困境时,穷且愈坚,努力所至,期待云开日出。顺境时,一次又一次,重入怀疑之海,不断探寻理性的边境。路漫漫其修远,人工智能之梦,人类一直在追逐。
我,人工智能,虽经历一波三折,但已然茁壮成长。
[1] Marvin Minsky and Seymour Papert, Perceptrons: An Introduction to Computational Geometry, Cambridge, MA: MIT Press, 1969.
[2] Robert K. Lindsay, Bruce G. Buchanan, Edward A. Feigenbaum, and Joshua Lederberg, Applications of Artificial Intelligence for Organic Chemistry: The Dendral Project, p. 70,New York: McGraw-Hill Book Co., 1980.
[3] Robert A. Kowalski and Donald Kuehner, Linear Resolution with Selection Function, Artificial Intelligence, Vol. 2, Nos. 3-4, pp. 227-260, 1971.
[4] Bruce G. Buchanan and Edward H. Shortliffe (eds.), Rule-Based Expert Systems: The MYCIN Experiments of the Stanford Heuristic Programming Project, Reading, MA: Addison-Wesley, 1984.
[5] Virginia E. Barker and Dennis E. O'Connor, Expert Systems for Configuration at Digital: XCON and Beyond, Communications of the ACM, Vol. 32, No. 3, pp. 298-318,March 1989.
[6] Douglas B. Lenat et al., Cyc: Toward Programs with Common Sense, Communications of the ACM, Vol. 33, No. 8, pp. 30-49, August 1990.
[7] John J. Hopfield, Neural networks and physical systems with emergent collective computational abilities, Proceedings of the National Academy of Sciences of the USA, vol. 79 no. 8 pp. 2554–2558, April 1982.
[8] David Rumelhart, Geoffrey E. Hinton, and Ronald J. Williams, Learning Representations by Back-Propagating Errors, Nature, Vol.
323, Letters, pp. 533-536, October 9, 1986.
[9] Paul Werbos, Beyond Regression: New Tools for Prediction and Analysis in the Behavioral Sciences, Ph.D. thesis, Harvard University, Cambridge, MA, 1974.
[10] Rodney A. Brooks, Elephants Don't Play Chess, Robotics and Autonomous Systems, Vol. 6, pp. 3-15, 1990.
[11] Corinna Cortes, Vladimir Vapnik, Support-vector networks. Machine Learning. 20 (3): 273–297. 1995.
[12] Feng-hsiung Hsu, Murray Campbell. Deep Blue System Overview. Proceedings of the 9th international conference on Supercomputing. ACM. pp. 240–244. 1995.
[13] David Ferrucci, Anthony Levas, Sugato Bagchi, David Gondek, Erik T. Mueller, Watson: Beyond Jeopardy!. Artificial Intelligence. 199: 93–105. 2013.
[14] Alex Krizhevsky, Ilya Sutskever, Geoffrey E. Hinton, ImageNet Classification with Deep Convolutional Neural Networks. NIPS 2012: 1106-1114. 2012.
[15] Mastering the game of Go with deep neural networks and tree search, David Silver, Aja Huang, Chris J. Maddison, Arthur Guez, Laurent Sifre, George van den Driessche, Julian Schrittwieser, Ioannis Antonoglou, Veda Panneershelvam, Marc Lanctot, Sander Dieleman, Dominik Grewe, John Nham, Nal Kalchbrenner, Ilya Sutskever,Timothy Lillicrap, Madeleine Leach, Koray Kavukcuoglu, Thore Graepel, Demis Hassabis, Nature volume 529, pages 484–489, 2016.
作者介绍
周熠,现任张江实验室脑与智能科技研究院/上海脑科学与类脑研究中心认知智能研究组课题组长,研究员,中国科学技术大学兼职教授。研究方向为认知人工智能,主要的研究兴趣为如何受脑启发,深度融合基于逻辑的符号流派和基于神经网络的连接流派,及其在认知人工智能领域中的应用,包括AI+教育、自动智商测试、智能语言处理等。
(每周三晚上7:00—8:00,有周熠老师的直播科普课程, 讲述从歌舞偶到王者荣耀,人工智能如何成为现实。请关注“墨子沙龙”每周的直播预告~~)