john hopcroft、bart selman与张宏江展望“ai未来10年”
经典人工智能方法在未来会得到关注吗?经典方法和深度学习的关系将如何发展?新的突破点又在哪里?
针对上述话题,在2020北京智源大会6月21日晚间的全体大会上,北京智源人工智能研究院理事长张宏江和图灵奖获得者、智源研究院学术顾问委员会委员john hopcroft、aaai候任主席bart selman共论ai,探讨“ai的过去和未来10年”。在具体讨论过程中,采用了张宏江发问,john hopcroft、bart selman回答的形式进行。在论坛最后,两位教授还向中国的学者们就如何开展ai研究提出了中肯的建议。
一、艰难的50年和腾飞的10年:
经典ai和深度学习的不同境遇
张宏江:今天我们非常幸运请到了图灵奖的获得者john hopcroft教授,美国康奈尔大学的计算机科学教授bart selman。今天我希望跟两位教授一起回顾人工智能过去几十年的发展,并且介绍他们对于人工智能未来十年发展的方向和途径的看法。今天的主题叫“人工智能新的10年”,在谈新的十年之前,请两位先谈一下对过去60年,尤其是过去10年的回顾。
bart selman:这个领域的最初工作主要是由对理解人脑的思维和认知感兴趣的研究人员完成的,在人工智能的早期有很多乐观主义者,但在实际研究过程中遇到了很多意想不到的困难。这个领域在近几十年来纯粹是一门学术学科,因为我们无法在任何可以与人类相比的地方获得很好的成果,第一个转折点是ibm在1997年开发出国际象棋ai深蓝的时候。深蓝在国际象棋中打败人类,这是当时的一个突破。
大约在2012年,多层神经网络即深度学习几乎都改变了整个领域,使得我们可以实现视觉识别和语音识别等任务。人们发现,深度学习算法几乎超越了所有类型的机器学习模型,算力的发展是这段时期改变人工智能领域的原因。2012年,我们让ai实现了感知。我不会说感知问题已经解决,但我们离解决更近了一步。此外,这些技术还能和经典人工智能的技术结合,例如决策、规划、推理等。
张宏江:john hopcroft教授,您能基于bart selman教授的观点分享一下您的看法吗?
john hopcroft:上世纪60年代初,人工智能刚起步。当时约翰·麦卡锡创造了斯坦福大学的人工智能实验室,有大量高素质的研究人员在研究符号逻辑。1964年,人工智能的研究者只能训练单一的权重,原因是根本没有算力,缺乏大型数据集,连手写字符数据集都没有。事实上我拿到博士学位时,才做出了一个包含1000个10x10像素手写字符的数据集,这和今天的数据集相比是很小的,但是在那时已经是很大的了。
2012年alexnet出现了,直到那时图像识别错误率才开始显著下降。alexnet将图像识别错误率从25%降到了15%,这是一个巨大的进步。alexnet有大约8个层级,在2015年图像识别大赛的冠军resnet则有1000个层级,并且它只有3.6%的错误率,而人类识别这些图像时有5%的错误率。这些技术已经被应用到了非常多的领域,如医学、金融等。
张宏江:在上世纪90年代,我们发现经典人工智能方法不管用,现在我们知道是因为没有足够的算力,在过去这几年,由于算力的发展,我们获得了极大进展。那么现在,我们在推理等经典人工智能方法的探索上处于什么阶段呢?
bart selman:我觉得现在人们经常把ai等同于深度学习,或者把深度学习等同于ai。过去十年来我们在推理等算法的研究上实际上已经有很大的进步,并且已经有了实践应用,例如英特尔、微软等企业,只是并不广为人知。在社区中,这些技术也被广泛应用。
alphago是深度学习成功的范例,但实际上alphago使用了树搜索算法,这也是一种符号推理算法。这也是ai领域出现的巨大进步,我们可以组合不同的算法,例如推理、规划和深度学习方法等。
自动驾驶汽车领域在组合不同的人工智能方法的探索上更加开放。当然你也可以尝试用端到端的方法来训练自动驾驶系统,但这太困难了。深度学习一般作为自驾系统的视觉系统,但是控制系统和路径规划系统等则需要更多的经典人工智能方法。
相比较而言,深度学习确实是非常数据驱动的方法,这跟经典人工智能中我们称之为知识的方法不同。知识就像牛顿定律或万有引力定律,人类的认知需要很多真实的知识。而深度学习要获取知识并不容易,深度学习目前如此有效,是因为我们有大量的数据。我认为深度学习下一步需要学会获取知识,这是个巨大的挑战。
张宏江:人工智能是一个非常宽泛的领域,深度学习仅仅是一部分。hopcroft教授,您在过去的50年里,在计算理论上做了很多工作,您愿意和我们分享一下,从理论和算法的角度如何看待人工智能的进展吗?
john hopcroft:我首先再谈论一下深度学习,深度学习真正的意义是在高维空间中更好地识别。比如你在看自行车的图像,深度学习不会告诉你自行车的函数是什么。如果你展示的东西看起来像自行车,但不能让你骑着它去地铁站,它仍然会把它归类为自行车。为了解决这个问题,我们需要将逻辑加入深度学习。
深度学习可以将自行车进行分解,它会告诉你自行车有轮子、链子、座椅、踏板等等。对这些部件,你可以添加逻辑,说踏板带动了链子然后带动轮子,从而自行车可以移动,车头可以让你把控方向和转弯,座椅可以让自行车有运输功能。通过添加逻辑,或许就可以构建关于自行车的函数,这个函数的意义是将一个人从一个地点运输到另一个地点。
关于人工智能理论,单阈值逻辑单元可以用一个非常简单的算法来训练。如果图像集合是线性可分的,那么阈值逻辑可以实现分类。如果图像集合不是线性可分的,应该将集合映射到更高维的空间中,使得集合是线性可分的。关于训练阈值逻辑单元的方式,你也可以不将数据映射到高维空间中,而在原始空间中运行算法,这就是构建支持向量机的技术。直到深度学习发展之前,这是人工智能领域的主要技术。
还有关于过拟合的问题,假设你有一个大型数据集,该数据集告诉我中国所有人的年龄和薪资。我想要问在某个确定的年龄和薪资上有多少人,但是不想保存整个数据集,因为我想把数据集放到手机上。因此我取数据集的一小部分,并且在适当地扩展之后,相信答案会非常接近真值。答案的真假取决于我们要问的问题的范围,并且需要多大规模的样本的数学取决于问题的复杂性。
如果大家对这些数学感兴趣的话,可以看看我所写的书。在这本书的第五章,包含了所需要的数学知识。在我的照片下面写着剑桥(cambridge)的地方,可以得到pdf的链接。
john hopcroftag凯发真人主页:https://www.cs.cornell.edu/jeh/
二、未来10年:数据和知识的相遇
张宏江:selman教授,我们知道您之前发表过美国人工智能研究未来20年的白皮书,可以分享您对ai未来发展趋势以及重点的看法?
白皮书地址:https://arxiv.org/abs/1908.02624
bart selman:我认为人工智能研究的未来趋势是社区化,在业界有很多大型的研究团队在快速组建。美国正在构建国家ai基础设施,为不同的学术研究团队提供试验台。大多数研究项目无论是人力还是财力对于个人都是无法承受的,需要大量资金用于基础设施软件和机器开发,所以必须共享资源,允许协作。除了仍然要强调知识和深度学习的结合以外,我认为自我意识学习是未来人工智能发展的重点。
张宏江:您所说的自我意识学习到底是什么意思?为什么您认为这是未来20年人工智能发展的首要任务?
bart selman:这是一个我们还没有解决的问题。人类能以不同的方式学习,例如我们去学校学习新技能,这相比于数据驱动学习而言是非常不同的类型的学习。人类不需要学习上百个例子就可以掌握新技能。自我意识学习就是指,ai会反省自己的学习方式,然后调整它的学习行为。
例如,ai会反思:我不太明白学习的微积分的知识,我想问一些问题,我想做一些微积分的练习来提高。这个过程中使用的学习例子很少,不需要数以百万计的例子。这些学习风格是人类独有的,而当前的人工智能并没有掌握。
张宏江:当我们回顾过去50多年的历史,人工智能有一个非常缓慢的发展过程,然后10年前深度学习的出现使领域飞速发展。现在要发展自我意识学习,您认为我们还要再花费50年时间吗?您认为自我意识学习中,算力仍然是最重要的因素吗?
bart selman:我认为可能要再花费10年到20年的时间,这很难预测,毕竟一些研究需要基础层面的突破。现在和过去50年非常不同的是,我们已经有了数据,所以我对未来还是非常乐观的。
我觉得算力还是必要的组成。我认为自我意识学习,也就是说将深度学习和知识、推理结合起来,还需要很多新的idea。在机器翻译领域,深度学习做的非常好,可以达到90%以上的准确率。问题是最后的10%的提升,可能需要相当不同的方法。在自动驾驶系统中,机器做出的决策必须是非常准确的,容不得一丝马虎,这样才能确保乘客的安全。所以对于最后的10%的提升,我们还需要做额外的工作。
张宏江:数据和知识之间是有差别的,这我很赞同。hopcroft教授,您可以就人工智能的未来谈谈你的看法吗?
john hopcroft:农业发展需要很长时间,而制造业发展只需要几百年,人工智能只用了50年的时间就发展到了今天的地步。所以我认为接下来的发展会非常快,就像你建立工具来支持更有效的工作。
在未来,我们需要解决可解释性问题、偏见问题、常识问题、责任问题、持续学习问题,此外还包括ai取代人类工作后出现的各种社会问题。
张宏江:selman教授,您对于我们何时能实现通用人工智能有什么见解呢?
bart selman:未来10年,我们将更加注重专业能力。但到未来20年,我们会集中发展常识、知识、真正的语言理解等领域。真正的语言理解,即机器会像人一样阅读。一旦这个问题解决了,人类就能实现下一次人工智能发展的飞跃。机器一旦掌握如何理解语言,对我而言,就相当于实现了通用人工智能。
张宏江:hopcroft教授,您有什么要补充的吗?
john hopcroft:在接下来的10年里,人们可能会聚焦于如何利用工程技术的最新成果解决特定问题。但我们也需要基础研究,甚至是人工智能领域外的基础研究。在过去的25年里,基于人类大脑发育的研究也是很重要的。现在人们知道在儿童生命的头两年,大脑会学习如何学习。在未来,真正的进步可能来源于生物学,但真实情况仍然是不确定的。
张宏江:selman教授,您能否谈谈,美国近期在人工智能的政策上做出了哪些正确的决定?
bart selman:我认为美国做对的决定是,对人工智能领域的研究坚持投资60年,即使什么成果也没有,这是一件非常困难的事情,我们不一定知道下一步的发展方向。
如果我们继续投资于各种各样的研究项目,会得到下一个突破。而如果只是投资到某些喜欢的领域,特别是目前最喜欢的领域,可能不会实现突破。研究突破是革命性的,不是进化性的。我相信这就是人工智能的未来,更大的规模,以及更加协作的人工智能研究项目。
张宏江:您能否也说说中国在人工智能支持政策上有哪些做对的地方?
bart selman:我认为中国在人工智能支持方面做得很好,如果要提建议的话就是,不要局限于一个领域。看看人工智能的历史,有很多非常困难的问题是从人工智能的历史中就提出的,实际上还没有解决。所以我鼓励新一代研究者熟悉历史,走向比数据驱动更广泛的领域,例如类脑学习、one-shot learning等等。除了深度学习,还有一些非常重要的领域,即使你专注于深度学习,也不要太狭隘。
三、给中国研究者的建议
张宏江:您建议允许人们探索不同的领域,即使可能会失败,也可以从这些失败中学习。最后一个问题,你们会给中国的人工智能研究人员提什么建议呢?
john hopcroft:我的建议就是远离指标,中国的研究人员非常感兴趣于发表的论文数量和得到的研究资金数量。远离这些指标,并关注其它的一些更有价值的层面。
张宏江:非常好的建议,所以不要只追求数字。那selman教授,您有什么建议呢?
bart selman:我会建议中国的研究人员多关注有创造意义的研究,并愿意考虑其他人没有考虑到的问题,我也同意hopcroft所提的建议。看看那些没有解决的问题,看看那些最难解决的问题,下一个突破比下一个增量式论文更有价值。
张宏江:非常感谢john hopcroft教授和bart selman教授,我们回顾了过去几十年在人工智能上取得的突破,以及我们对下一个10年的展望。在未来,我们或许会看到,人工智能社区走向全球化,经典人工智能未来可期,并与深度学习协同发展,人工智能的各个领域会迎来百花齐放的盛况,新的突破点潜藏其中,或者在领域之外会带来惊喜。
文章来源于ai科技评论 ,作者青 暮