探访智源创新生态:不焦虑、不内卷能拿图灵奖吗?
2019北京智源大会邀请到包含中国、美国、英国、日本、加拿大、新加坡、荷兰等百余位人工智能领域顶级专家学者,共同探讨人工智能未来在技术、应用、产业等领域的发展
● ● ●
智源之源:花甲之年的自我挑战
“现在我们有这么多(科研)资源到底该怎么利用好?怎么能够不去做低层次的重复、跟进,而是自己找到原创性的突破点?”
张宏江平静讲出的这一问题,不知萦绕在多少关注中国科技创新体制改革的人心中。
过去三十年,他横跨学术、工业二界,不仅曾执掌微软亚洲工程院与金山集团,而且长期在计算机科学领域h指数榜上位列中国大陆榜首。然而就在宣布退休两年后的2018年底,张宏江又和一家雄心勃勃的新型研发机构—— 北京智源人工智能研究院联系在了一起。
在北京ai圈子里,智源已为很多人所熟知。这家民间非盈利组织,由北京市科委和海淀区政府推动成立,大胆地将自己定位于国际人工智能创新发展的源头。其最初的设想,正是来自于张宏江的一次即席发言。
2018年6月,在怀柔科学城专家座谈会上,张宏江将自己推动人工智能突破性研究为主题的诸多想法倾囊而出,立刻得到了学术界出身的北京市市长陈吉宁的关注与共鸣。会后,陈吉宁拉住了张宏江,希望他能在整个北京市层面对ai的发展给出一些建议。
彼时,经历了人脸识别算法超越人类、alphago 击败李世石等里程碑事件,各国都已意识到了人工智能的战略意义。作为一项通用技术,它被认为是新一轮科技革命的核心驱动力,有望推动社会生产力再一次大幅跃升的同时,也将不可避免地重塑经济结构与各行业格局。
如何在新一轮的科技革命浪潮中占据领导地位,是诸多国家政府报告中的高频关键词。
对北京而言,发展人工智能的这一战略的焦虑与愿望同样强烈。在2018年,历经几代研究者不懈努力和政府长期投入,她已是中国当仁不让的ai研究与产业中心,拥有全国45%的ai高层次学者与28%的ai企业,更有清华、北大、中科院三所全球ai顶会发文量前五的科研机构,和世界领先水平基本同步。
张宏江和他共同发起智源的伙伴们非常清楚,今天的北京只能说在ai上“跟得很好、用得很好”,但自己做出来的突破性研究还太少,而这才是在复杂形势下引领国际潮流、缔造历史的重中之重。
“传统科研机构贯彻于人才评价各环节的唯论文导向,严重制约了学者自身创造力的发挥”,究其原因,张宏江认为—— 这一制度虽然帮助中国在短时间内实现了与国际学术界的接轨,但已不再适应原始创新的新时代目标。
“同时,不同院系、方向间的鸿沟日益加深,使跨圈协调合作愈加困难,进展停留在小圈子内而难以形成系统性突破—— 这对于高度学科交叉的ai来说尤为致命。” 张宏江谈道。
如果不 “唯论文”,我们该如何评价并激励人才?如果跳出院系、方向的 “盒子”,什么样的机制能够让互不了解的研究者们擦出火花并长期合作?
张宏江建议在现有体制之外,使用增量的资源试验一种新机制来解答上述两个问题,而这一愿望与北京的希冀不谋而合。
于是,在组织学术界与产业界专家进行多轮讨论后,北京市形成了组建智源研究院的方案,希望打造一个跨院所、跨高校、跨企业的共享平台,推动北京人工智能研究的突破以及成果转化,并设置了保持北京在中国ai领域领军地位的底线以及5-10年成为全球ai创新策源地的目标。
不设具体考核任务、不设明确指令目标,去探索一条科技创新的新路子,这是北京市对智源充分的信任与支持。
如今,智源正式成立已有两年。它做了些什么?运行的如何?是否靠近了自己的创新理想?一线科研人员怎么看这个 “高调门” 的新机构?
带着以上种种问题,《知识分子》近日走访了智源人工智能研究院,对其管理团队、研究人员以及青年科学家等参与者进行深度访谈,并观摩年度论坛,以解剖探求其创新机制以及挑战。
用内行的方式做事:小圈子里优中选优
究竟怎么做好一个驱动ai创新的平台?
建设之初,智源管理团队对这个问题的回答并不完全清晰。智源最为确定的是,人才是后续一切事情的根本。参考了贝尔实验室与施乐parc的成功经验,智源希望首先找到最好的人,并给予他们充分信任与资源支持,一如北京市政府对他那样。
于是,在研究院成立五个月后,智源学者计划 “横空出世”。
不同于各地愈演愈烈的 “抢人大战”,智源并无意做体制内院校的竞争对手,而是希望成为一个服务全市ai发展的平台。因此,该计划并不需要被选中的学者离开现有岗位,而是施行双聘制。同时,考虑到此前科研经费资助中 “人头费” 比例较低、青年科学家待遇偏低的问题,智源将给入选者的每年资助费用分为两个50%—— 一个50%是直接打入个人账户的双聘补贴,另一个50%是科研工作所需的经费支持,其中科研经费使用负面清单管理,只要不是捐助、投资、赞助、罚款、在职教育等目的,均可自由使用。
“我们希望给智源学者们提供全面的保障,让他们能够在没有后顾之忧的情况下安心探索。” 智源研究院院长黄铁军解释说。
如此优厚的条件,究竟谁能入选?应设置怎样的选拔标准?怎么考核被资助者?
一连串问题接踵而来,这些也是过去近二十年里科研人员意见最为集中、讨论最为激烈的几个核心问题。
写 “基金本子” 不仅要求申报者阐明研究的问题,还要提前决定技术路线、预测成果、意义,甚至实验猴子的数量,占用了大量研究者时间,更是被研究人员诟病 “不科学”,他们疾呼 “创新不是规划出来的”。资助对象的遴选同样充满争议,智源 “自然语言处理方向” 首席科学家、清华大学计算机系教授孙茂松就表示,基金评审一般找的都是大同行专家,他们很难对每个研究方向都了解透彻,这就会漏掉一些本来很好的项目;而 “唯论文”、“唯人才帽子” 等 “五唯” 标准的问题更是老生常谈。
对于上述弊病,智源管理团队有着一个清晰的共识—— “这些都是外行管理和评审造成的问题。” 设计管理制度的人不了解科学研究、应用研究、工程项目各自的规律导致所有项目管理变得像建筑工程一样;评审人不熟悉被评审人的具体研究方向和工作,导致只能靠被引量、发文量等外部指标进行判断。
“其实找最优秀的人反而是简单的,一个领域内的小同行对各自水平基本都是比较清楚的。” 在今年6月接受《知识分子》访谈时,张宏江曾这样解释如何遴选人才。
因此,智源在人才遴选和过程监督上选择了一条更 “简单” 的路径 ——价值观导向下的小同行自治。
具体而言,智源专家委员会首先选择出每个重大方向中一名学术水平和信誉都是同行公认的战略性科技人才作为首席科学家,由他负责推荐一批水平顶尖和有良好信誉的小同行作为 “智源研究员” 候选人名单,他们再共同遴选出一份他们认为具有成为 “智源青年学者” 资质的候选人名单,并参考智源学术副院长唐杰主导开发的aminer科研情报系统的数据。智源会提醒所有提名人宁缺毋滥,毕竟最终决定智源学者的含金量的,是名单上相对比较弱的人选。
随后,两份名单会被提交给智源院务会,根据简历、论文内容、现场展示等进行严格的选择。
这一过程中,管理层追求突破性研究、重视想法和质量胜过数量、重视未来潜力胜过已有成果等价值观会渗透其中,同时为了维护生态的健康,还会在同一小方向、同一导师学生中优中选优,避免内部过度竞争或派系垄断。
以自然语言处理方向为例,智源青年科学家、清华大学计算机系副教授刘知远告诉《知识分子》,同期参加现场答辩的十几名按普通标准来看已经非常优秀的候选人,最终只入选了4-5人。
“如果发现一个人在名单里带了太多自己的学生或熟人进来,研究院一定会把关告诉他只要一两个作为代表就够了。” 谈到遴选过程,黄铁军说,“我们确实没有一个绝对的标准,但发了一堆论文却无自己思想的人肯定不会入选,选出来的人一定是在一个水准之上的,可以说对于每一位智源学者,我们也把自己的信誉压上去了。”
信誉同样在智源学者选定后的过程监督中发挥着至关重要的作用。
在制度设计中,每位智源学者都有自主选择方向、更改方向的权力,也无需在资助期完成特定数量的论文或专利等成果,但是每年两到三次的小同行正式会议分享自己的亮点工作,以及每周难以计数的非正式交流,却产生了强烈的同行压力,对学者们有着更强的监督督促作用。
“很多人也许会在背后吹牛,但真要是和小同行当面讨论的时候,我相信大多数人是会很小心的,因为彼此非常了解。”张宏江这样解释道。
孙茂松同样认为,这样的小同行监督有着非常积极的作用,“我们之间不是硬碰硬的那种压力,但几个优秀的学者聚在一起一定会有一种不服输的劲儿,看到别人今年做出了一个不错的东西就会激励自己做得更好,而不是偷懒。”
今年,智源又扩充了 “智源探索者”、“智源学术新星” 与 “智源博士后” 三个层次的 “智源学者计划”,着力于为北京引进和培育一批具有全球影响力的ai顶尖团队,构建梯度合理的人才储备。其中智源探索者支持有意到北京发展的各国人才,不定单位,随进随出;智源新星专门支持33岁以下、博士毕业5年内的青年学者;首批智源博士后则包括智能系统、认知图谱、智能医疗和前沿交叉四个方向。
星火燎原自下而上:组织的力量
当优秀的人被给予足量的资源与充分的自由进行探索,创新就一定会发生吗?问题就解决了吗?
对于这一问题,智源管理层的回答在过去一年发生了较为明显的变化。
基于人工智能研究应用性强的特点,黄铁军参考计算机与移动互联网的发展历史,在智源愿景描述的最前面,加上了“建立自由探索与目标导向相结合的科研体制” 。如今这十几个大字醒目地展示在智源每层办公室的电梯口。
谈及这一转变,黄铁军形象地解释道:“自由探索可以带来的是想法出现的火种,但对于ai实现而言,并不是有了想法、发了paper就一定能够实现,这背后需要组织的力量把它工程化地变成一个系统。如果没有组织提供这样的环境,那火种很可能也就熄灭了。”
在他看来,人们在回顾每次工业革命历史时,都会更多关心原创性想法的提出者,而忽视了背后促使其演变为系统、最终产生巨大社会价值的组织。以电信系统为例,意大利人马可尼进行跨越大西洋的无线电通信实验获得了最大的声望,但真正将其推动成为系统的,是贝尔实验室背后一群能力、兴趣各异的人,围绕着同一个目标所做的大量工作,其中又产生了包括晶体管、移动电话技术等等催生下一代创新的重要发明,以及新一代的研究者。
当然,无论是在几次技术革命的历史背景中,还是智源当下的话语体系下,这种 “目标” 都不是 “十年研制成功原子弹” 式短期、具体的目标,而更接近愿景。
愿景式的长远目标会鼓励自由探索。美国国防部高级研究计划局(arpa,即darpa前身)信息处理办公室主任利克莱德提出的 “arpa梦想” 就是一个生动的例子,它促成了图形用户界面、以太网、面向对象编程、激光打印机等重要应用问世。
当一个开放的愿景出现时,研究人员会注重协同地发挥他们的创造力,相互启发,定义自己需要解决的问题,选择某种技术路线,甚至发明解决问题所需要的工具—— 比如编程语言。这正是智源期待通过自由探索和目标导向相结合所实现的氛围。
具体到操作层面,黄铁军介绍说,智源生态中每个 “重大方向” 下确立的小 “目标” 也并非是院务会拍脑门子想出来的,而是小同行全员讨论过程中自下而上逐渐形成的共识。
例如,自然语言方向就在过去一年确立了 “大数据与富知识双驱动、跨模态的自然语言处理理论、方法、系统” 作为长远的 “目标”。
方向首席科学家孙茂松认为,在这一 “目标” 下,智源学者们不再只是分散地为自己的文章努力,而是聚焦在一个统一的愿景上,并自然错开研究方向,频繁相互交流反馈,形成来自组织的合力,甚至还有学者在熟悉了以后一起申请国家项目,将影响扩散至智源外。
如此,“目标导向” 的另一个重要作用,就是它帮助小圈子内的智源学者们建立了更为活跃、稳定的互动渠道。
传统的学术会议虽然能够在短时间内快速增进参与者间的了解,并促进相互启迪,但在缺乏共同目标与协调的情况下,这样的联结往往是短暂的、零星的,它极易在会议结束后数日消散,几名研究者偶然形成的研究合作也很难在整体上影响整个领域的学术生态。
“经常的情况就是,3-4年时间后大家一起做的项目结束了,人也就散了。” 孙茂松如是介绍道。而在一个共同愿景下,成员间持续交流的意义与必要性显著上升,且不会局限于某一具体项目的时间、内容范围。
对于任何组织而言,在谈论未来时对不同个体基于职级、资历、派系等无关因素而对想法进行筛选、屏蔽都会消灭一种可能性,并因此错失机遇。施乐管理层对parc研究中心成果alto(被认为是世界第一台个人电脑)商业化的拒绝导致其最终无缘pc市场便是一个惨痛的例子。
在形成愿景、实现愿景的过程中,对每一个体赋予的平等尊重与包容,是智源式“目标导向”的重要特征。
36岁的智源青年科学家刘知远举了一个例子。“我最近在依托智源的资源实现一个中文的语音训练模型,他们直接就同意了,给我提供了特别大的算力平台,也没说我是青年科学家就不行,必须得找一个资深学者。”
与此同时,黄铁军表示,智源不会将部分人形成的愿景共识与分工强行贯彻到每一位学者脑中,愿意在自己思路下自由探索的智源学者仍可继续保有这种独立性,并获得智源的资源支持,保留学术研究路径的其他可能性。
作为一个组织,智源所能够提供的资源除了经费、同行联系,还有什么让研究者受益最深?我们接触的多位受访者给出了同一个答案—— 打破圈层的平台。
智源青年科学家刘知远直爽地说道:“钱其实都没那么重要。我更看重的是智源提供的高度交叉的平台。我们计算机协会已经够大了,但最多就是包括一些数学家进来,搞神经科学的基本都不会打上交道,而智源给了我这样交流的可能性。”
在他看来,人工智能本就是一门交叉学科,历史上也有大量突出贡献是由其他学科的学者做出的,因此破圈的碰撞是至关重要的,他本人就通过与脑科学家交流了解到人脑抗噪音干扰的机制而备受启发。
无独有偶,在智源论坛的一个 “前沿交叉圆桌” 上,孙茂松和来自脑科学等领域的学者进行了交叉合作的探讨。他直言一次会议不过瘾,希望能和一群脑科学家关在一个小镇十天,把这个学科的最新进展和基本理论了解清楚。
而智源最新发布的 “人工智能的认知神经基础” 重大方向则是这一跨界交流的集大成者,它包含来自认知神经科学、生物医学工程、计算神经生物等多元背景的成员,致力于揭示生物智能系统的精细结构和工作机理,构建功能类脑、性能超脑的智能系统,为ai未来发展探索可行道路。
“他们几个就是受到智源这样的资源和环境吸引,慢慢聚起来的。” 张宏江兴奋地说道。在他看来,这样尺度的交叉融合在传统科研机构中很难实现,因为缺乏机制跨校调配资源,而这些以交叉为研究兴趣的科学家在既有院系划分下往往属于各自团队中较为冷门、话语权较小的成员,很难聚起相应研究的资源。
而智源的理事会成员背景也是多样的,比如有神经生物科学家鲁白,他们一开始便以促进学科交叉为己任,而智源研究院的环境也让他们如鱼得水,实现了跨界生态的有机生长。
在良好的社区氛围背后,少不了专业运营团队的支持。目前,智源十几人的运营团队由美团点评技术学院院长刘江带领,负责学术活动组织和社区建设。张宏江直言,他找刘江来做运营副院长,就是看重其社区运营经验,并从最开始就把社区看作智源的核心组成部分。
现实里,很多学者即使办公室在同一层楼也不见得有很多交流的机会,也不知道对方最近具体在做什么。社区运营团队的重要工作之一,就是通过汇集于研究院的信息,识别出当中有可能产生火花的链接。
智源每1-2个月定期举办交流活动,但所有事务性的工作都由运营团队负责完成,而学者只需专注于学术交流。
每年都为组织学术会议而挠头的刘知远对这样的支持很感激。他所在的中文信息学会目前和智源合作举办会议,省了很多事。“我们中文信息学会的工作人员也就四五个,每次年会都要依托一个单位花费大量精力去处理,可还是会担心显得山寨。而智源社区团队做得非常专业,大家有目共睹。”
总结来说,生态形成初期,研究院运营团队从全局出发的主动干预,帮助学者打破了学科分化造成的信息壁垒,创造交流意愿与机会,辅以事务性工作的包揽,显著降低了学术交流的门槛,使其发生频率得以大幅提升,从而帮助智源将分散的各个 “水塘” 形成蜿蜒的 “流水”。在这一系列过程后,智源生态得以有机地自我成长,不断延伸出新的联结与新的自治小圈子。
摸索中的产研合作
在今年6月接受《知识分子》访谈时,对于智源将如何促进ai领域产研融合发展这一问题,张宏江曾坦率表示:“这个事儿说实话我还没想清楚。”
时隔几个月,智源已挂牌成立六家创新中心,并先后确立了其中四家的研究内容与中心主任。例如,由院长黄铁军领衔的高性能神经计算技术创新中心旨在研发neui系列神经计算软硬件一体化系统,实现面向精细模拟生物神经网络的可视化建模仿真的软硬件一体化ag凯发真人的解决方案。
挖掘技术商业价值,成为促进北京人工智能产业发展的杠杆,常务副院长曹岗这样介绍智源创新中心的使命。
他将创新中心的支持项目对象分为了两类。第一,经过与企业讨论根据行业现实需求形成的应用研究项目,这类项目一般具有高竞争行业壁垒潜力或极为广泛的落地场景,解决具体的智能化应用问题;第二,对已经具有一定成果,但尚未找到可行商业化路径、形成产品的技术进行孵化,创新成本高、周期长、风险大,但一旦成功将会产生巨大价值。
他介绍,对于这两类项目,创新中心都会给予全方位的服务—— 在提供雄厚研发资金支持的前提下,开放来自合作企业、医院的数据集与算力资源,打造通用技术平台,对接北京市内包括政府和合作企业在内的各类应用场景。作为组织者的智源,不会对由此产生的成果有任何知识产权或股权的要求,而是将利益分配完全放手交给两个合作方进行。
智源的发起单位中有百度、旷视、美团、小米和字节跳动5家北京企业,但这并不会影响它的开放理念。在智源的生态中,不会基于某家或者某几家企业的利益而限制其他单位的参与,而是坚定做政府、产业和学术界间的中立者,并希望充分发挥这种特殊站位带来的开放和资源聚合优势。
“我们和京东建立了联合实验室,智源学者中也有滴滴等企业的科学家。假如有一天腾讯、阿里或者拼多多把总部迁到北京来,智源也会很乐于和他们合作。”同时担任美团技术学院院长的刘江肯定地说道。
可以看到,研究体系中追求突破性成果的价值观、自下而上的目标确立方式,以及与强大组织力量构建合作平台的开放性,在智源创新中心得到了保持。但与此同时,利益更为错综复杂的企业与医院ag凯发真人的合作伙伴,能否根据预期收益对等开放自身资源或投入研发人才、竞品企业是否愿意接受与彼此共享技术成果,智源作为第三方又可以如何保障合作中各方的权益,这些还尚待观察。
曹岗也坦承,目前创新中心的工作还在起步阶段,项目数量不多,如何找到各方合作中的共同利益点,保证收益共享将是今后工作中更为深入考虑的问题。
张宏江向《知识分子》透露,智源的合作资源在今年有了极快的增长,北京市一批医疗机构,都将以某种形式参与到新建的智慧医疗创新中心的工作中。另一方面,唐杰表示,智源也在积极地探索如何在数据不离开本地的前提下应用多方数据源进行训练,从根本上降低数据互通共享的门槛。今年,智源就研发了联邦学习多方安全计算平台 sonobreastx,基于乳腺癌数据集进行智能医疗领域联邦实验,在医疗数据共享关键技术上实现了突破。
对于未来,张宏江期待智源能够以某种方式与合作企业共享创新生态所创造的价值,自然地获得来自产业界的反哺,但具体方式仍在讨论探索中。
访谈最后,回到那个问题—— 不焦虑,不内卷能拿图灵奖吗?张宏江给出了一个具有鲜明智源风格的回答,“我们做的所有事情都是为了提升概率,历史上多数的研究成果的出现都是偶然事件,没有人能够规划出来,但我想智源至少在让北京出现突破性成果的概率在增加,我希望人们更多地把智源看作是一种尝试和努力。”
“当然”,他顿了顿,“我想接下来的两到三年里,你会看到更多可以量化的突破出现,虽然我很不喜欢这个词。”
访谈后记
继上一次《知识分子》对北京市新型研发机构的扫描式报道之后,终于有了解剖一只 “麻雀” 的机会。
今天的智源,既不是一家资助机构,也不像一家研究机构,而是正在迅速发展为一个开放、互信、拥有密集联结的ai创新生态。中国本土的第一位图灵奖得主是否出自智源可能并不重要,重要的是,这个新兴的研发机构,是否能真正改变ai人的思维与交互方式,是否能成就今天北京ai发展的更多精彩传奇,是否能为中国创新驱动发展转型探索提供一个好的样本。
访谈中令人印象深刻的是,智源将内行判断与追求突破的价值观作为其人才选评的核心,在保障物质生活的前提下,以“智源学者”为抓手召集起了一批具有一致愿景、一致水准、互惠互补的生态核心成员,构成了智源作为一个组织自上而下强大的使命感,并在每一个方向内部形成了信誉驱动的自主治理体系,为后续各部分有机的发展打下了坚实基础。这一看似宽松无序的体系实则高度权责统一,当不合理的指标、任务被剥离,制度再无法作为选才失败或研究平庸的挡箭牌,学者最为看重的小圈子信誉构成了一个躲不掉、骗不过、经不起的高效监督、问责机制。
两岁的智源,它像一个朝气蓬勃的少年,充满了可能性,但是,也存在不确定性。
小圈子自治模式无疑是高效的。但当 “智源学者” 体量扩张到临界点,必须得有人出局的时候,一起努力多年的 “老学者” 们,还能像今天一样直白地做出决定吗?今天智源的 “目标导向” 是自下而上的宽泛愿景。但当某一 “重大方向” 的发展路径日渐清晰,或是其他的最新突破成果构成了战略需要,智源还能够在“目标导向”下为学者留出更多自由探索空间吗?
在人工智能这一仍处在探索期的特殊领域,很多问题还停留在愿景层面,技术路径并非特别明确,限时限路径的目标是否还会取代 “愿景”?智源所积累的制度经验能够推广到其他领域吗?
如此诸多假设,都是“老眼光” 看 “新问题“,其真伪与答案并非我们今天所能够预测,新型研发机构如何 “常为新”,可能不只是智源需要面对的问题。但可以看到的是,科技体制的增量改革和创新探索,已经展露出积极的特质。期待一个创新的生态在未来拨云见日。
制版编辑 | 卢卡斯