您所在的位置: 首页- 新闻公告- 新闻人物-

新闻人物

牵起科技与人文:我们在人大研究人工智能 | 人物
日期:2022-11-21访问量:


来源:青年人大

深厚的人文社科底蕴是人大的传统优势,而依托这一优势建立的新兴理工科正显示出巨大的活力与潜能。从1978年“开信息之先河”的经济信息管理系的成立,到2013年后以“数据”为基础的人工智能团队的形成,40余载的积累,终有2019年高瓴人工智能学院的正式成立。

以更加包容多元的人文精神为指引,学院师生怀抱“为全球思考并创造‘智能而有温度’的未来”的理想,勇探科研“无人区”,3年来成绩斐然,“文澜”模型即是其中的代表。该模型由文继荣、卢志武、宋睿华等领衔的团队研发,能很好地联系中文语义与视觉信息,尤擅读取中文特有的含蓄语义与图片的抽象概念,被誉为迈向通用人工智能的关键一步。

“文澜”兼具前沿科技的力量和人文感触的温度。它牢牢扎根人大沃土,蓄力探向世界苍穹。接下来,让我们一起走近“文澜”研发团队,一览科研硕果孕育、诞生、成长的精彩旅程,共悟人工智能与人文情怀的相助相融。

1楼.png

高瓴人工智能楼外景。(图片来源:“人大高瓴人工智能学院”微信公众号)

缘起:“做有温度的人工智能”

“孤陈的城市在长夜中埋葬/他们记忆着最美丽的皇后/飘零在西落的太阳下/要先做一场梦……”2017年5月,微软旗下的人工智能“微软小冰”出版了第一部诗集《阳光失了玻璃窗》。关于人工智能与人类关系的讨论再度升温。作为“微软小冰”团队的首席科学家,宋睿华一度成为了国内人工智能领域的焦点人物。

但2020年9月,宋睿华选择离开微软,正式加入高瓴人工智能学院。谈及原因,她特别提到了文继荣在学院成立仪式上提出的愿景:发展“有温度的人工智能”。这恰与宋睿华的研究理想一致——让人工智能从机械的、绝对理性的数据比对分析,转变为带有灵动维度和丰沛情感的“思考”。人大有坚实的人文社科基础,正为人工智能的发展提供了扎根的土壤。

2成立大会.png

高瓴人工智能学院成立大会现场。(图片来源:“人大高瓴人工智能学院”微信公众号)

此外,实现这一愿景所需要的“勇闯无人区”的魄力也深深打动了宋睿华:“我的内心有一种热情,就是希望能够在一个机构处于发展初期、有无穷可能性的时候加入它。”在认同的基础上贡献自己的一份力量,去建设共同的梦想与文化。于宋睿华而言,这是一件极具意义的事情。

2020年10月,在文继荣的带领下,团队初步组建完成,开始研发多模态模型。通俗来说,多模态即多感官。人要想好学一门语言,若不调动多个感官去看、去听、去触碰,则很可能无法理解语言文字的确切含义。人工智能亦然。所以,作为大规模中文多模态预训练的研究过程,“文澜”在诞生前已与人类身体的感知力紧密相连,蕴含人文温度的伏笔已悄然埋下。

3 文澜团队.png

“文澜”团队的主力老师,从左到右依次为金琴、宋睿华、文继荣、卢志武。(图片来源:“AI科技评论”微信公众号)

文澜:AI中的人文温情

2021年3月,基于对3000万图文数据集的预训练,第一代“文澜”——图文互检模型(BriVL)正式问世。而这一人工智能所蕴藏的人文温情,从名称中便已经能窥见一二。

“文澜”之名来自浙江杭州西湖孤山南麓的“文澜阁”,后者是清代珍藏《四库全书》的七座皇家藏书楼之一。实际上,和“文澜”同期启动的其余3个大规模预训练模型“文源”“文汇”“文溯”,其名称都取自这七座藏书阁。宋睿华还补充道:“大家一看到‘澜’字就会有‘眼底有波澜’的浪漫之感,恰好我们的模型又跟图像有关,所以这个名字实际上包含了一种视觉的意向。”科研者充满文心雅趣的巧思不由得令人会心一笑。

4 文澜阁.png

文澜阁匾额。(图片来源:搜狐网)

以图文互检模型为基础,“文澜”团队开发了H5小应用《AI心情电台》。在这里,只要给AI(Artificial Intelligence,英文缩写为AI)小精灵“布灵”提供一张图片,它就可以为你匹配一段合适的音乐。

但是,“文澜“团队并不满足于暂时的成功。仅仅3个月后,基于对6.5亿弱相关的图文数据集的预训练,“文澜2.0”(BriVL-2)诞生了。通过模仿孩子探索世界的方式,AI可以实现像孩子一样思考。《布灵的想象世界》便是基于第二代文澜多模态模型的生动应用——只会读图选歌的“布灵”长大了,学会了为朋友圈的文案配图这一更高难度的技能。

5布灵的想象世界.png

扫描《布灵的想象世界》小程序二维码,体验“布灵”为文字配图的神奇技能。(图片来源:“人大高瓴人工智能学院”微信公众号)

而2022年6月,聚焦视觉、文本、音频的多模态预训练“文澜3.0”正式面世。这一次,“布灵”已经学会了剪辑!基于第三代文澜模型自动剪辑的视频《稻香》MV被投放到短视频平台后,颇受网友们的欢迎。截至目前,该视频在“抖音”平台上的点赞量已达14.2万。此外,通过把文本生成国画,AI不仅画出了古典艺术的温度,更画出了文化传承的光芒。

“布灵”也迎来了新的小伙伴“麻里”,它一经研发,立刻圈粉众多。“麻里”同样是基于文澜模型自主驱动的AI,宋睿华团队赋予了它对话和交互的能力,使它不仅能对视觉内容进行深度理解,还能模拟人的心智对获取的视觉信息产生反馈。AI像是睁开了眼睛,和我们共生共存。比如,当你在“麻里来陪”小程序中上传一张电脑屏幕照片时,它会如此调侃:“单身不可怕,可怕的是单身还要加班~”不过,“麻里”尚处于测试阶段,让我们一起期待它正式推出的那一天。

尽管AI还未脱离从统计中寻找规律的状态,距离自主学习的目标仍有很长的路要走,但“文澜”团队目前进行的多模态模型的落地,尤其是图文弱相关和双塔结构的建构,从视觉、听觉等多感官方面,都让AI对自然语言的理解上了一个台阶。相信在“文澜”团队的耐心“教导”下,AI可以通过多模态学习逐渐走上自己的“思考”之路。

悟道:那些关于科研的“独家记忆”

累累硕果背后,是“文澜”团队所付出的巨大的艰辛与努力。这里不仅有专业师者的引领与支持,还有一批批优秀学子求知若渴、学以致用。“文澜”带给他们的,绝不只是专业能力的精进。某一刹顿悟带来的无穷动力,某一次并肩作战带来的友情升温,某一场深度谈心带来的思想转变……都是他们在“文澜”项目中收获的“独家记忆”。

6宋睿华和小组成员.png

宋睿华和她的小组成员们在教师节相聚。(图片来源:受访者)

高瓴人工智能学院2020级硕士研究生温静远和同组的博士研究生们原本在生活轨迹上并无交集,但却因项目结缘、结谊。众擎易举,这段经历让他看到了团队凝聚力在科研中的重要作用,也让他相信科研路上的自己绝不是孤军奋战。而高瓴人工智能学院2020级博士研究生高一钊则很感激做项目时的高压经历给自己带来的能力蜕变。不断迫近的ddl(deadline)、无法结项所面临的风险、逼仄的试错空间……他见过凌晨三点的天空,也无数次与代码共眠。终于,他成为了那个自己一直向往的愈难愈进、身经百战的勇者。

科研并不意味着“一条路走到黑”。有时如能及时作出灵活调整,反会有柳暗花明之乐。高瓴人工智能学院2020级硕士研究生孙泽龙曾经十分爱钻牛角尖,只知埋头苦干,但常常在最后验证效果时才发现“此路不通”。在老师卢志武的点拨下,他逐渐学会了转变思路、开辟新的突破口。“原来中途易辙可能是为了另辟蹊径啊!”他笑言。

“文澜”团队中的许多学生也都提到了参与项目带来的思想格局的进阶。谈及接到在Nature子刊上发表文章的任务时的心境,高瓴人工智能学院2019级博士研究生费楠益坦言:“当时没想到最后真能发刊,所以反而挺平静。”然而,通过精心打磨,文章最终成功发表。那一刻,他突然领悟到,只要脚踏实地、不懈努力,目标绝非遥不可及。

7 nature发文.png

高瓴人工智能学院教授卢志武、孙浩、文继荣作为共同通讯作者在国际综合期刊《自然·通讯》上发表的研究论文。费楠益为第一作者。该论文尝试利用多模态基础模型迈向通用人工智能,是“文澜”项目的重要成果,或将对各种“AI+”领域(如神经科学和医疗健康)产生广泛影响。(图片来源:“人大高瓴人工智能学院”微信公众号)

高瓴人工智能学院2020级博士研究生杨国兴则将在“文澜”项目中收获的思维的拓展视作“科研给予我的馈赠”。他一度认为学生时代的科研和实际生活存在着某种割裂。但在老师卢志武的引导下,他逐步走向以现实为导向的研究,尝试着为科学理论和实际应用搭起桥梁,让手中的科技充满生活气息和烟火味。

AI:科技与人文共建的未来

未来将至。从“文澜”的瞳孔望出,未来的人工智能时代会是怎样的呢?

谈到这一话题,高瓴人工智能学院2020级直博生孙宇冲冷静而又自信地说出了自己的理解:“要做活的AI。”他认为AI会拥有自己独特的“人格”,能够真正像朋友一样和人交流。高瓴人工智能学院2021级直博生吴宜函则补充道,AI除了要具备理性的计算能力与感性的理解能力,还应像人一样感受和参与社会——“AI会让世界有温度,以自己的力量给予世界帮助。”

8孙宇冲.png

孙宇冲曾在研究生沙龙做关于“图文预训练模型学习”的报告,而这张海报的素材正是在文澜-多模态预训练模型的基础上,通过纯跨模态检索获得的。(图片来源:“人大高瓴人工智能学院”微信公众号)

以艺术为例。AI不仅能拓展艺术的影响力,还能为其注入新的活力。在最近的一次会议上,有评委向孙泽龙提出质疑:“AI又没有达到大师的水准,有必要让它来根据古诗词画国画吗?”孙泽龙一时被问住,但之后与另一位评委的交流启发了他:“AI的画技或许没有大师的那么好,但一定能比大师画得多,能让好的艺术被更多人接触,真正成为大众的艺术。”孙宇冲也憧憬,未来AI会在歌曲创作、文学写作等领域展现出更有新意的一面,帮助人文自我完善,为人类创作提供新的思考与启发。

9 文澜作画.png

AI根据古诗词绘出的国画。画和诗词的契合度非常高。(图片来源:“人大高瓴人工智能学院”微信公众号)

不过,在期待人工智能时代的美好未来的同时,我们也应当意识到科技的发展带来的人文挑战。2021年,中国人民大学文学院依托高瓴人工智能学院推出的“布灵”,开展了一次“人工智能与文学创作”的对谈会。人工智能写作能否超越人工创作?算法开发者是否应该为文本真实性负责?诸多问题引起了大家的热烈讨论。

文学院党委书记颜梅在总结时指出,人工智能和文学创作是“和合共生”的关系,都是为了追求“活的AI”“活的文学”。“人工智能也在不断探索、熟悉、改进和世界交流的方式,打开算法时代的情感、文学的拓展路径,以此来促进人类对知、情、意的重新理解。”

9对谈.png

“人工智能与文学创作”对谈会现场。(图片来源:“中国人民大学文学院”微信公众号)

所以,人工智能与人文情怀并不存在根本对立。宋睿华表示,以往的一些宣传方式可能会让大众对人工智能产生天然的戒心,认为它终会取代人类。但实际上,这只是一种附着了人类情感、人类矛盾的想象。人工智能的最终方向仍需靠善意、温暖的人文思想进行引导。温静远也认为,人文知识是人工智能创作的起点和源泉。首先得做一个有健全三观的人,才可以去研究和解决具体的技术问题。科技和人文应互相促进、共同进步。如此,方能赠与未来无限的珍宝。

“有温度的人工智能”本身就蕴含着人文的光辉——不被技术中心主义的评价体系绑架,不浅近而盲目地追求“强”,而是考虑实际效果,思考AI还需怎样的特质才能更好地满足人类的真正需求。只有具备人文关怀,科技研究才能走得长久,走得稳妥。

以文心为水墨,以科技为绘笔,人工智能勾勒着人类智能时代的线条,正徐徐铺展开一幅科技与人文交融的壮美长卷。

检测到您当前使用浏览器版本过于老旧,会导致无法正常浏览网站;请您使用电脑里的其他浏览器如:360、QQ、搜狗浏览器的速模式浏览,或者使用谷歌、火狐等浏览器。

下载Firefox