您所在的位置: 首页- 新闻公告- 学院新闻-

学院新闻

中国人民大学召开Sora主题AI学术思辨会
日期:2024-03-25访问量:

2024年3月20日下午,由教务处和高瓴人工智能学院主办、实验室管理与教学条件保障处协办的Sora主题AI学术思辨会在立德楼智慧教室举办,教育部高等教育司一级巡视员宋毅、课程教材和实验室处处长刘永强,北京市教育委员会高等教育处处长刘霄等一行现场观摩。

高瓴人工智能学院文继荣院长等学院十余位教师参加思辨研讨。会议主题为“智能还是伪装?Sora到底懂不懂物理世界”,包含了两个学术报告和两个辩论议题。会议由准聘副教授刘勇主持。除主会场外,思辨会还在立德楼和苏州校区增设两个分会场,实现了中关村校区和苏州校区的同堂上课,吸引了跨校区师生同步参与。

思辨1.png思辨2.png

讲座伊始,教务处处长吴健发表讲话。吴健对高瓴人工智能学院近年来取得的丰硕发展成果表示赞赏。她表示,以Sora为代表的人工智能技术快速发展带来了深刻的社会变化,也给教育领域带来了深层次、多场景的变革。技术的爆发,很容易让人们在真实与不真实、确定与不确定的“幻境”中迷失,这也是这场思辨会召开的原因,希望能够通过思辨帮助大家更好认识技术发展的趋势,在“幻境”中明确方向。此外,学校将持续关注人工智能对人才培养方式带来的深刻影响,注重培养学生应对技术变革的能力,未来将开设一系列相关讲座和课程,帮助学生提升数字素养、开拓技术视野,强化跨学科思维,能够更加从容应对数字化时代变革,在不确定性中掌握更多的确定性。

思辨3.png

实验室管理与教学条件保障处处长王建表示,人大正积极推进智慧教室后端平台建设和未来课程中心建设,打造软硬件一体化的智慧教学平台,通过多角度、全方位的教学数据记录、分析与反馈,及时推动教学的改进。本场讲座三会场首次联动是智慧教学的一次成功尝试,期待未来全面推进我校智慧型教学体系建设。

思辨4.png

学术报告环节,高瓴人工智能学院李崇轩准聘副教授分享了题为“SORA 的前生今世”的报告。他介绍了当下备受关注的Sora模型概念及其功能。Sora 是一个视频生成模型,它能够根据输入的文本生成高质量的、细节丰富的、前后一致的一分钟视频。Sora 也具有视频扩展、视频衔接等编辑任务的能力。随后,李崇轩介绍了 Sora 的“前世”和“今生”。Sora具备极强的可扩展性,并能够刻画世界交互行为或进行数字模拟,体现出模型的涌现性。然而,Sora本身也具有局限性,它仍然不能把握更为广泛的物理场景。最后,李崇轩畅想了Sora的未来,并提出Sora 能否通往世界模拟器、通用人工智能等问题启发大家思考。

思辨5.png

高瓴人工智能学院许洪腾长聘副教授分享了题为“Sora带来的‘危’与‘机’”的报告。他首先介绍了 Sora 等生成式模型对现实生活的影响。许洪腾指出,由于生成式AI的加持,人们在生产和生活中将进一步实现“所思即所得”,思维成为了最核心的生产力,语言成为了最核心的生产资料。在这个大背景下,中国人民大学研究团队在人工智能诸多领域如大语言模型、跨模态生成、具身智能、模拟经济环境辅助决策等有着多方面的研究。从广义的设计、生产、治理方面而言,语言成为最核心的生产资料,人们进入了“创造力平权”时代。然而,这种影响也直接导致了生成的幻象对现实世界的逼近和干扰,使得人们同时进入了“后真相”时代,将使多个领域面临新的挑战。如将面临假新闻和社会矛盾激化的问题,需要新的司法证据形式和新的知识产权边界。总之,许洪腾认为,这是一个“危”“机”并存的时代,Sora带来的科技变革会对世界秩序产生新的影响。

思辨6.png

随后,在刘勇老师主持下,学院宋睿华、魏哲巍、徐君、孙浩、许洪腾、陈旭、李崇轩、黄文炳、林衍凯、张骁、毛佳昕、沈蔚然等十余位教师围绕两个议题“智能还是伪装:Sora到底懂不懂物理世界”、“纯数据驱动路线能否实现通用人工智能”分别展开了激烈而精彩的辩论。他们分别代表正反双方,从物理世界的概念界定以及人类被动观察世界等相关角度进行发言,各抒己见,为师生们带来了一场技术与哲思的双重思想盛宴。辩论开始前和结束后,现场师生通过“人大未来课堂”客户端发起在线投票活动,两次投票结果均为正方获胜。

思辨7(1).png

思辨8.png

互动环节,借助我校智慧教学平台,立德楼610教室、苏州校区修远楼304教室两处分会场的同学们也积极发言,与立德楼603主会场的教师们就“在大语言模型应用逐渐普及的情况下,学生是否还有必要学习数学和编程”以及“如何看待大模型的幻觉现象”等话题进行深入探讨,文继荣教授和魏哲巍教授分别作了深入浅出的解答,现场氛围热烈而活跃。

思辨9.png

最后文继荣院长作总结发言,他认为关于ChatGPT和Sora等生成式的大模型的思辨,实则为信仰和技术路径之辨。人大最早于2020年着手文澜大模型研究,当时曾被质疑过是否可行,而Open AI也曾被质疑如此巨额花费与科研理念能坚持多久,但两者最终都做出了令人惊喜的产品。对于大力出奇迹的大模型,我们还没有看到边界,大模型时代依然存在很多机遇。去年ChatGPT冲击,学院的口号是“全院all in 大模型”。今年Sora来袭,我们的目标更加远大,希望能够把AI应用于人大的每一个学科中,一起创造智能而有温度的未来!

以下为两个思辨议题的正反方观点摘要

议题一:智能还是伪装:Sora到底懂不懂物理世界?

正方黄文炳老师:Sora生成的视频具有时间连续性、空间不变性以及捕捉了光影变化,因此Sora确实学到了基本物理规律。物理规律不同于物理学规律,Sora学到的是大多数人在日常生活中观察到的物理规律,而非物理学家基于数据推导出的严谨理论。以图灵测试为例,如果无法区分Sora生成的视频与现实的区别,那么就可以认为Sora懂物理世界。

反方孙浩老师:物理世界基本定义是由自然规律和物理定律支配的空间,Sora基于视频和语言有限维数据生成的视频只能达到“逼真”的效果,离“真”相差甚远,传统的动画渲染也可以达到类似的效果。这并不能代表Sora对物理世界的真实理解,不要被其生成内容逼真的表象欺骗了。

正方魏哲巍老师:引用费曼的名言“What I cannot create, I cannot understand.”提出生成即理解的观点。人类对物理世界的理解并不完全依赖于物理公式,而是从宏观上进行理解,Sora的生成能力表明了其对物理世界的理解。

反方徐君老师:引用“非干预不因果”的观点,指出Sora基于非实验数据只能学习到相关关系而非因果关系,因而很难学到真正的物理规律。人类发现物理规律过程中反直觉的思考和假设很重要,而Sora无法进行这样的思考。

正方宋睿华老师:认为物理世界不应仅限于人类能理解的范畴。机器学习模型通过数据学习的过程与物理学家建立和优化模型的过程相似,神经网络的拟合能力可以逼近任何函数,因此Sora的学习方式是有效的。

反方许洪腾老师:能生成逼真视频与懂物理世界没有必然联系,举例说明即使画家可以画出逼真的画作也不代表他们理解物理世界。人类对物理世界认识的严格方法论是Sora所不具备的,Sora生成的一些超现实现象也可以表明它不懂物理规律。

正方魏哲巍老师:以预测悬疑小说的凶手为例,大模型其实是懂文字的。用llya的话来说,能够预测下一个词就是理解了语言。

反方徐君老师:通过了图灵测试,也可能是没有懂物理规律。但没有通过就能够说明其不懂。

正方宋睿华老师:Sora是通过了图灵测试的,不是以问答的形式,而是通过视觉的方式判断是否具有智能。

反方许洪腾老师: 悬疑小说的凶手是逻辑推演不等于理解物理学规律。能不能基于语言预测任务和物理世界并不相同。Sora掌握的是统计规律,并不是物理规律。

反方毛佳昕老师: 如果以哈利波特小说作为训练数据,那么模型懂的不是物理而是魔法。

正方李崇轩老师:很多时候物理学家理解世界第一步也是寻找统计规律,再凝练为物理定律。另外人类对于物理规律的理解也是片面的,逐步进步的,现在的Sora还处于初步阶段,不能要求它懂物理学公式。

议题二:纯数据驱动路线能不能实现通用人工智能?

反方许洪腾老师:纯数据驱动的效率低下,且目前面临数据和能源的瓶颈。如果要Sora自己生成视频来训练,这是否还算作纯数据驱动?

正方毛佳昕老师:数据驱动是实现通用人工智能的可行路径,从历史角度看,数据驱动是有效的,人类也是通过数据学习的。尽管当前模型可能需要大量数据,但未来的发展可能会改变这一现状。

反方沈蔚然老师:通用人工智能是类似人并且超越人的人工智能。尽管多层感知机理论上可以拟合任意函数,但部分数学函数需要无穷的数据才能拟合,却有简单的数学表达。无穷的数据是不可获得的。

正方林衍凯老师:真实数据是无限的,不能局限于网上的数据。大模型在压缩的过程中可以自主探索,并从数据中学到物理规律。

反方孙浩老师:实现通用人工智能的前提是资源有限的。目前用于训练的数据在许多方面都是缺失的,基于此训练不能达到类人的效果。世界是复杂的,但是描述世界的方式应该简洁的,这样才是通用的基本特征。数据不应该是唯一的要素。

正方黄文炳老师:通用人工智能的英文是AGI,其中G是General,代表的是一般范围,不是Universal。通用人工智能不是万能人工智能,只需要达到一般人可以处理大多数任务的能力即可。

反方徐君老师:假如有两个参数不同的Sora,哪个是对的?可能一个对,也可能两个都不对。版本一更新已学到的物理规律就需要被颠覆,这从经验上也不可行。

正方毛佳昕老师:人脑的最大缺陷传递信息的效率很低,但是计算机的效率很高。理性是人脑的内在能力,是进化产生的。数据也是在帮模型不断改进,所以大模型也是可以有思考能力的。

反方许洪腾老师:毛老师的意思是需要架构上的调整,架构事实上也是一种先验知识。除了效率和资源的限制,大模型学到的只是统计规律,外推的能力很差。

正方黄文炳老师:生成即智能,生成过程也是可以实现反直觉思考。所有的反直觉、因果推断事实上都可以在生成过程中实现的。

反方孙浩老师:生成即智能是一个谬论,因为生成的结果可以是虚幻的、甚至错误的,不能简单地当做智能。

正方宋睿华老师:人生成的也不一定是对的,能对齐即可;人也可以有认知被颠覆的情况。

反方许洪腾老师:但是人具有宽泛事物的判断正误的能力。

正方宋睿华老师:Sora也有判断能力,比如Reward机制。

反方许洪腾老师:有判断能力不等于纯数据驱动,还是要有一些架构的。

正方林衍凯老师:纯数据驱动不等于完全没有架构,架构和数据并不是对立的,与数据驱动对立的是符号驱动。

反方陈旭老师:如果需要的数据太多,无法实现,就是不可行的。比如密码学中破译一组密码需要的时间太长,那么就可以认定是没有破译。因此限定词(多少时间、多少资源)是必要的。

正方李崇轩老师:Sora算不算纯数据驱动,有没有用到Transformer架构?

反方孙浩老师:Sora的架构设计本身是有基于知识嵌入的,数据是辅助。如果是纯数据,不加知识和客观世界理解,是很难实现的。

正方张骁老师: 人工智能三起两落,两落都是因为没有纯数据驱动,现在能坐在这里正是基于数据驱动带来的发展。除了考虑如何增强AI,还要考虑如何和AI协作共赢,AI吸纳数据,人类制定规则,才是AI的最终愿景。

检测到您当前使用浏览器版本过于老旧,会导致无法正常浏览网站;请您使用电脑里的其他浏览器如:360、QQ、搜狗浏览器的速模式浏览,或者使用谷歌、火狐等浏览器。

下载Firefox