"AI之夏"研招系列学术讲座第2讲:做活的AI:多模态理解、生成与交互
“AI之夏”研招系列学术讲座第2讲,由人大高瓴人工智能学院宋睿华长聘副教授为大家主讲。
人类是在多模态(如眼睛可以看见的视觉、耳朵可以听到的声音等)环境中长大,对多模态信息有着出色的理解、生成于交互能力,AIMind小组致力于让AI模仿这些能力。这次讲座将介绍我们的最新工作,包括如何生成有声视频、如何让AI根据人类的动作做出反应动作,以及如何让AI的眼神随所闻所见灵动起来。
讲座信息
讲座时间:6月18日 周三下午 13:00-14:00
腾讯会议:227-991-973
报告题目:做活的AI:多模态理解、生成与交互
主讲人:宋睿华
讲者简介:宋睿华,中国人民大学高瓴人工智能学院长聘副教授、博士生导师,国家高层次人才专家。曾任微软亚洲研究院主管研究员、微软小冰首席科学家。近期研究兴趣为多模态理解、创作和交互。发表学术论文100余篇,申请专利30余项。曾获WWW 2004最佳论文提名奖,AIRS 2012最佳论文奖,CLWS 2019优秀论文奖,2022年度教育部自然科学一等奖、MM Asia 2024最佳学生论文提名奖和MMM 2025最佳论文奖。她的算法完成了人类史上第一本人工智能创作的诗集《阳光失了玻璃窗》。2020-2022年作为学术带头人,发布文澜系列多模态预训练大模型,并成功落地快手、OPPO等企业。2023年,参与发布玉兰大语言模型,完成从基础模型到对话模型的自研训练。曾担任SIGIR短文和讲习班主席,ACL的领域主席,SIGIR和EMNLP的资深领域主席。
精彩讲座持续进行中,欢迎关注!
检测到您当前使用浏览器版本过于老旧,会导致无法正常浏览网站;请您使用电脑里的其他浏览器如:360、QQ、搜狗浏览器的速模式浏览,或者使用谷歌、火狐等浏览器。