"AI之夏"研招系列学术讲座第19讲:大模型机理分析
“AI之夏”研招系列学术讲座第19讲,由人大高瓴人工智能学院刘勇长聘副教授为大家宣讲。
近年来,大模型技术呈现出突飞猛进的发展态势,然而与之相比,大模型基础理论分析却处于相对滞后的状态。本研究聚焦于大模型机理分析展开深入探究,一方面对 In-context learning(ICL)隐式更新机理进行剖析,并从对比学习视角出发对 Transformer 结构加以改进;另一方面针对当前流行的合成数据生成过程进行数学建模,并从反信息瓶颈这一新颖视角对数据合成进行理论分析。希望能够为 ICL 以及大模型合成数据设计提供全新的见解与思路,助力大模型相关应用更好地发展。
讲座信息
活动名称:大模型机理分析
活动时间:7月3日,18:30-19:30
腾讯会议:112-688-481
嘉宾信息:
刘勇,中国人民大学高瓴人工智能学院长聘副教授、博士生导师、国家级高层次青年人才。博士毕业于天津大学。从事机器学习研究,特别关注大模型基础理论分析、统计机器学习、图表示学习等。发表高水平论文100多篇,其中以第一作者或通讯作者发表高水平文章50余篇,涵盖机器学习领域顶级期刊TIT、JMLR、TPAMI、Artificial Intelligence 和顶级会议ICML,NeurIPS,ICLR等。曾获得中国科学院“青年创新促进会”会员(院人才)以及中国科学院信息工程研究所“引进优秀人才”称号。担任国际顶级会议IJCAI高级程序委员,NeurIPS、ICML、AAAI、ECAI等程序委员。主持多项科研基金项目,包括国家自然科学基金青年基金、面上项目、中国科学院基础前沿科学研究计划、腾讯犀牛鸟基金、联通联合项目、华为联合项目等。
精彩讲座持续进行中,欢迎关注!
检测到您当前使用浏览器版本过于老旧,会导致无法正常浏览网站;请您使用电脑里的其他浏览器如:360、QQ、搜狗浏览器的速模式浏览,或者使用谷歌、火狐等浏览器。