4月20日,深度学习学术会议ICLR 2022 正式公布获奖名单,共有7篇论文因其出色的条理性、洞察力、创造力和持久的影响力而被选为杰出论文奖。其中,中国人民大学高瓴人工智能学院准聘助理教授李崇轩和清华大学张钹院士、朱军教授等人合作的论文《Analytic-DPM: an Analytic Estimate of the Optimal Reverse Variance in Diffusion Probabilistic Models》荣获该奖项。
ICLR全称为“International Conference on Learning Representations”(国际学习表征会议),由深度学习巨头、图灵奖获得者 Yoshua Bengio 和 Yann LeCun 牵头举办,是国际公认的深度学习领域顶级会议之一。据悉,本届会议的有效投稿量为3391篇,共接收了54篇Oral论文和176篇Spolight 论文,论文接收总数1095篇。
扩散概率模型(Diffusion probabilistic model,DPM)是一类强大的生成模型,是机器学习中一个快速发展的研究课题。本篇获奖论文旨在解决DPM模型固有的局限性,即DPM模型中反向方差的估计不准导致推断代价高。作者首先展示了一个令人惊讶的结果,即DPM的最优反向方差和相应的最优 KL 散度都有其得分函数的解析形式。然后,他们提出了一个新颖而优雅的免训练推理框架:Analytic-DPM,使用蒙特卡罗方法和预训练的得分模型来估计方差和 KL 散度的分析形式。
本篇论文在理论贡献(表明 DPM 的最优反向方差和 KL 散度都具有解析形式)和实际益处(提出适用于各种 DPM 模型的免训练推理)方面都很重要,并且很可能影响未来对 DPM 的研究。
附 李崇轩准聘助理教授简介:
李崇轩,中国人民大学高瓴人工智能学院准聘助理教授。2014年于清华大学交叉信息研究院本科毕业,2019年于清华大学计算机系博士毕业。研究方向为概率机器学习,特别是深度生成模型,近似推断算法和相关方法在半监督学习的应用,相关工作发表于机器学习领域重要的国际期刊和会议,包括TPAMI,ICML,NeurIPS,ICLR等。代表性工作包括:一致性理论下最优的半监督GAN 方法 Triple-GAN ,谷歌学术引用370余次;扩散模型在最大似然意义下的最优方差估计Analytic-DPM,获ICLR2022杰出论文奖。他于2017年获得微软学者(MSRA fellowship),2019年获中国计算机学会(CCF)优秀博士论文,同年入选中国博士后创新人才支持计划,于2021年获吴文俊人工智能自然科学奖一等奖 (第五完成人),主持自然科学基金面上项目一项。
检测到您当前使用浏览器版本过于老旧,会导致无法正常浏览网站;请您使用电脑里的其他浏览器如:360、QQ、搜狗浏览器的速模式浏览,或者使用谷歌、火狐等浏览器。
下载Firefox