EN

学院新闻

高瓴人工智能学院师生8篇论文被CCF A类会议AAAI录用
日期:2021-01-21访问量:

近期,中国人民大学高瓴人工智能学院师生8篇论文被CCF A类会议AAAI录用。第35届国际人工智能顶级会议AAAI(Association for the Advance of Artificial Intelligence)将于2021年2月2日-9日以虚拟会议的形式在线举办。AAAI是人工智能促进协会主办的年会,是人工智能领域中历史最悠久、涵盖内容最广泛的的国际顶级学术会议之一,也是中国计算机学会(CCF)推荐的A类国际学术会议。

image001.png

论文介绍

论文题目:A Global Occlusion-Aware Approachto Self-Supervised Monocular Visual Odometry

作者:卢遥,徐晓俐,丁明宇,卢志武,向滔

通讯作者:卢志武

论文概述:自监督单目视觉里程计通常被看做是一个基于深相机姿态估计和场景深度估计的视图合成问题,其关键挑战是如何准确且稳健地估计场景中的遮挡物和移动物体的深度。现有的方法只是简单地通过几个卷积层来检测和掩盖局部的遮挡区域,然后在图像的其余部分进行局部视图合成。本文从两个全局的角度来减轻遮挡或移动物体对单目视觉里程计的负面影响。首先,我们提出了一个多尺度的非局部注意力模块,包括阶段内增强注意力机制和跨阶段的级联注意力机制,用于对遮挡物进行鲁棒的深度估计,并通过全局注意力建模来缓解遮挡物的影响。其次,在单目视觉里程计的视图合成中引入了对抗学习。与现有的方法在合成视图过程中使用像素级的损失不同,我们强制要求合成视图在场景级上与真实视图无法区分,这样的全局约束有助于处理遮挡和移动的区域。在KITTI数据集上实验表明,我们的方法在相机姿态估计和场景深度恢复方面都达到了目前最好水平。

论文介绍

论文题目:Temporal Relational Modeling with Self-Supervision for Action Segmentation

作者:王栋,胡迪,李兴建,窦德景

通讯作者:胡迪

论文概述:视频中的时序关系建模对于行为动作理解(如动作识别和动作分割)至关重要。尽管图卷积网络(GCN)在许多任务的关系推理中显示出令人鼓舞的优势,但如何在长视频序列上有效地应用图卷积网络仍然是一个挑战。其主要原因是大量存在的视频帧节点使GCN难以捕获和建模视频中的时序依赖关系。为了解决此问题,本文引入了一个有效的GCN模块,即膨胀时序图推理模块(DTGRM),该模块旨在对不同时间跨度视频帧之间的时序关系和相关性进行建模,尤其可以通过构造多级扩张的时序图来捕获和建模长跨度的时序关系。此外,为了增强所提出模型的时序推理能力,本文提出了一种辅助的自监督任务,以鼓励膨胀的时序图推理模块找到并纠正视频中错误的时序关系。本模型在三个具有挑战性的数据集上均优于最新的行动分割模型。

论文介绍

论文题目:Regret Bounds for Online Kernel Selectionin Continuous Kernel Space

作者:张骁,廖士中,徐君,文继荣

通讯作者:徐君

论文概述:在线模型选择是在线机器学习的关键问题。不同于离线模型选择,在线模型选择中的训练、验证和模型选择过程是交织混合进行的,这使得在线模型选择既要保证理论上的收敛性,又要保证计算上的实时性。已有在线核选择方法的时间复杂度至少是关于回合数平方级,计算效率较低,并且缺乏完备的后悔分析。本文聚焦于连续的候选核空间,依据每回合模型选择和模型训练的不同顺序,将连续核空间中的在线核选择分为两类,并分别给出得到最优后悔界所需的条件,将在线核选择的整体时间复杂度降为关于回合数拟线性级,解决了在线核选择的高计算复杂度问题。实验结果验证了理论结果的正确性和所提出算法的高效性。所提出的后悔分析框架为序列决策问题提出了新的理论保证和解决方案。

论文介绍

论文题目:Learning Graphonsvia Structured Gromov-Wasserstein Barycenters

作者:许洪腾,罗迪新,LawrenceCarin,查宏远

通讯作者:罗迪新

论文概述:针对“极限图”这一非参数化的图生成模型,我们设计了一种基于结构化格罗莫夫-瓦瑟斯坦(GW)重心的学习方法,进而实现了对任意大小的图的分析与生成。针对使用2维阶跃函数估计极限图的算法框架,我们证明了极限图之间的切距离可以被放松为它们对应的阶跃函数之间的GW距离,并且一个极限图的阶跃函数可以用观测到的图数据的GW重心来估计。针对实际情况,我们还设计了具有平滑约束的GW重心估计算法和多GW重心的混合模型等结构化的扩展模型。该方法克服了传统极限图学习方法过分依赖图匹配精度的问题,在仿真数据和真实数据上表现良好。代码见https://github.com/HongtengXu/SGWB-Graphon.

论文介绍

论文题目:Coupon Design in Advertising Systems

作者:沈蔚然,唐平中,汪勋,徐亚东,杨希旺

通讯作者:唐平中

论文概述:在线广告平台一般通过拍卖来出售广告,收益最大化是这些平台最重要的任务之一。保留价、boosting、优惠券等机制都是增加收益的方法。优惠券机制的好处是广告主可以自由选择是否使用,给广告主更多选择空间。本文讨论了在VCG拍卖机制下,优惠券的设计问题。我们首先考虑广告主在该种机制下的出价策略,然后将优惠券设计问题描述成一个学习问题,并根据VCG拍卖的性质提出了学习算法。另外,我们还探讨了应当如何将优惠券机制与保留价机制进行结合的问题。最后,基于真实数据的实验表明,我们提出的算法可以有效提高平台收益。

论文介绍

论文题目:Empowering Conversational AI Is a Trip to Mars: Progress and Future of Open Domain Human-Computer Dialogues

作者:严睿,武威

通讯作者:严睿

论文概述:基于人工智能的人机对话技术从来没有像现在一样吸引了研究者极大的关注。与计算机通过自然语言进行信息交流与指令收发彰显了一个更为自然的交互模式。受人机对话未来极富想象空间的潜力所驱动,主流的自然语言处理,人工智能,甚至检索与挖掘领域都在呼吁着对话式人工智能的研究与探索。达成真正意义上的对话式人工智能是一趟通往火星的旅程,而我们似乎仍然还停留在地球上,我们有很多问题和障碍需要克服。在本文中,我们展现了有哪些问题已经被研究者攻克,同时展望了还有哪些更多的问题亟待我们去解决,以及怎么样才能实现更好的对话式人工智能。

论文介绍

论文题目:Reasoning in Dialog: Improving Response Generation by Context Reading Comprehension

作者:陈秀颖,崔植,张嘉益,魏晨,崔建伟,王斌,赵东岩,严睿

通讯作者:严睿

论文概述:在多轮对话中,人们不总是会使用完整精确的句子表达方式,因而使得对话的上下文理解变得尤为困难。可是,我们需要让计算机充分理解上下文,才能产生一个合理的系统回答。在本文中,我们提出了一种训练计算机系统通过完成阅读理解的任务,提升其对会话上下文出现信息缺失情况下的理解推理能力:即使出现了信息缺失,系统也有能力进行理解及补全。受多任务学习范式的启发,我们提出了一种联合训练的模型框架,将对话与阅读理解两个不同的任务进行捏合与适度的共享,从而使得这种在信息缺失情况下的推理能力可以很好的帮助对话系统完成会话过程。

论文介绍

论文题目:The Style-Content Duality of Attractiveness: Learning to Write Eye-Catching Headlines via Disentanglement

作者:李明哲,陈秀颖,杨敏,高莘,赵东岩,严睿

通讯作者:严睿

论文概述:本文主要研究在保证内容原汁原味的前提下,如何生成有更有吸睛的新闻文章标题。通过对有吸引力的标题进行分析,我们发现标题的新颖性主要表现在内容和风格两个方面,即既能关注到吸引人的内容,又能选择有吸引力的语言。具体来说,我们提出了一个基于解耦的吸引性标题生成器,该生成器生成的标题能够捕捉到吸引人的内容并服从有吸引力的语言风格。我们使用一个解耦模块借助两个约束将原型标题的风格和内容分离到两个潜在空间。然后使用潜在的内容信息来进一步完善文档表示并帮助捕获显著部分,用风格信息来指导生成标题过程中的词语挑选。在公开的快报数据集上的大量实验表明,我们提出的模型取得了到目前为止最优的性能。

检测到您当前使用浏览器版本过于老旧,会导致无法正常浏览网站;请您使用电脑里的其他浏览器如:360、QQ、搜狗浏览器的速模式浏览,或者使用谷歌、火狐等浏览器。

下载Firefox