我院师生论文被国际学术会议NeurIPS 2022录用

新闻公告

我院师生论文被国际学术会议NeurIPS 2022录用

日期：2022-09-16访问量：

9月15日，中国计算机学会（CCF）推荐的A类国际学术会议NeurIPS 2022论文接收结果公布。中国人民大学高瓴人工智能学院师生有23篇论文被录用。神经信息处理系统大会(Neural Information Processing Systems，简称NeurIPS) 是机器学习和计算神经科学领域的顶级国际会议。NeurIPS2022录用率为25.6%。

论文介绍

论文题目：Log-Polar Space Convolution Layers

作者：苏冰，文继荣

通讯作者：文继荣

论文概述：卷积神经网络使用规则的四边形卷积核来提取特征。由于参数的数量随着卷积核的大小呈二次方增加，因此许多流行的模型使用小卷积核，导致较低层的局部感受野较小。本文提出了一种对数极坐标空间卷积（LPSC）层，其中卷积核是椭圆的，并根据相对方向和对数距离自适应地将其局部感受野划分为不同的区域。局部感受野随着距离级别的数量呈指数增长。因此，所提出的 LPSC 不仅自然地编码了局部空间结构，而且在保持参数数量的同时增加了单层感受野。我们表明，LPSC 可以通过对数极坐标空间池化的传统卷积来实现，并且可以应用于不同的网络架构以取代传统的卷积。对不同任务和数据集的实验证明了所提出的 LPSC 的有效性。

论文介绍

论文题目：Fine-Grained Analysis of Stability and Generalization for Modern Meta Learning Algorithms

作者：管界超，刘勇，卢志武

通讯作者：卢志武

论文概述：近年来，基于“支撑/查询集”划分的训练策略已经被广泛用于现代元学习算法中。当假定 n个训练任务和新来的测试任务都是从同一个环境当中采样出来时，已有的工作已经利用算法稳定性分析为光滑非凸函数提供了一个量级为 O(n^(-1/2)) 的元学习泛化误差上界。在本文中，我们将通过考虑更为一般的情形，来为现代元学习算法的稳定性和泛化性提供细粒度的分析。首先，我们将为两类损失函数提供相匹配的稳定性上界和稳定性下界： (1) 非光滑且带有 α-Hölder连续次梯度的凸函数 (α ∈ [0,1))； (2) 光滑（包含凸与非凸）函数。我们的紧稳定性界表明，在非光滑凸函数情况下，元学习算法将会比在光滑函数的情况下更加不稳定。对于光滑的非凸函数，我们的稳定性界会比已有的稳定性界更紧。

其次，我们将为基于上述两种损失函数的元学习算法提供以高概率成立的改进泛化误差界。具体地，我们首先证明了，在独立任务环境的假设下，通过算法稳定性分析得到的量级为 O(n^(-1/2)) 的元学习泛化误差界是几乎最优的。基于这个理论结果，我们给出了2个比较深刻的洞见：（1）在“任务采样于环境”统计假设下，元学习泛化误差界的收敛速率不会快于 O(n^(-1/2))，由此说明了任务环境假设的局限性；（2）在任务环境的统计假设下，当任务数量多于每个任务当中的训练样本数量时，基于“支撑/查询集”划分的元学习训练策略能够比在所有训练样本上进行经验损失最小化的元学习训练策略取得更紧的误差界，由此严格证明了“支撑/查询集”训练策略的优越性。为了获得更快的收敛速率，我们接下来展示了如何利用额外的关于损失函数的曲率性质来得到量级为 O(ln(n)/n) 的元学习泛化误差界。最后，我们将为非独立任务的元学习建立泛化误差界，其中不同任务之间的相关关系能够被相关图来刻画。在回归问题上的实验进一步证明了我们的元学习泛化误差界在独立任务环境和非独立任务环境下的收敛表现。

论文介绍

论文题目：BMU-MoCo: Bidirectional Momentum Update For Continual Video-Language Modeling

作者：高一钊，费楠益，卢浩宇，卢志武，蒋昊，李义杰，曹朝

通讯作者：卢志武

论文概述：视频-文本模型在用流数据训练时，会出现灾难性遗忘问题。在这项工作中，我们提出了一个连续视频-文本预训练（CVLM）设置：模型依次在五个被广泛使用的、具有不同数据分布的视频-文本数据集上进行训练。尽管大多数现有的连续学习方法通过利用额外的信息（例如，过去任务的记忆数据）或动态扩展的网络取得了成功，但这些方法在我们的CVLM设置下会造成巨大的资源消耗。为了克服CVLM中的问题（即灾难性遗忘和严重的资源消耗），我们提出了一种新的基于MoCo的多模态模型BMU-MoCo，该模型带有双向动量更新机制（BMU）。具体而言，我们的BMU-MoCo有两个核心设计：（1）与传统的MoCo不同，我们在每个训练步骤中不仅对动量编码器进行动量更新，还对编码器进行动量更新（即双向更新），这使得模型能够回顾保留在动量编码器中的知识。(2) 为了通过利用早期的知识进一步加强我们的BMU-MoCo，我们另外维护了一对具有相同BMU策略的全局动量编码器（只在最开始时初始化）。大量的实验结果表明，即使不使用任何额外的数据或动态网络，我们的BMU-MoCo在视频-文本检索的性能和遗忘率方面明显优于最近的连续学习方法。

论文介绍

论文题目：LGDN: Language-Guided Denoising Network for Video-Language Modeling

作者：卢浩宇，丁明宇，费楠益，霍宇琦，卢志武

通讯作者：卢志武

论文概述：随着网络视频的快速增长，视频文本建模引起学术界与工业界广泛的关注。大多数现有的方法都假设视频帧和文本描述在语义上是相关联的，并专注于视频层面的视频语言建模。然而这种假设在现实场景里往往是失效的：（1）视频内容语义丰富，单一的视频级描述很难覆盖所有帧的语义信息；（2）原始视频通常具有噪声/无意义的信息（例如，风景镜头、过渡或预告）。尽管最近的一些工作使用注意力机制来缓解这个问题，但不相关/噪声的信息仍然使其难以解决。为了解决这个问题，我们提出了一个高效的模型（LGDN，Language-Guided Denoising Network）用于视频文本建模。与大多数使用所有视频帧的方法不同，LGDN利用文本监督来动态过滤噪声或冗余帧，并提取2-4个关键帧用于token级别的细粒度对齐。LGDN在5个标准数据集上显著超越最新的结果。我们同时提供详细的消融实验来揭示噪声问题的重要性，希望对未来的视频文本工作有所启发。

论文介绍

论文题目：Convolutional Neural Networks on Graphs with Chebyshev Approximation, Revisited

作者：何明国，魏哲巍，文继荣

通讯作者：魏哲巍

论文概述：设计图卷积网络是图学习中的一个具有挑战性的问题。ChebNet是早期著名的工作之一，它使用切比雪夫多项式展开来近似图卷积。GCN仅使用一阶切比雪夫多项式来简化ChebNet，但却在实际数据集上优于ChebNet。GPR-GNN 和 BernNet 通过实验证明了Monomial和 Bernstein 多项式基在近似图卷积时优于切比雪夫多项式基，但是这样的结论在近似理论中是违反直觉的，因为切比雪夫多项式实现了逼近函数的最佳收敛率。在本文中，我们重新审视了利用切比雪夫多项式近似图卷积的问题。我们发现，ChebNet 的较差性能主要是由于ChebNet 在近似解析的滤波器函数时会学习到不合理的系数，从而导致了过拟合现象。然后我们提出了一种基于切比雪夫插值的GNN模型，ChebNetII，它增强了原始切比雪夫多项式近似，同时避免了龙格现象。实验表明ChebNetII 可以学习任意的图卷积并在全监督和半监督图节点分类任务中取得了优异的性能。

论文介绍

论文题目：EvenNet: Ignoring Odd-Hop Neighbors Improves Robustness of Graph Neural Networks

作者：雷润林，王桢，李雅亮，丁博麟，魏哲巍

通讯作者：魏哲巍

论文概述：图谱神经网络（GNN）因其在图谱机器学习中的良好表现而受到广泛的研究关注。尽管它们具有非凡的预测精度，但现有的方法，如GCN和GPRGNN，在面对测试图上的同配性变化时并不鲁棒，使这些模型容易受到图结构的攻击，在应用到同配性不同的图上时作用有限。尽管目前已有许多方法来提高GNN模型的鲁棒性，但这些技术大多局限于空域，并采用了复杂的防御机制，如学习新的图结构或计算边注意力。对此，我们期望研究在谱域中设计简单而鲁棒的GNN模型的问题。我们提出了EvenNet，一个对应于偶数阶图滤波器的谱域GNN。基于我们在空域和谱域的理论分析，我们证明了EvenNet在不同异配性上的图的泛化能力优于全阶数模型，这意味着忽略奇数跳邻居可以提高GNN的鲁棒性。我们在合成和真实数据集上进行了实验，证明了EvenNet的有效性。值得注意的是，EvenNet在不引入额外计算成本的情况下，对非目标性结构性攻击的表现优于现有的防御模型，在节点分类任务中同样保持竞争力。

论文介绍

论文题目：Long-Form Video-Language Pre-Training with Multimodal Temporal Contrastive Learning

作者：孙宇冲，刘蓓，薛宏伟，宋睿华，杨欢，傅建龙

通讯作者：宋睿华，傅建龙

论文概述：大规模的视频-文本预训练在视频-文本理解任务上显示出明显的提升。以前视频-文本预训练的研究主要集中在短视频（即30秒内），长视频-文本预训练很少被探讨。直接学习从长视频和文本中学习表征可能会使许多长视频-文本理解任务受益。然而，长距离关系建模的困难以及编码更多的帧造成的计算负担也带来了挑战。在本文中，我们介绍了一个长视频-文本预训练 (LF-VILA)模型，并在一个大规模的长视频-文本数据集上对其进行训练。为了有效地学习丰富的时序动态变化，并以一种有效的端到端方式更好地对齐视频和文本，我们在LF-VILA模型中引入了两个新颖的设计。我们首先提出了一个多模态时序对比损失（MTC）来学习不同模态之间的时序关系，鼓励在长视频和文本之间进行细粒度的对齐。其次，我们提出了一个层次化的时间窗口注意力（HTWA）机制，以有效地捕捉长时间的依赖关系，同时降低Transformer的计算成本。我们对预训练的LF-VILA模型在段落到视频检索和长视频问答等七个下游长视频-文本理解任务上进行了测试，并取得了最先进的性能。具体来说，我们的模型在ActivityNet段落到视频检索任务和How2QA任务上分别取得了16.1%和2.4%的相对提升。

论文介绍

论文题目：Debiased, Longitudinal and Coordinated Drug Recommendation through Multi-Visit Clinic Records

作者：孙宏达，解曙方，李书琪，陈雨涵，文继荣，严睿

通讯作者：严睿

论文概述：人工智能赋能的药物推荐已成为医疗保健研究领域的一项重要任务，它为帮助人类医生提供更准确、更高效的药物处方提供了额外的视角。通常，药物推荐是基于患者在电子健康记录中的诊断结果。我们假设在药物推荐中需要解决三个关键因素：（1）消除由于可观察信息的限制导致的推荐偏倚，（2）更好地利用历史健康状况和（3）协调多种药物以控制安全性。为此，我们提出了 DrugRec，一种基于因果推理的药物推荐模型。该因果图模型可以通过前门调整来识别和消除推荐偏差。同时，我们在因果图中对多次就诊进行建模，以表征患者的历史健康状况。最后，我们将药物-药物相互作用 (DDI) 建模为可满足性 (SAT) 问题，解决该 SAT 问题有助于更好地协调推荐。综合实验结果表明，我们提出的模型在广泛使用的数据集 MIMIC-III 和 MIMIC-IV 上实现了最优的性能，证明了我们方法的有效性和安全性。

论文介绍

论文题目：MetaMask: Revisiting Dimensional Confounder for Self-Supervised Learning

作者：李江梦*，强文文*，张雅楠，莫文仪，郑昌文，苏冰，熊辉

通讯作者：苏冰

论文概述：作为一种成功的自监督学习方法，对比学习旨在学习在输入样本的扭曲之间共享的不变信息。虽然对比学习在采样策略和架构设计方面取得了不断的进步，但仍然存在两个缺陷：受任务无关信息的干扰和样本效率低下，这与重复存在的平凡解有关。从维度分析的角度，我们发现维度冗余和维度混杂可能是导致这些现象的内在问题，并提供实验证据来支持我们的观点。我们提出了一种简单而有效的方法 MetaMask（元学习维度掩码），用于学习针对维度冗余和混杂因素的表征。 MetaMask 采用冗余减少技术来解决维度冗余问题，创新性地引入了维度掩码来减少包含混杂因素的特定维度的梯度效应。MetaMask以目标通过元学习范式进行训练，是提高掩码后表征在典型的自监督任务上的性能。我们提供了理论分析以证明 MetaMask 与典型的对比方法相比，可以对下游分类获得更紧的风险界。实验上，我们的方法在各种基准测试中实现了有竞争力的性能。

论文介绍

论文题目：Randomized Sketches for Clustering: Fast and Optimal Kernel k-Means

作者：殷荣，刘勇，王伟平，孟丹

通讯作者：刘勇

论文概述：核k-means是无监督机器学习领域中一类重要的聚类学习，现有研究方法计算成本和内存需求较高，同时理论界待进一步提升。本文聚焦于改进核k-means统计分析和计算逼近，提出了随机素描核k-means计算框架，同时给出亚高斯素描、随机正交系统素描和Nystrom三类核k-means实例。理论分析表明，当随机素描维度为sqrt(n)时，所提出的算法具有最优超额聚类风险上界。这是核k-means首次在无强假设条件和最小近似维度下获得最优超额风险界。在计算的角度，所提出的算法极大降低了时间复杂度和空间复杂度。此外，我们进一步推导了一般情况下近似解的相似界，这可以通过k-means++实现有效计算。实验结果验证了我们的理论分析。

论文介绍

论文题目：EGSDE: Unpaired Image-to-Image Translation via Energy-Guided Stochastic Differential Equations

作者：赵敏，鲍凡，李崇轩，朱军

通讯作者：李崇轩，朱军

论文概述：本文提出了一种一般的基于能量函数的扩散概率模型生成指导方法EGSDE。现有指导生成方法如 classifier-guidance等可以理解为EGSDE的特例。理论上，本文从product of experts的角度解释了EGSDE的采样分布。实验上，本文考虑了图到图翻译的任务，解决了过去SDE没有用上源域训练数据的问题，在若干标准数据上取得了最好的“可信-真实”权衡结果。原则上，通过定义不同的能量函数，EGSDE有潜力处理更广泛的任务如分子合成等。

论文介绍

论文题目：Equivariant Graph Hierarchy-based Neural Networks

作者：韩家琦, 荣钰, 徐挺洋, 黄文炳

通讯作者：黄文炳

论文概述：等变GNN已经被成功运用到多体物理系统的动力学模拟中。然而，现有的等变GNN没有考虑系统的多层级结构，难以有效挖掘系统内部的子结构以及全局信息。本文首次提出了多层级等变图神经网络EGHN，其由等变池化E-Pool和等变去池化E-UnPool两个部分通过U-Net连接组成，分别负责信息从细粒度到粗粒度的聚合、从粗粒度到细粒度的发散。我们基于分子动力学工具MDAnalysis构建了一个关于蛋白质动力学模拟的任务。在这个数据集以及其他相关任务上，我们证明了考虑多层级等变的必要性和有效性。

论文介绍

论文题目：Learning Physical Dynamics with Subequivariant Graph Neural Networks

作者：韩家琦, 黄文炳, 马珩博, 李家琛, Joshua B. Tenenbaum, 淦创

通讯作者：黄文炳

论文概述：GNN是学习物理系统动力学的有效工具之一。现有方法要么完全忽略物理定律的对称性，要么考虑过多对称性，忽略了外部力场（如重力）所造成的对称性破却。本文首次提出了“子等变”的概念，即把欧氏GNN放缩成，只服从由外部力场所诱导子群上的等变GNN，并给出表达能力的完备性证明。Physion是近期由斯坦福大学、MIT等机构构建的数据集，包含了多种复杂刚体、变形体等物理对象的相互碰撞、摩擦、折叠等交互行为。在这个数据集以及其他相关任务上，我们验证了子等变GNN的必要性和有效性。

论文介绍

论文题目：Molecule Generation by Principal Subgraph Mining and Assembling

作者：孔祥哲，黄文炳，谭知行，刘洋

通讯作者：黄文炳，刘洋

论文概述：分子生成是涉及许多领域应用的重要任务。目前基于子图预测和组装的分子生成模式正在逐渐兴起。然而，在子图库的构建上，目前的方法多依赖于切割单键、抽取成环子图等人工规则或外部的化学结构库。在子图组装上，目前的方法多局限于局部的连接模式。在本文中，作者提出了主子图principal subgraph（下简写为PS）这一新颖的概念，并发现PS可以捕捉分子中带有丰富信息的特定模式。本文同时提供了一种基于合并-更新的算法用于自动地从数据集中抽取高频出现的PS，并作为子图库用于后续的分子图生成。实验证明以这种方法构建的子图库比现有的其他方法更能提供数据集分子中的模式信息，从而提升模型生成分子的能力。进一步地，本文提出了一种两步式的子图预测和组装方法，以序列预测的方式确定要生成的子图，之后全局地将子图组装为完整的分子。大量实验显示，本文提出的基于PS子图库以及两步式生成框架的模型在效率和效果上相比现有方法都有显著的提升。

论文介绍

论文题目：Bayesian Spline Learning for Equation Discovery of Nonlinear Dynamics with Quantified Uncertainty

作者：孙路宁，黄政宇，孙浩，王建勋

论文概述：非线性动力系统常见于科学和工程应用中，但许多复杂系统的潜在运行机制尚未被揭示。从数据中识别提取系统的控制方程，可以有效辅助诠释其运行机理、预测系统动态演化过程。现有方法在处理稀疏噪声数据时面临挑战；此外，文献中对方程挖掘进行不确定性量化度量方面的相关工作也十分有限。本文提出一种新颖的贝叶斯样条学习法，可从稀疏噪声数据中自动挖掘提取动力系统对应的控制方程（如常微分/偏微分方程），并对参数的不确定性量化分析。文章采用可微分样条曲线对系统响应进行近似建模，能够有效解决测量数据噪声和稀疏问题；其中，潜在的控制方程运用代数库的形式表达。文章提出了一种迭代贝叶斯稀疏回归算法，可对该问题实现可靠求解。基于多组非线性系统算例，验证表明该方法的有效性，综合表现超越现有基线模型。

论文介绍

论文题目：Stability and Generalization of Kernel Clustering: from Single Kernel to Multiple Kernel

作者：梁伟轩，刘新旺，刘勇，周思航，黄俊杰，王思为，刘吉元，张毅，祝恩

论文概述：多核聚类是一个被广泛研究的重要课题。然而，现有方法仍旧存在两个问题：一是处理样本集外点的效率低；二是缺乏关于聚类算法稳定性和泛化的研究。在本文中，我们提出了一个新的方法，该方法可以高效地计算样本集外点的嵌入，并且具备泛化保证。具体而言，本文通过近似一个积分算子的特征函数去构造样本集外点的低维嵌入，该积分算子是由基核函数线性组合所定义的。此外，我们首次通过对算法稳定性的分析，对聚类算法的泛化性能进行了研究。本文首先给出了单视图上核聚类算法的一致稳定性，并据此得到其额外聚类风险的上界。接着，我们将该结论向多核场景下进行了扩展，并建立了多核算法稳定性与核组合系数之间的关系。作为例证，该结论被用在了一个新颖的多核聚类算法SimpleMKKM上，并据此得到了更好的额外风险上界。最后，本文还用充分的实验，验证了所提出方法的效果和效能。

论文介绍

论文题目：SemMAE: Semantic-Guided Masking for Learning Masked Autoencoders

作者：Gang Li, Heliang Zheng, Daqing Liu, Chaoyue Wang, 苏冰, Changwen Zheng

论文概述：本文探索了一种潜在的视觉类比词，即语义部件，并通过提出语义引导掩蔽策略将语义信息整合到MAE的训练过程中。与广泛采用的随机掩码相比，本文的掩码策略可以逐步引导网络学习各种信息，即从部件内模式到部件间关系。本文通过两个步骤来实现这一点。 1）语义部件学习：设计了一种自监督的部件学习方法，通过利用和改进基于ViT的编码器的多头注意力来获得语义部件。 2）语义引导的MAE（SemMAE）训练：设计了一种掩蔽策略，从掩蔽每个部件中的一部分补丁到掩蔽图像中的一部分（整个部件）。SemMAE 在图像分类、语义分割和细粒度识别任务中都获得了显著的改进。

论文介绍

论文题目：Inverse Game Theory for Stackelberg Games: the Blessing of Bounded Rationality

作者：Jibang Wu, 沈蔚然, Fei Fang, Haifeng Xu

论文概述：传统博弈论主要关心博弈均衡的计算，但在实际应用中，我们有时会面临完全相反的问题，即通过观察玩家的均衡策略和行为，来推断博弈参数。近年来的相关研究主要集中在斯塔克伯格博弈中，但现有文献给出的主要是负面结果，即证明在完全理性的情况下，恢复博弈参数的统计复杂性和计算复杂性。我们的研究考虑更接近实际情况的有限理性，我们给出了在这种情况下，恢复博弈参数的高效算法，并通过模拟仿真实验验证了理论结果。

论文介绍

论文题目：DPM-Solver: A Fast ODE Solver for Diffusion Probabilistic Model Sampling in Around 10 Steps

作者：路橙，周聿浩，鲍凡，李崇轩，陈键飞，朱军

论文概述：本文提出了一个基于ODE形式的扩散概率模型的高阶加速推断方法DPM-Solver。通过充分利用扩散概率模型的固有结构，DPM-Solver迭代10步左右即可生成高质量数据。本文在理论上分析了离散误差项并指出了DPM-Solver的理论优势，在多个标准数据上得到了最好的“速度-效果”权衡。

论文介绍

论文题目：When to Update Your Model: Constrained Model-based Reinforcement Learning

作者：嵇天颖，罗宇，孙富春，荆明轩，何凤翔，黄文炳

论文概述：基于模型的强化学习（Model-Based Reinforcement Learning, MBRL）中策略优化和模型学习两阶段相互依赖并链式影响后续训练过程，因此单调性保证一直以来是其算法设计与分析中重要挑战之一。现有的工作通常忽略了模型转移的影响，在固定模型下分析两次策略迭代的性能差异界，通过粗略地假设模型偏差的上界来分析模型精度对策略性能的影响。当面临急剧的模型更新时，算法在模型转移时的单调性难以保证，因而降低性能。本工作中，我们首先为MBRL的非递减性能保证提出了一个新颖的通用理论框架，该框架将模型转移和策略变化造成的性能差异均纳入其中。通过细化后的性能差异下界，我们揭示了模型转移和策略在实际环境中性能改进之间的关系，并进一步将MBRL的单调性问题自然转化为一个约束优化问题。此外，我们给出了该约束优化问题在生成模型假设下的一个可行解，该可行解直观地显示出从动态变化的探索数量中学习模型更有利于性能单调提升。基于这些理论结果，我们设计了一个简单而有效的算法Constrained Model-shift Lower-bound Optimization (CMLO)，通过引入一个事件触发机制，灵活地决定何时更新模型。大量实验表明，CMLO超过了其他最先进的方法，并在采用多种策略优化方法时均能获得提升。

论文介绍

论文题目：SNAKE: Shape-aware Neural 3D Keypoint Field

作者：钟程亮，尤沛兴，陈晓雪，赵昊，孙富春，周谷越，慕晓冬，淦创，黄文炳

论文概述：从点云中检测 3D 特征点对于物体的重建很重要，而本文研究了一个反向问题：形状重建是否有利于 3D 特征点检测？现有方法大多根据不同阶数的统计特性，或者学习对刚性变换保持不变的特征点。然而，将形状重建结合到 3D 关键点检测中的想法尚未得到充分探索。本文认为这受到以前对该问题求解范式的限制。为此，本文提出了一种名为 SNAKE 的新型无监督范式，它是shape-aware neural 3D keypoint field 的缩写。与最近基于坐标的辐射场或距离场类似，本文提出的网络将 3D 坐标作为输入，同时预测隐式的点云表面形状和关键点显著性，从而自然地将3D 关键点检测和形状重建两个任务紧密耦合。本文在多个公共基准测试中展现了该方法的优越性能，包括物体数据集ModelNet40、KeypointNet，人体数据集SMPL 和场景数据集 3DMatch 和 Redwood。代码已在如下网址中公开：https://github.com/zhongcl-thu/SNAKE

论文介绍

论文题目：Learning Active Camera for Multi-Object Navigation

作者：陈沛豪, 吉冬昱, 林坤阳, 胡玮文, 黄文炳, 李宏, 谭明奎, 淦创

论文概述：人类通常通过环顾四周以更高效地感知环境，从而更快地发现感兴趣的物体。如何让机器人像人类一样高效感知环境是机器人学的一个核心问题。在本文中，我们考虑使用主动转向摄像头，并设计主动转向策略，以高效感知环境并引导机器人导航到多个目标。为此，我们必须解决两个新的挑战：1）如何在复杂环境中发掘感兴趣的区域；2）如何将摄像头转向策略与导航移动策略协调，以快速探索感兴趣的区域和到达目标位置。为了解决这些挑战，我们将摄像头的转向建模为部分可观测马尔科夫决策过程，并使用强化学习算法来学习摄像头主动转向策略。具体而言，我们设计了一个奖励函数，以鼓励智能体通过主动转向摄像头并探索更多区域。此外，我们利用人类先验知识设计转向规则，并利用此规则指导主动转向学习。最后，为了更好地协调转向和移动策略，摄像头策略在做出转向决策时会考虑导航移动动作。实验结果表明，我们的摄像头主动转向策略帮助机器人在两个数据集和四个基准方法上均获得多目标导航性能提升。

论文介绍

论文题目：Benefits of Permutation-Equivariance in Auction Mechanisms

作者：秦天，何凤翔，石鼎丰，黄文炳，陶大程

论文概述：在经济学中，设计一个同时最大化拍卖人收益且最小化竞拍者事后遗憾的拍卖机制是一个重要但困难的问题。利用神经网络学习最优的拍卖机制在这个问题上取得了巨大的进展。在本文中，我们考虑了可加价值和不变价值概率的设置。其中，可加价值是指对于每个拍卖者，一些商品的总价值是每一件商品的价值的总和。不变价值概率意味着交换拍卖者或商品的顺序后，价值的联合概率分布保持不变。我们证明置换等变的网络结构在上述的设置下具有显著优势：保证置换等变性质在保持拍卖人收益的情况下降低了竞拍者的事后遗憾，同时带来了更好的泛化性能。这意味着置换等变性可以帮助逼近理论上的占优策略-激励相容条件，同时降低了实现期望的泛化能力所需要的样本数量。此外，大量的实验结果验证了我们的理论。据我们所知，这是第一个研究置换等变性在拍卖机制设计中的理论优势的工作。

新闻公告

学院新闻

我院师生论文被国际学术会议NeurIPS 2022录用

友情链接

联系

关注我们