1月25日,国际学术会议WWW2023论文接收结果公布。中国人民大学高瓴人工智能学院师生有7篇论文被录用。国际万维网会议(Proceedings of the ACM Web Conference 2023,简称 WWW’23) , 是中国计算机学会(CCF)推荐的A类国际学术会议,由国际万维网会议委员会(IW3C2)和主办地地方团队合作组织,每年召开一次,今年是第32届会议。本年度论文录用率为19.2%。
论文介绍
论文题目:Learning Denoised and Interpretable Session Representation for Conversational Search
作者:毛科龙,钱泓锦,莫冯然,窦志成,刘邦,程小华,曹朝
通讯作者:窦志成
论文概述:对话式搜索支持多轮的用户-系统交互以解决复杂的信息需求。与传统的单轮ad-hoc搜索相比,对话式搜索由于会话较长且包含大量冗余的噪声,面临着更复杂的搜索意图理解问题。现有的对话式稠密检索解决方案只是在有限的对话式搜索数据上对预先训练的ad-hoc查询编码器进行微调,在如此复杂的对话式搜索场景中难达到令人满意的性能。
同时,这种方式学习到的潜在表征也缺乏可解释性,人们无法感知模型是如何理解会话的。为了解决上述缺点,我们提出了一个稀疏的基于词元的对话式检索器LeCoRE,它扩展了ad-hoc词元检索器SPLADE模型,采用了统一的基于知识蒸馏和外部查询重写的两种匹配良好的多级去噪方法,以生成去噪的且更可解释的会话表征。我们在四个公共对话搜索数据集上的实验证明了LeCoRE的优越性。
论文介绍
论文题目:Incorporating Explicit Query Intents for Personalized Search
作者:王淑婷,窦志成,姚菁,周雨佳,文继荣
通讯作者:窦志成
论文概述:个性化搜索的关键是对用户意图进行建模来为不同的用户返回不同的搜索结果。现有的个性化搜索方法主要聚焦于隐式地学习用户兴趣向量而不是显式地预测查询语句下的个性化子主题来捕捉更具体的用户意图。在本文中,我们提出一个名为ExpliPS的显式地引入查询子主题来实现个性化搜索的模型。他通过评估用户对查询子话题上的偏好来实现用户意图的建模,并根据偏好子话题来对搜索结果进行个性化。我们认为在这样一种方式下的个性化搜索将更具备可解释性及稳定性。具体来说,我们首先使用语义编码器学习用户历史行为的表征。基于这些历史行为,我们设计了一个子话题偏好预测器来预测用户对当前查询子话题的偏好程度。最终,我们通过子话题感知的排序器来对候选文档进行重排序,使得和用户偏好的子话题相似的文档能够排在前列。实验结果表明我们的模型性能显著超过现有的最优个性化搜索模型,并且能够提供稳定的可解释的搜索结果。
论文介绍
论文题目:P-MMF: Provider Max-min Fairness Re-ranking in Recommender System
作者:徐晨,陈思睿,徐君,沈蔚然,张骁,王刚,董振华
通讯作者:徐君
论文概述:在本文中,我们从供应商的角度解决了推荐系统公平性的问题,这在多利益相关者的推荐系统中变得越来越重要。现有关于供应商公平性的研究通常侧重于设计首先考虑系统公平性的比例公平性 (PF) 指标。 然而,社会学研究表明,要使市场更加稳定,最大-最小公平性 (MMF) 是一个更好的指标。 主要原因是 MMF 旨在优先提高最差供应商的效用,引导支持市场地位较弱的供应商。将 MMF 应用于推荐系统时,如何在在线推荐场景中平衡用户偏好和供应商公平性仍然是一个具有挑战性的问题。 在本文中,我们提出了一种名为 Provider Max-min Fairness Re-ranking (P-MMF) 的在线重排序模型来解决该问题。 具体来说,P-MMF 将提供者公平推荐制定为资源分配问题,其中曝光槽被视为要分配给供应商的资源,并且在此过程中使用最大-最小公平性作为正则化项。 我们表明该问题可以进一步表示为带有正则化的在线优化问题,并在其对偶空间中得到有效解决。 在在线重排序阶段,设计了一种动量梯度下降法来进行动态重排序。 理论分析表明,P-MMF的遗憾是有界的。 四个公共推荐数据集的实验结果表明,P-MMF 可以胜过最先进的基线和帕累托主导的现有供应商公平推荐模型。 实验结果还表明,P-MMF 可以在具有大量物品的语料库上有较小的计算成本。
论文介绍
论文题目:Learning Vector-Quantized Item Representation for Transferable Sequential Recommenders
作者:侯宇蓬、何占魁、Julian McAuley、赵鑫
通讯作者:赵鑫
论文概述:最近,自然语言的通用性被用于开发可迁移的推荐系统。其基本想法是使用预训练语言模型 (PLM) 将商品文本编码为商品表示。尽管该方法具有良好的可迁移性,但商品文本和商品表示之间的绑定可能“太紧”而导致一些潜在的问题,如过分强调文本特征的影响和扩大了领域之间差距的负面影响。为了解决此问题,本文提出了 VQ-Rec,一种基于向量量化的商品表示来学习可迁移的序列推荐模型的方法。该方法的主要创新性在于提出了一种新的商品表示方案:它首先将商品文本映射到离散索引向量(称为商品代码),然后使用这些索引来查找代码嵌入表示以导出商品表示。这样的方案可以表示为“文本=⇒代码=⇒表示”。基于这种表示方案,我们进一步提出了一种增强的对比学习预训练方法,使用半合成和混合域代码表示作为强负例。此外,我们设计了一种基于可微分的置换网络的新的跨域微调方法。在六个公共基准上进行的大量实验证明了所提出方法在跨域和跨平台设置中的有效性。
论文介绍
论文题目:Learning Disentangled Representation via Domain Adaptation for Dialogue Summarization
论文作者:李金鹏,夏应策,程信,赵东岩,严睿
通讯作者:赵东岩,严睿
论文概述:目前端到端模型主要由数据驱动,而获得高质量的标注数据成本很高,尤其在对话摘要任务中,数据标注难度大开销高。因此为了利用丰富的外部数据,先前的工作在其他领域(例如新闻领域)的数据上对模型进行预训练,然后在对话领域上进行微调。但在训练过程中,对话结构(通常是非正式的、多个参与者等)和传统新闻结构(通常是正规的和简洁的)之间的巨大差异被忽略了。
基于此,这项工作提出使用解耦表征向量的方法来减少不同域中数据之间的偏差。具体来讲,输入数据被解耦为域不变向量和域特定向量,前者携带的上下文信息应该是跨领域的(如新闻、对话),后者表明输入数据属于某个特定领域。为了使映射函数有效,本文使用对抗性学习和对比学习来约束被拆分的表征到目标空间。此外,本文提出了两种新的重构策略,即回溯重建和跨轨重建,旨在减少域外数据的领域特征,缓解模型在数据建模过程中的领域偏差。在三个对话摘要公开数据集上的实验结果表明,本文提出的方法取得了具有竞争力的结果。
论文介绍
论文题目:Recommendation with Causality enhanced Natural Language Explanations
作者:张景森,陈旭,唐嘉凯,邵维奇,戴全宇,董振华,张瑞
通讯作者:陈旭
论文概述:可解释推荐算法近年来受到了学术界和工业界越来越多的关注。 在各种推荐解释策略中,生成自然语言的解释方法可以提供可读、丰富且灵活的解释,帮助用户更好地决策。尽管此类方法有效,但现有模型大多根据观测到的数据进行优化,可能会由于数据中的选择偏差或曝光偏差而导致偏移。 为缓解上述问题,本文基于因果图形式化可解释推荐任务,并设计了一个因果关系增强框架来生成无偏的推荐解释。 更具体来讲,本文首先定义一个理想的无偏学习目标,然后根据逆倾向得分(IPS)推导出基于观测数据的易处理的损失函数,其中关键是使损失函数在期望上等价于理想目标的样本重加权策略。 考虑到从稀疏且嘈杂的推荐系统数据集中估计的 IPS 不准确,本文通过最小化 IPS 附近的样本权重引起的最大损失引入了容错机制。 为了更全面的建模,本文进一步分析并推断了由于复杂多样的用户个性而存在的隐式混杂因子。本文基于三个真实数据集进行了充足的实验,通过与先进方法的比较证明了所提出方法的有效性。
论文介绍
论文题目:Robust Recommendation with Adversarial Gaussian Data Augmentation
作者:王振磊,陈旭
通讯作者:陈旭
论文概述:推荐系统旨在准确的理解和评估用户的行为偏好。然而,真实的用户行为数据往往非常稀疏,这使得现有的推荐模型缺少鲁棒性,并且对动态的用户偏好和易变的推荐场景较为敏感。为了缓解这个问题,在本文中,我们提出一个简单且有效的鲁棒性推荐框架。该框架的核心在于从高斯分布中生成额外的样本,提升模型鲁棒性。具体来说,我们设计了两种类型的数据扩充策略。在第一种策略中,我们旨在模拟潜在空间的生成过程,直接从原始样本中生成数据。对于第二种策略,为了进行更有效的探索,我们首先朝着损失函数最大化的方向改变原始样本,之后基于改变的样本生成数据。对于上述两种策略,利用生成的数据集,用对抗性训练去优化推荐模型,以此达到模型的最大化损失。此外,在理论分析中发现上述两种数据增强策略等同于对原始推荐模型施加了一个梯度正则化。为了证明该框架的有效性,本文在六个真实数据集上对所提出的方法进行了验证。
检测到您当前使用浏览器版本过于老旧,会导致无法正常浏览网站;请您使用电脑里的其他浏览器如:360、QQ、搜狗浏览器的速模式浏览,或者使用谷歌、火狐等浏览器。
下载Firefox