4月30日,国际交叉/综合/新兴A类会议WWW 2023正式公布了论文获奖名单,中国人民大学高瓴人工智能学院窦志成教授作为通讯作者的论文“Learning Denoised and Interpretable Session Representation for Conversational Search”,和徐君教授作为通讯作者的论文“P-MMF: Provider Max-min Fairness Re-ranking in Recommender System”分别获得WWW 2023焦点论文-最佳论文提名奖(Spotlight -Best Paper Nominations)。国际万维网会议(Proceedings of the ACM Web Conference 2023,简称 WWW’23) , 是中国计算机学会(CCF)推荐的A类国际学术会议,WWW’23 中国人民大学高瓴人工智能学院师生共有7篇论文被录用。本届会议Research Track共收到1891篇投稿,评选出16篇Spotlight-Best Paper Nominations论文。
高瓴人工智能学院窦志成教授组博士生毛科龙、加拿大蒙特利尔大学助理教授刘邦以及华为泊松实验室合作的论文“Learning Denoised and Interpretable Session Representation for Conversational Search”,针对当前对话式搜索面临的复杂搜索意图理解问题,提出了一种创新的解决方案——稀疏的基于词元的对话式检索器LeCoRE。相比传统的单轮ad-hoc搜索,对话式搜索支持多轮的用户-系统交互以解决复杂的信息需求,然而由于会话较长且包含大量冗余的噪声,这给搜索意图理解带来了更大的挑战。目前已有的对话式稠密检索解决方案只是在有限的对话式搜索数据上对预先训练的ad-hoc查询编码器进行微调,难以达到令人满意的性能。同时,这种方式学习到的潜在表征也缺乏可解释性,人们无法感知模型是如何理解会话的。LeCoRE模型采用了统一的基于知识蒸馏和外部查询重写的两种匹配良好的多级去噪方法,以生成去噪的且更可解释的会话表征,并在四个公共对话搜索数据集上取得了优越的实验效果,这一创新性的方法为对话式搜索领域的研究提供了新的思路和方向。
图1 已有的对话式搜索方法与LeCoRE的概念图示。LeCoRE采用了基于知识蒸馏的多级去噪方法,同时支持面向下游搜索任务的端到端优化和较好的可解释性。
高瓴人工智能学院徐君教授组博士生徐晨、准聘助理教授沈蔚然、张骁以及华为诺亚方舟实验室合作的论文“P-MMF: Provider Max-min Fairness Re-ranking in Recommender System”从社会学的角度讨论了推荐平台如何公平地为推荐系统的供应商分配流量,并且从社会学中的公平(equity)概念出发,阐述了最大-最小公平性指标是一个更加适合供应商公平的指标。最大-最小公平性指标与用户体验相结合,以保障弱小供应商的生存空间,从而使推荐市场更加稳定、健康。
在本文中,我们提出了一种名为 Provider Max-min Fairness Re-ranking (P-MMF) 的在线重排序模型来解决该问题。具体来说,P-MMF 将提供者公平推荐制定为资源分配问题,其中曝光槽被视为要分配给供应商的资源,并且在此过程中使用最大-最小公平性作为正则化项。我们表明该问题可以进一步表示为带有正则化的在线优化问题,并在其对偶空间中得到有效解决。在在线重排序阶段,设计了一种动量梯度下降法来进行动态重排序。理论分析表明,P-MMF的遗憾是有界的。四个公共推荐数据集的实验结果表明,P-MMF 可以胜过最先进的基线和帕累托主导的现有供应商公平推荐模型。实验结果还表明,P-MMF 可以在具有大量物品的语料库上有较小的计算成本。这个工作已在工业界的推荐产品中得到了验证,可应用于推荐广告等多个场景,未来还有很大的想象空间。
图 2 平等(Equality)和公平(equity)的区别。平等更多从用户公平性的角度出发,是一个法律意义上的公平性指标。而平等更多从供应商公平性角度出发,更多考虑的是经济意义上的公平性。
窦志成教授简介
窦志成,中国人民大学高瓴人工智能学院副院长、教授、博士生导师,北京智源人工智能研究院“智能信息检索与挖掘”方向项目经理,基于大数据文科综合训练国家级虚拟仿真实验教学中心执行主任。2008 至 2014 年在微软亚洲研究院工作,2014 年开始在中国人民大学任教。主要研究方向为智能信息检索、自然语言处理、大数据分析。已在国际知名学术会议和期刊上(如 SIGIR、WWW、CIKM、WSDM、ACL、EMNLP、TKDE 等)发表论文 70余篇,获 SIGIR 2013 最佳论文提名奖,AIRS 2012 最佳论文奖。曾担任信息检索领域顶级会议 SIGIR 的程序委员会主席(2019 短文),亚洲信息检索学术会议 AIRS 大会主席(2016)、程序委员会主席(2017)和执委会主席(2018),全国信息检索学术会议CCIR 程序委员会主席(2020)等。任多个国际学术会议和期刊的程序委员会委员和审稿人,任中国计算机学会大数据专家委员会副秘书长、中文信息学会信息检索专委会副主任。除学术研究外,窦志成教授还乐于将研究想法实现成可运行的系统,亲自动手开发了包括时事探针在内的多个系统,拥有多项发明专利。
(http://playbigdata.ruc.edu.cn/)
徐君教授简介
徐君,中国人民大学高瓴人工智能学院教授(长聘副教授)、中国人民大学杰出学者特聘教授、北京智源人工智能研究院智源学者。曾就职于微软亚洲研究院、华为诺亚方舟实验室(香港)和中国科学院计算技术研究所,于2018年9月加入中国人民大学工作至今。研究领域包括互联网搜索与推荐模型和系统,发表论文100余篇、专著2本、授权专利10余个,部分研究成果多次被欧美学者收录于信息检索教科书、应用于微软和华为的搜索和推荐产品。获ACM SIGIR 2019 Test of Time Award Honorable Mention、CIKM 2017 Best Full Paper Runner-up、CCIR 2022、AIRS 2010和ICMLC 2005最佳论文奖,获北京市自然科学奖二等奖(排名第2)。主持国家重点研发和国家自然科学基金面上项目。
检测到您当前使用浏览器版本过于老旧,会导致无法正常浏览网站;请您使用电脑里的其他浏览器如:360、QQ、搜狗浏览器的速模式浏览,或者使用谷歌、火狐等浏览器。
下载Firefox