近日,加拿大蒙特利尔大学计算机科学与运筹学系的聂建云教授和刘邦助理教授应中国人民大学高瓴人工智能学院窦志成教授邀请进行学术交流与访问。在此期间,两位专家于2023年8月12日分别为全院师生带来了题为“对话式搜索中的上下文信息利用”与“材料科学中的自然语言处理”的学术报告。本次讲座由高瓴人工智能学院徐君教授主持。
聂建云教授的学术报告着重探讨“在对话式搜索中如何充分利用对话上下文信息”。他首先引入了对话式信息检索的基本概念,并通过生动的案例展示了在对话式搜索中所面临的诸多难题及传统解决方法。随后,聂建云教授详细介绍了他的研究团队在KDD 2023会议上发表的论文《Learning to Relate to Previous Turns in Conversational Search》。该论文关注于在对话式搜索中,仅有部分对话历史与当前查询有关,他们提出了一种动态的相关历史信息选择机制,以减少对话历史中与本轮搜索无关的干扰信息。在多轮对话场景中,该方法已经超越了现有最佳方法。最后,聂建云教授结合当下热门的大型语言模型,展望了检索系统与大模型的融合,并回答了观众们的提问。
随后,刘邦助理教授进行了题为“材料科学中的自然语言处理”报告。在材料科学领域,每天都会涌现大量异构数据,如科学出版物、实验室报告、手册、表格等。因此,自然语言处理在理解和解析材料科学丰富数据集方面发挥着关键作用,尤其是在理解科学文献并从中提取有用信息方面。然而,将NLP技术直接应用于材料科学领域并不能在各种任务中取得理想的性能。原因包括材料科学文献的内容和风格与一般领域文本不同,需要领域专家知识来进行理解,同时材料科学领域缺乏高质量、大规模标注的NLP训练数据集。在报告中,刘邦博士介绍了他们在材料科学方面的研究工作。首先,他们提出了一个名为MatSci-NLP的自然语言基准,并研究了基于BERT模型的不同预训练策略对材料科学文本理解的影响。接着,他们提出了MatSci-Instruct,一个基于指令的处理过程,用于可靠地从数据中提取材料科学信息。他们还将这一框架应用于微调自Llama的语言模型HoneyBee,这是第一个专为材料科学开发的十亿参数语言模型。最后,刘邦博士探讨了观众关于NLP与交叉学科的问题,并分享了他的见解。
本次学术报告充分展示了聂建云教授和刘邦博士在各自领域的深厚造诣。同时,也向与会听众呈现了运筹学、深度学习与材料科学之间的相互关联与合作潜力。与会专家、研究人员和学生积极踊跃提问,促成了深入的讨论与交流。
检测到您当前使用浏览器版本过于老旧,会导致无法正常浏览网站;请您使用电脑里的其他浏览器如:360、QQ、搜狗浏览器的速模式浏览,或者使用谷歌、火狐等浏览器。
下载Firefox