2023年9月25日,由中国人民大学高瓴人工智能学院主办的“大模型与生物医药”学术研讨会顺利召开。
中国人民大学高瓴人工智能学院执行院长文继荣教授出席会议并致辞。与会专家有沙特阿拉伯阿卜杜拉王国科技大学高欣教授、俄亥俄州立大学生物医学信息学系/计算机科学与工程系宁夏教授、清华大学智能产业研究院/电子工程系马剑竹副教授、深势科技机器学习算法负责人柯国霖研究院以及中国人民大学高瓴人工智能学院长聘副教授孙浩、准聘副教授黄文炳、准聘副教授刘勇等。会议由中国人民大学高瓴人工智能学院长聘副教授许洪腾主持。
中国人民大学高瓴人工智能学院执行院长文继荣教授在会上向莅临的各位老师表示感谢。他表示,随着大模型的风潮,越来越多的科研单位也正逐渐投入这场大模型的开发活动中,因为大模型不光代表着人工智能的未来,也代表着人类科技的一个重要未来方向。大模型所蕴含的思路也已经不单单限于语言领域,而是对各行各业都深有启发。在我们已经可以对人类语言进行编码和建模的前提下,如何对人类自身的秘密以及世界的奥秘进行编码建模已然箭在弦上。目前高瓴人工智能学院也有多位教师从事相关研究,成为学院一个重要的研究方向。当前,高瓴人工智能在推进人工智能学科建设方面已取得了不错的成绩,为更好地服务国家人工智能发展战略,学院也在加快和各方合作的步伐,不断推进“AI+”深度融合,致力于在人工智能学科交叉领域做出具有人民大学特色的重要成果。
研讨会上,阿卜杜拉王国科技大学高欣教授分享了题为“Large Language Models in Biomedicine”的报告。他首先介绍了自己课题组的研究范式——从问题和数据出发,构建一些新颖的计算模型,研究各种高效的优化方法和图算法、序列算法来解决一系列生物和医疗相关的开创性问题。从2020年Alphafold将白质三维结构预测(或者说是蛋白质折叠问题)的基本攻克这个突破开始,人们就发现生物人工智能有着广阔的未来应用场景,生物也从一种偏小数据驱动、偏试错法驱动、偏经验主义的一种科学逐渐转向data-driven的大数据驱动的科学。随后,高欣教授给出了“LLM逻辑在病毒进化方面的应用-预测新冠病毒的进化”、“大模型在药物设计中的应用”、“干湿闭环的多肽药物设计平台”与“LLM逻辑在皮肤病检测方面的应用”等几个例子,阐述了生物数据多模态、多尺度、多维度、跨时间、跨空间的特点对生物大模型设计方面的启发并展示了“以跨模态的训练大模型作为底层支撑来进行多指标的同时优化与强化学习”这个范式的良好效果。
俄亥俄州立大学生物医学信息学系/计算机科学与工程系宁夏教授副教授线上远程分享了题为“Generative AI for Drug Discovery”的报告。她指出:用于药物发现的人工智能(AI)已经远远超出了对现有候选药物的预测分析。最近的尖端生成人工智能为生成新的药物结构和肽序列提供了巨大的机会,这些结构和肽可能不存在,但表现出比任何现有结构和肽更好的特性。随后,宁夏教授通过讲解分享“Modof:一个用于分子优化的深度生成模型”、“ShapeMol:一种用于三维分子生成的等变条件扩散模型”、“G2 Retro:用于逆合成预测的两步图生成模型”、“RLSynC:用于Synthon Completion的离线在线强化学习”以及“针对MHC I类蛋白质的结合肽生成”等工作来展开本次报告,详细介绍了基于自动编码器的深度学习、深度强化学习和扩散的工作的细节,展示了生成式人工智能如何在传统方法无法实现的领域助力药物发现。
中国人民大学高瓴人工智能学院准聘副教授黄文炳分享了题为:“几何机器学习助力抗体设计”的报告。报告从对“微观分子空间”和“宏观具身空间”这两类常见物理空间的相关数据及其几何结构的讲解开始,阐述了科学数据领域的三大挑战:“科学数据具有复杂结构”、“科学数据受科学定律约束”以及“科学任务的数据采集和验证受限”,并引入了“几何图神经网络助力科学研究”这一观点。之后,黄文炳教授以“抗体设计与优化”作为范例展开详细讲解,介绍了团队提出的基于几何深度学习的抗体设计方法(包含:多通道等变注意力网络(Multichannel Equivariant Attentive Network,简称MEAN)及其端到端版本dyMEAN)巧妙地解决了相关难题,并在最后进行了总结和展望:我们如今面临一个很好的一个时代,如何把知识、数据、模型去有机地结合以解决从抗原抗体的研究到更广阔的物理空间的各尺度上的任务,形成一个一个多尺度的通用模型,是一个值得关注和思考的任务。
来自清华大学智能产业研究院/电子工程系的马建竹副教授分享了题为“基于靶点3D结构的小分子药物生成模型”的报告。在此次报告中,马剑竹副教授探索了另一种AIDD的方式—根据靶点的3D结构采用生成模型直接生成3D的小分子配体并讨论了自回归模型、扩散模型和基于先验知识的生成模型如何分别从不同角度来解决这一问题,同时分析了他们各自的优势和劣势以及不同的应用场景。
深势科技的机器学习算法负责人柯国霖分享了题为“三维分子表征建模及生成”的报告。他从与中国人民大学学生合作的三项工作——“Uni-Mol:一个通用的三维分子表示学习框架”、“用Uni-Mol+进行高精度量子化学性质预测”、“基于虚拟动力学的三维分子生成”着手展开介绍。讲解了深势科技在这一方向的一系列研究工作。揭示了在AI for Science领域对微观原子三维结构进行建模和生成的一系列关键问题。最后,柯老师给出总结:三维结构对于小分子是非常关键的,无论是其生成还是表征都是十分重要的工作和方向。从上述的三个工作可以看到,物理或者更广义的一些Science上的支持其实对各个模型和任务的设计都有着极大的帮助。同时在Science的设计之外,我们一样不能忽略基于数据驱动的方法的有效性,尤其是当前的预训练策略下。
研讨环节,与会学者围绕“大模型和生物医药”这一议题展开了热烈讨论。交流的具体问题包括在3D结构数据与序列数据数据类型不尽相同的前提下如何找到一种更好的范式把大模型引入科学问题的研究、如何解决和看待Science领域数据的稀缺(比如生物医药领域数据的规模和自然语言/图像领域就有着巨大的鸿沟)、在科学领域是否存在所谓“通用模型”、如何看待“通用”模型和“大”模型的关系、如何看待多尺度建模和人工智能发展的些许“背道而驰”等。老师们的观点在风趣幽默的同时做到了鞭辟入里,给参与本次研讨会的同学们留下了深刻的印象。
检测到您当前使用浏览器版本过于老旧,会导致无法正常浏览网站;请您使用电脑里的其他浏览器如:360、QQ、搜狗浏览器的速模式浏览,或者使用谷歌、火狐等浏览器。
下载Firefox