为了推动大模型技术的普及与传播,经过数月的大量修订,由中国人民大学师生联手撰写的《大语言模型》中文书籍正式出版。作为该领域全面解析大模型技术的中文著作,该书将提供大模型技术的权威介绍,注重为大模型技术的入门读者提供讲解,力图展现一个整体的大模型技术框架和路线图。目前专著已经上线各大电商平台,文末附京东购买链接。
本书由中国人民大学高瓴人工智能学院赵鑫教授和文继荣教授领衔主编,博士生李军毅、周昆和硕士唐天一参与编著,作者团队在大模型领域有着丰富的研究与开发经验,曾主导研发了文澜、玉兰等大模型。
推荐语
张宏江 北京智源人工智能研究院学术顾问委员会主任、美国国家工程院外籍院士:
本书的编者长期从事大模型技术的相关研究,曾组织研发了文澜、玉兰等一系列大模型,具有深厚的科研与实践积累。本书内容深入结合了编者在研发大模型过程中的第一手经验,全面覆盖了大模型技术的多方面知识,可以作为深入学习大模型技术的参考书籍,强烈推荐阅读!
鄂维南 北京大学讲席教授、中国科学院院士:
本书的编写团队于2023年3月发布了学术界首篇大语言模型综述文章“A Survey of Large Language Models”,受到了广泛关注。在这篇经典综述文章基础上,编写团队对编写内容进行了精心组织与撰写,并且融入了其长期从事大模型技术的科研经验。本书具有重要的参考与学习价值,是一部值得推荐的大模型佳作。
张亚勤 清华大学智能科学讲席教授、中国工程院外籍院士:
大模型作为一种快速兴起的人工智能技术,已经深刻地影响了未来的科技发展趋势。为了更好地推进大模型技术在我国的学习与普及,亟须有专业的中文技术图书进行系统介绍。本书是一部精心编写的大模型技术图书,涵盖了预训练、微调、对齐、提示工程等众多基础内容,能够为相关从业人员提供权威的、系统的学习参考,强烈推荐阅读。
书籍特色
1.全面解读大语言模型
本书内容基本全覆盖大语言模型训练与使用的全流程,从预训练到微调与对齐,从使用技术到评测应用,帮助读者全面掌握大语言模型的核心技术。
2.丰富的配套代码与工具
本书以核心算法技术为基础,并配有大量的代码实战与讲解,同时搭配相关的开发工具包LLMBox与YuLan大模型,供读者深入阅读理解相关技术。
3.通俗易懂,专业权威
本书兼顾理论深度与阅读体验,以清晰的语言与丰富的图解,降低技术门槛,让初学者和专业人士都能轻松上手。
精美插图
我们梳理了自2019年以来的各大学术机构的大语言模型发展历程,可以看到近三年大模型的井喷式发展。
我们整理了基于LLaMA模型的各类衍生工作,通过继续预训练、指令微调等方法,LLaMA可以适配到不同的语言、多样的领域。
片段欣赏
本书通过图片、表格、公式、示例、代码、实验结果等多样化的展示形式,力求向读者深入浅出地讲解大模型的不同技术。
本书收集了不同的预训练数据过滤技巧,以“建议”的形式向读者更好地展示具体的过滤方法。
本书基于配套开发工具包LLMBox与YuLan大模型,展示了完整的指令微调代码,读者可以“端到端”上手实践。
书籍目录(共四个部分、13个章节,全书357页):
第一部分 背景与基础知识
第1章 引言
第2章 基础介绍
第3章 大语言模型资源
第二部分 预训练
第4章 数据准备
第5章 模型架构
第6章 模型预训练
第三部分 微调与对齐
第7章 指令微调
第8章 人类对齐
第四部分 使用与评测
第9章 解码与部署
第10章 提示学习
第11章 规划与智能体
第12章 评测
第13 章 总结
最后,附上本书的京东购买链接:
#小程序://京东购物/bJT3V4xYlzMGkby
或京东搜索:《大语言模型》书籍
检测到您当前使用浏览器版本过于老旧,会导致无法正常浏览网站;请您使用电脑里的其他浏览器如:360、QQ、搜狗浏览器的速模式浏览,或者使用谷歌、火狐等浏览器。
下载Firefox