浙大《大模型基础》教材- LaTeX制作严谨易读有深度

LaTeX工作室 · 公众号 · · 2024-12-04 12:06

正文

请到「今天看啥」查看全文

本书旨在为对大语言模型感兴趣的读者系统地讲解相关基础知识、介绍前沿技术。作者团队将认真听取开源社区以及广大专家学者的建议，持续进行 月度更新 ，致力打造 易读、严谨、有深度 的大模型教材。并且，本书还将针对每章内容配备相关的 Paper List ，以跟踪相关技术的 最新进展 。

本书第一版包括 传统语言模型 、 大语言模型架构演化 、 Prompt工程 、 参数高效微调 、 模型编辑 、 检索增强生成 等六章内容。为增加本书的易读性，每章分别以 一种动物 为背景，对具体技术进行举例说明，故此本书以六种动物作为封面。当前版本所含内容均来源于作者团队对相关方向的探索与理解，如有谬误，恳请大家多提issue，多多赐教。后续，作者团队还将继续探索大模型推理加速、大模型智能体等方向。相关内容也将陆续补充到本书的后续版本中，期待封面上的动物越来越多。

当前完整的本书PDF版本路径为大模型基础.pdf。另外，我们还提供了两个文件夹，大语言模型分章节内容文件夹中包含了各章节的PDF版本。而大语言模型相关论文文件夹中包含了各章节的相关论文，当前正处于不断更新中。

其中每个章节的内容目录如下表所示。

本书目录

章节	所含内容
第 1 章：语言模型基础	1.1 基于统计方法的语言模型	1.2 基于 RNN 的语言模型	1.3 基于 Transformer 的语言模型
第 1 章：语言模型基础	1.4 语言模型的采样方法	1.5 语言模型的评测
第 2 章：大语言模型	2.1 大数据 + 大模型 → 新智能	2.2 大语言模型架构概览	2.3 基于 Encoder-only 架构的大语言模型
第 2 章：大语言模型	2.4 基于 Encoder-Decoder 架构的大语言模型	2.5 基于 Decoder-only 架构的大语言模型	2.6 非 Transformer 架构
第 3 章：Prompt 工程	3.1 Prompt 工程简介	3.2 上下文学习	3.3 思维链
第 3 章：Prompt 工程	3.4 Prompt 技巧	3.5 相关应用
第 4 章：参数高效微调	4.1 参数高效微调简介	4.2 参数附加方法	4.3 参数选择方法
第 4 章：参数高效微调	4.4 低秩适配方法	4.5 实践与应用
第 5 章：模型编辑	5.1 模型编辑简介	5.2 模型编辑经典方法	5.3 附加参数法：T-Patcher
第 5 章：模型编辑	5.4 定位编辑法：ROME	5.5 模型编辑应用
第 6 章：检索增强生成	6.1 检索增强生成简介	6.2 检索增强生成架构	6.3 知识检索
第 6 章：检索增强生成	6.4 生成增强	6.5 实践与应用

资源获取

Github：https://github.com/ZJU-LLMs/Foundations-of-LLMs
百度网盘链接：https://pan.baidu.com/s/18fLNlPtYfgyvPvDnat29cg?pwd=c94g 提取码：c94g
夸克网盘：https://pan.quark.cn/s/591ab502a304

成为 LaTeX 会员，尽享精致科研！

开通地址：

https://www.latexstudio.net/index/recharge/choice.html