专栏名称: 机器学习算法与Python实战

长期跟踪关注统计学、数据挖掘、机器学习算法、深度学习、人工智能技术与行业发展动态，分享Python、机器学习等技术文章。回复机器学习有惊喜资料。

目录

相关文章推荐

北京晚报 · 北京一男子独闯黄花顶失联！不幸遇难，遗体已找到 · 7 小时前

北京晚报 · 北京一男子独闯黄花顶失联！不幸遇难，遗体已找到 · 7 小时前

吉林果粉天天报 · 吉林市两所学校揭牌成立 · 2 天前

吉林果粉天天报 · 吉林市两所学校揭牌成立 · 2 天前

吉林生态环境 · 来啦！吉林省生态环境分区管控应用平台正式上线 · 3 天前

51好读 › 专栏 › 机器学习算法与Python实战

复旦大学《大规模语言模型：从理论到实践》完整PDF和PPT课件下载

机器学习算法与Python实战 · 公众号 · · 2024-08-13 15:30

正文

大语言模型（Large Language Models，LLM）是一种由包含数百亿以上权重的深度神经网络构建的语言模型，使用自监督学习方法通过大量无标记文本进行训练。自2018年以来，包含Google、OpenAI、Meta、百度、华为等公司和研究机构都纷纷发布了包括BERT， GPT等在内多种模型，并在几乎所有自然语言处理任务中都表现出色。2021年开始大模型呈现爆发式的增长，特别是2022年11月ChatGPT发布后，更是引起了全世界的广泛关注。用户可以使用自然语言与系统交互，从而实现包括问答、分类、摘要、翻译、聊天等从理解到生成的各种任务。大型语言模型展现出了强大的对世界知识掌握和对语言的理解。本书将介绍大语言模型的基础理论包括语言模型、分布式模型训练以及强化学习，并以Deepspeed-Chat框架为例介绍实现大语言模型和类ChatGPT系统的实践。

第一章绪论
第二章大语言模型基础
第三章大语言模型预训练数据
第四章分布式模型训练
第五章有监督微调
第六章强化学习
第七章大语言模型应用
第八章大语言模型评估

完整PDF和PPT课件下载

点击下方公众号号卡片，关注「玩机器学习的章北海」

请到「今天看啥」查看全文

推荐文章

北京晚报 · 北京一男子独闯黄花顶失联！不幸遇难，遗体已找到

7 小时前

北京晚报 · 北京一男子独闯黄花顶失联！不幸遇难，遗体已找到

7 小时前

吉林果粉天天报 · 吉林市两所学校揭牌成立

2 天前

吉林果粉天天报 · 吉林市两所学校揭牌成立

2 天前

吉林生态环境 · 来啦！吉林省生态环境分区管控应用平台正式上线

3 天前

参考消息 · 2017年度《参考消息》订阅启动，微信订报立减20元~

8 年前

海蓝博士 · 提起出轨就离婚，那是你没经历过

8 年前

山西有料 · 世界再大，都不如关注这几个公众号

7 年前

银幕穿越者 · 《神奇女侠》成功为DC续命?

7 年前

解放军报 · 建军90周年 | 一句口号，为何占据了这个旅史馆的整个橱窗？

7 年前

Sov5搜索 · 小百科 · 今天看啥 · 移动版

51好读 - 好文章就要读起来!