专栏名称: Datawhale
一个专注于AI领域的开源组织,汇聚了众多顶尖院校和知名企业的优秀学习者,聚集了一群有开源精神和探索精神的团队成员。愿景-for the learner,和学习者一起成长。
目录
相关文章推荐
51好读  ›  专栏  ›  Datawhale

人大赵鑫教授团队出品,深入学习大语言模型!

Datawhale  · 公众号  ·  · 2025-02-20 23:22

正文

Datawhale发布

团队:中国人民大学赵鑫教授,文末送书

你是否读过大语言模型综述文 章《A Survey of Large Language Models》? 这是 学术界首篇系统介绍大语言模型技术的综述性文章 ,成为了很多人入门大模型的必读论文,目前引用次数已经突破 4000 余次,获得了学术界的广泛关注。其中绘制的模型演进图、技术统计表被广泛传播、使用。



论文地址:https://arxiv.org/pdf/2303.18223v10.pdf


为了进一步推动我国大模型技术的发展,该综述文章作者团队经过数月的写作与修订,于近日《大语言模型》中文书籍正式出版上线。该书注重为读者提供系统性的知识讲解,力图展现一个整体的大模型技术框架和路线图,权威且系统!

本书由中国人民大学师生联手打造,由赵鑫教授和文继荣教授领衔,博士生李军毅、周昆和硕士唐天一参与编著,作者团队在大模型领域有着丰富的研究与开发经验,曾主导研发了文澜、玉兰等大模型。


01

书籍背后强大的作者团队

书籍背后的团队到底有多彪悍?一起来看看吧。

赵鑫 中国人民大学高瓴人工智能学院教授,北京大学博士,国家自然科学基金 优秀青年科学基金项目获得者。研究方向为大模型与自然语言处理,组织编写了大语言模型英文综述文章“A Survey of LargeLanguage Models”。

李军毅 新加坡国立大学研究员,中国人民大学与加拿大蒙特利尔大学博士,研究方向为大模型与自然语言处理。

周昆 中国人民大学博士,曾获微软学者奖学金、百度奖学金、字节跳动奖学金,研究方向为多模态理解与自然语言处理。

唐天一 阿里巴巴通义千问高级算法工程师,曾获国家奖学金、ACM-ICPC银奖,研究方向为大模型与自然语言处理。

文继荣 中国人民大学高瓴人工智能学院执行院长,国家高层次人才专家,曾任微软亚洲研究院高级研究员和互联网搜索与挖掘组主任。长期从事人工智能和大数据领域的研究工作,近年来尤其专注于大模型相关方向的研究。

本书还收到了三位院士的推荐。

本书的编者长期从事大模型技术的相关研究,曾组织研发了文澜、玉兰等一系列大模型,具有深厚的科研与实践积累。本书内容深入结合了编者在研发大模型过程中的第一手经验,全面覆盖了大模型技术的多方面知识,可以作为深入学习大模型技术的参考书籍,强烈推荐阅读!

张宏江 北京智源人工智能研究院学术顾问委员会主任、美国国家工程院外籍院士

本书的编写团队于2023年3月发布了学术界首篇大语言模型综述文章“A Survey of Large Language Models”,受到了广泛关注。在这篇经典综述文章基础上,编写团队对编写内容进行了精心组织与撰写,并且融入了其长期从事大模型技术的科研经验。本书具有重要的参考与学习价值,是一部值得推荐的大模型佳作。

鄂维南 北京大学讲席教授、中国科学院院士

大模型作为一种快速兴起的人工智能技术,已经深刻地影响了未来的科技发展趋势。为了更好地推进大模型技术在我国的学习与普及,亟须有专业的中文技术图书进行系统介绍。本书是一部精心编写的大模型技术图书,涵盖了预训练、微调、对齐、提示工程等众多基础内容,能够为相关从业人员提供权威的、系统的学习参考,强烈推荐阅读。

张亚勤 清华大学智能科学讲席教授、中国工程院外籍院士






请到「今天看啥」查看全文