专栏名称: 机器学习算法与Python实战
长期跟踪关注统计学、数据挖掘、机器学习算法、深度学习、人工智能技术与行业发展动态,分享Python、机器学习等技术文章。回复机器学习有惊喜资料。
目录
相关文章推荐
Python爱好者社区  ·  爬虫行情变了,差别真的挺大。。。 ·  16 小时前  
Python中文社区  ·  三年稳赚40倍!用布林带挤压策略跑赢特斯拉 ·  昨天  
Python开发者  ·  上万点赞!使用 Cursor AI 编程的 ... ·  2 天前  
Python爱好者社区  ·  付费上班终于成为了现实。 ·  2 天前  
Python爱好者社区  ·  吴恩达,yyds ·  4 天前  
51好读  ›  专栏  ›  机器学习算法与Python实战

《Python 机器学习》作者新作:从头开始构建大型语言模型,代码已开源

机器学习算法与Python实战  · 公众号  ·  · 2024-06-23 16:02

正文

机器之心报道 机器之心编辑部


自 ChatGPT 发布以来,大型语言模型(LLM)已经成为推动人工智能发展的关键技术。


近期,机器学习和 AI 研究员、畅销书《Python 机器学习》作者 Sebastian Raschka 又写了一本新书 ——《Build a Large Language Model (From Scratch)》,旨在讲解从头开始构建大型语言模型的整个过程,包括如何创建、训练和调整大型语言模型。



最近,Sebastian Raschka 在 GitHub 上开源了这本新书对应的代码库。



项目地址:https://github.com/rasbt/LLMs-from-scratch/tree/main?tab=readme-ov-file


对 LLM 来说,指令微调能够有效提升模型性能,因此各种指令微调方法陆续被提出。 Sebastian Raschka 发推重点介绍了项目中关于指令微调的部分,其中讲解了:


  • 如何将数据格式化为 1100 指令 - 响应对;

  • 如何应用 prompt-style 模板;

  • 如何使用掩码。



《Build a Large Language Model (From Scratch)》用清晰的文字、图表和示例解释每个阶段,从最初的设计和创建,到采用通用语料库进行预训练,一直到针对特定任务进行微调。



具体来说,新书和项目讲解了如何:


  • 规划和编码 LLM 的所有部分;

  • 准备适合 LLM 训练的数据集;

  • 使用自己的数据微调 LLM;

  • 应用指令调整方法来确保 LLM 遵循指令;

  • 将预训练权重加载到 LLM 中。


作者介绍



个人主页:https://sebastianraschka.com/


Sebastian Raschka 是一名机器学习和人工智能研究员,曾在威斯康星大学麦迪逊分校担任统计学助理教授,专门研究深度学习和机器学习。他让关于 AI 和深度学习相关的内容更加容易获得,并教人们如何大规模利用这些技术。


此外,Sebastian 热衷于 开源软件 ,十多年来一直是一个充满热情的开源贡献者。他提出的方法现已成功应用于 Kaggle 等机器学习竞赛。


除了编写代码,Sebastian 还喜欢写作,并撰写了畅销书《Python Machine Learning》(《Python 机器学习》)和《Machine Learning with PyTorch and ScikitLearn》。


参考链接:https://twitter.com/rasbt/status/1802327699937009807


找了AI,陪6岁女儿学英语,英国伦敦腔
搭建机器学习开发环境及Python基础,108页PDF






请到「今天看啥」查看全文


推荐文章
Python爱好者社区  ·  爬虫行情变了,差别真的挺大。。。
16 小时前
Python爱好者社区  ·  付费上班终于成为了现实。
2 天前
Python爱好者社区  ·  吴恩达,yyds
4 天前
颇可网  ·  2016 POCO摄影年度评选揭晓!
8 年前