专栏名称: 黄建同学

数码博主超话主持人（ChatGPT超话）头条文章作者我的学习笔记，关注AI+新能源

目录

相关文章推荐

51好读 › 专栏 › 黄建同学

Unsloth AI 与 Hugging Face 合作推出的微-20250402182755

黄建同学 · 微博 · AI · 2025-04-02 18:27

正文

请到「今天看啥」查看全文

2025-04-02 18:27
本条微博链接

Unsloth AI 与 Hugging Face 合作推出的微调教程，教我们如何使用 GRPO 微调 LLM！

内容：
- 奖励函数 + 创建奖励函数
- GRPO Math + Colab 中的免费推理训练
- 将 RL 应用于现实世界的用例

课程：huggingface.co/reasoning-course
教程：docs.unsloth.ai/basics/reasoning-grpo-and-rl/tutorial-train-your-own-reasoning-model-with-grpo

#ai创造营# #程序员# #科技#

请到「今天看啥」查看全文

推荐文章

艺恩数据 · 鼓山影视发布2017内容战略，深耕网剧市场、聚焦年轻化、打造精品

8 年前

雷峰网 · 高晓松对话比尔盖茨：人工智能还有最后一个难题

8 年前

小学生作文 · 天文气象

7 年前

陆家嘴制高点 · 【震惊】扒一扒2003年的高考无数人的命运因为他改变了！

7 年前

网易百行探秘 · 【领券中心】限时最高额早鸟券，只在这里有

7 年前

Sov5搜索 · 小百科 · 今天看啥 · 移动版

51好读 - 好文章就要读起来!