//
@刘群MT-to-Death
:虽然对强化学习的能力有足够的认识,但这个结果真到很让人吃惊,强化学习竟然能够让模型学习到数独这种复杂的长链条结构化推理能力
前微软Asp.Net最有价值专家 互联网科技博主 我是宝玉。 |
![]() |
黄建同学 · 现在手机装的 AI ... · 12 小时前 |
![]() |
宝玉xp · 转发微博-20250313022510 · 昨天 |
![]() |
爱可可-爱生活 · LLM翻译领域知识的选择:检索还是生成 ... · 2 天前 |
![]() |
爱可可-爱生活 · [CL]《Leveraging ... · 2 天前 |
![]() |
爱可可-爱生活 · 本文创新性地提出了自进化偏好优化框架 ... · 2 天前 |
![]() |
黄建同学 · 现在手机装的 AI 客户端越来越多了,感觉每家都有自己的优势。今-20250313160340 12 小时前 |
![]() |
宝玉xp · 转发微博-20250313022510 昨天 |
![]() |
爱可可-爱生活 · LLM翻译领域知识的选择:检索还是生成 查看图片 //@爱可可-20250311081654 2 天前 |
![]() |
爱可可-爱生活 · [CL]《Leveraging Domain Knowledge-20250311054558 2 天前 |
![]() |
爱可可-爱生活 · 本文创新性地提出了自进化偏好优化框架 SPHERE,通过剪枝 M-20250311055121 2 天前 |
|
界面新闻 · 关于野生大熊猫的三个故事 8 年前 |
|
韩国me2day · 悬念揭晓,意外出现?2016 MAMA盛典落下帷幕! 8 年前 |
|
木雕 · 比黄金还要贵的沉香木雕,绝对震撼你的眼球~ 8 年前 |
|
读史 · 美国中产阶级为什么不买奢侈品,值得每一个中国家庭学习 8 年前 |
|
杭州交通918 · 超魔性!“拉丁小胖”走出国门~全场嗨翻!亚洲舞王谢飞机迎来强劲对手 7 年前 |