刚才听到张小珺这一期的播客讲到 Self-play RL 到现在依然还是非共识。
#ai#
有点感叹,没了 Open AI 和 Anthropic 这行业真不知道怎么办。
Andrej Karpathy 在去年的公开视频都讲烂的东西,讲的中学生都可以听懂的东西(推理能力、奖励模型、封闭域、数学&代码)。
目前国内只有 DeepSeek 在实践和探索,其他公司不知道在干嘛。
有点感叹,没了 Open AI 和 Anthropic 这行业真不知道怎么办。
Andrej Karpathy 在去年的公开视频都讲烂的东西,讲的中学生都可以听懂的东西(推理能力、奖励模型、封闭域、数学&代码)。
目前国内只有 DeepSeek 在实践和探索,其他公司不知道在干嘛。