专栏名称: Datawhale
一个专注于AI领域的开源组织,汇聚了众多顶尖院校和知名企业的优秀学习者,聚集了一群有开源精神和探索精神的团队成员。愿景-for the learner,和学习者一起成长。
目录
相关文章推荐
51好读  ›  专栏  ›  Datawhale

感谢DeepSeek,ChatGPT开始公开o3思维链,有点open但不多!

Datawhale  · 公众号  · 科技自媒体  · 2025-02-07 12:25

主要观点总结

OpenAI推出更新允许用户查看模型的思维链内容。其中o3-mini模型能够展示推理过程,但并非原始思考内容,而是经过简化和安全处理的版本。这一改变部分原因是受到DeepSeek R1的启发,为了平衡模型的自由思考与用户理解的清晰度及安全性。此外,这一后处理步骤也使非英语用户能更友好地接收思维链。

关键观点总结

关键观点1: OpenAI推出系列更新,包括展示模型的思维链内容。

OpenAI为ChatGPT推出了一系列更新,其中一项重要改进是允许用户查看模型的思维链内容,如o3-mini模型的推理过程。

关键观点2: 思维链内容并非模型原始思考。

展示的CoT内容并非模型原始的连续思考过程,而是经过简化和处理的版本,作为“总结器”呈现。

关键观点3: OpenAI更新部分原因是为了竞争和平衡用户需求。

OpenAI之所以选择展示总结版本而非完整的思维链,部分原因是竞争压力。公司试图找到一个平衡,使用户能够更容易地理解和接受模型的思考过程。

关键观点4: 后处理步骤提高清晰度和安全性。

OpenAI增加了一个后处理步骤,模型会审查原始思维链,移除任何不安全的内容,然后简化复杂的思想。此外,这一步骤也使非英语用户更友好地接收思维链。


正文

请到「今天看啥」查看全文


Datawhale分享

OpenAI:思维链,整理:Datawhale

信息来源|新智元
今天凌晨,OpenAI 为 ChatGPT 推出了一系列更新,其中一项重要改进是允许用户更深入地查看 o3-mini 和 o3-mini-high 模型的思维链内容。
比如问「怎么今天不是星期五啊😅」?
在展示出来的CoT中,o3-mini一步步思考,这个问题应该是用户在搞幽默,觉得本周应该快结束了,结果还没结束。因此,自己需要给一个聪明机智的回答。
然后它用Zeller公式计算后发现,2025年2月6日的确是星期四,即使闰年的特殊情况也是如此。
最终,它回答说:今天的确是周四不是周五,日历就是这么定的。然后提供了一番情绪价值,鼓励用户说:再忍忍,只差一天啦!
不过,机智的大神们很快就发现了「华点」——这是「真的CoT」吗?
没多久,就破案了!
先是OpenAI研究员Noam Brown发文表示,这次放出来的并不是模型原始的CoT。
随后,Tibor Blaho也发现——所谓的CoT,无非就是个「总结器」而已。(手动狗头)
对此,奥特曼解释道,我们正努力整理原始的CoT提升可读性,并在必要时提供翻译,尽量保持原始内容的忠实度。
他放出了四个emoji,让o3-mini在思维链中展示了一把推理过程

部分开放的原因

OpenAI这波植入CoT总结器的做法,着实是被DeepSeek R1强势崛起吓到了。

o3-mini发布当天,OpenAI在Reddit开启AMA在线问答中,网友曾提问,「我们能看到模型思考的所有token吗」?
当时,奥特曼回复道,「我们很快就会展示一个更有帮助、更详细的版本」。
仅仅在不到一周的今天,OpenAI就更新了。
但这次,OpenAI之所以选择展示总结版本,而不是完整的思维链,部分原因还是竞争。该公司表示其找到了一个平衡:o3-mini可以「自由思考」,然后将其「思维」组织成某个总结版本。
对此,OpenAI发言人表示,「为了提高清晰度和安全性,我们增加了一个额外的后处理步骤,其中模型审查原始思维链,移除任何不安全的内容,然后简化任何复杂的思想。」
「此外,这个后处理步骤使非英语用户能够以他们的母语接收思维链,创造一个更易于访问和友好的体验。」
参考资料:

https://x.com/btibor91/status/1887633671483760862

https://x.com/OpenAI/status/1887616278661112259

https://x.com/polynoamial/status/1887621287616651429








请到「今天看啥」查看全文