网友adi用OpenAI ChatGPT Deep Resear-20250204074431_黄建同学的专栏文章_微信文章

网友adi用OpenAI ChatGPT Deep Resear-20250204074431

黄建同学 · 微博 · AI · 2025-02-04 07:44

正文

2025-02-04 07:44
本条微博链接

网友adi用OpenAI ChatGPT Deep Research 对 Deepseek 的整个研发历史进行了专家级的业务和技术分析，并做出了竞争格局和未来的推演。

回答还挺那么回事↓关键信息：

🔥 DeepSeek 最新研究亮点：强化学习助推大模型推理能力！

1️⃣ 强化学习催生推理能力：DeepSeek 发现，仅靠强化学习，LLM 便能自主形成链式思维（CoT），无需额外监督。R1-Zero 在数学测试中 pass@1 从 15.6% 提升至 71.0%，接近 OpenAI O1 水平！

2️⃣ RL + SL 互补训练更优：强化学习提升逻辑推理，但可能影响可读性。最佳策略：先用监督学习建立基础，再用强化学习优化推理，最后监督学习清理问题，确保既强大又流畅！

3️⃣ 小模型也能学会大技能：通过知识蒸馏，DeepSeek 训练出仅 1.5B 参数但超越 GPT-4o 的数学模型，挑战“只有大模型才能解决复杂任务”的传统认知！

4️⃣ 大上下文窗口解锁新任务：DeepSeek-R1 最高支持 128k tokens，可处理整本代码库或超长文档，为 LLM 在编程和多文档 QA 任务带来突破！

5️⃣ 低成本不等于弱性能：DeepSeek-V3/R1 训练成本 <600 万美元，仅几个月完成，性能却比肩 OpenAI 旗舰模型！关键秘诀：H800 GPU 并行训练、FP8 低精度计算、高效数据标注，证明“性价比 AI”可行！

🔮 2025 展望：
✅ DeepSeek-R2 预计增强工具调用、对话能力，并优化安全性
✅ 或突破 1 万亿参数，探索百万 tokens 上下文窗口

DeepSeek 正以开放性、低成本、高推理能力快速崛起，AI 领域格局正在变化！🚀

#OpenAI新模型对标DeepSeek##DeepSeek回答如何过好这一生##ai创造营#