专栏名称: 黄建同学
数码博主 超话主持人(ChatGPT超话) 头条文章作者 我的学习笔记,关注AI+新能源
目录
相关文章推荐
机器之心  ·  AI「视觉图灵」时代来了!字节OmniHum ... ·  23 小时前  
爱可可-爱生活  ·  【The End of Search, ... ·  昨天  
爱可可-爱生活  ·  【RL_Reasoning_Writing_ ... ·  3 天前  
宝玉xp  ·  OpenAI 今天下午在 Reddit ... ·  5 天前  
51好读  ›  专栏  ›  黄建同学

网友adi用OpenAI ChatGPT Deep Resear-20250204074431

黄建同学  · 微博  · AI  · 2025-02-04 07:44

正文

2025-02-04 07:44

网友adi用OpenAI ChatGPT Deep Research 对 Deepseek 的整个研发历史进行了专家级的业务和技术分析,并做出了竞争格局和未来的推演。

回答还挺那么回事↓关键信息:

🔥 DeepSeek 最新研究亮点:强化学习助推大模型推理能力!

1️⃣ 强化学习催生推理能力:DeepSeek 发现,仅靠强化学习,LLM 便能自主形成链式思维(CoT),无需额外监督。R1-Zero 在数学测试中 pass@1 从 15.6% 提升至 71.0%,接近 OpenAI O1 水平!

2️⃣ RL + SL 互补训练更优:强化学习提升逻辑推理,但可能影响可读性。最佳策略:先用监督学习建立基础,再用强化学习优化推理,最后监督学习清理问题,确保既强大又流畅!

3️⃣ 小模型也能学会大技能:通过知识蒸馏,DeepSeek 训练出仅 1.5B 参数但超越 GPT-4o 的数学模型,挑战“只有大模型才能解决复杂任务”的传统认知!

4️⃣ 大上下文窗口解锁新任务:DeepSeek-R1 最高支持 128k tokens,可处理整本代码库或超长文档,为 LLM 在编程和多文档 QA 任务带来突破!

5️⃣ 低成本不等于弱性能:DeepSeek-V3/R1 训练成本 <600 万美元,仅几个月完成,性能却比肩 OpenAI 旗舰模型!关键秘诀:H800 GPU 并行训练、FP8 低精度计算、高效数据标注,证明“性价比 AI”可行!

🔮 2025 展望:
✅ DeepSeek-R2 预计增强工具调用、对话能力,并优化安全性
✅ 或突破 1 万亿参数,探索百万 tokens 上下文窗口

DeepSeek 正以开放性、低成本、高推理能力快速崛起,AI 领域格局正在变化!🚀

#OpenAI新模型对标DeepSeek##DeepSeek回答如何过好这一生##ai创造营#