专栏名称: FM1007福建交通广播
我们是全省最有影响力的交通广播,我们是唯一一家全省同频的电台(调频:FM100.7),我们是被福建省政府授予的应急广播:关键时候我们都在!上百万有趣车友的大家庭,你加入了吗?
目录
相关文章推荐
青眼号外  ·  “光子嫩肤第一股”败走北交所 ·  昨天  
青眼号外  ·  “光子嫩肤第一股”败走北交所 ·  昨天  
红古发布  ·  新春走基层丨文化创意新场景点亮蛇年新春 ·  2 天前  
GitHub猿  ·  一款神仙儿 JSON 可视化工具神器,绝了! ·  3 天前  
GitHub猿  ·  一款神仙儿 JSON 可视化工具神器,绝了! ·  3 天前  
浙江城市之声  ·  松下电器将解散 ·  4 天前  
浙江城市之声  ·  松下电器将解散 ·  4 天前  
51好读  ›  专栏  ›  FM1007福建交通广播

李飞飞团队训练出媲美DeepSeek R1的推理模型,云计算费用不到50美元

FM1007福建交通广播  · 公众号  · 科技创业  · 2025-02-06 19:05

主要观点总结

文章介绍了李飞飞等研究人员在斯坦福大学和华盛顿大学利用云计算训练的人工智能推理模型s1。该模型使用不到50美元的云计算费用进行训练,数学和编码能力表现优秀,与尖端推理模型如OpenAI的o1和DeepSeek的R1相当。该模型由谷歌推理模型Gemini 2.0 Flash Thinking Experimental通过蒸馏法提炼而来,并使用英伟达H100 GPU进行了训练。

关键观点总结

关键观点1: 人工智能推理模型s1的训练和表现

该模型使用云计算进行训练,费用不到50美元。在数学和编码能力测试中表现优秀,与顶尖推理模型相比具有竞争力。

关键观点2: s1模型的来源和技术

s1模型是基于谷歌的推理模型Gemini 2.0 Flash Thinking Experimental,通过蒸馏法提炼而来。使用了16个英伟达H100 GPU进行训练。

关键观点3: 云计算费用的说明

所提到的“不到50美元”仅为云计算服务费用,不包括服务器、显卡等硬件投入费用,这部分已经由云厂商承担。


正文

2月6日,李飞飞等斯坦福大学和华盛顿大学研究人员近日以不到50美元的云计算费用训练了一个名叫s1的人工智能推理模型。该模型在数学和编码能力测试中的表现与OpenAI的o1和DeepSeek的R1等尖端推理模型类似。

研究人员表示,s1是通过蒸馏法由谷歌推理模型Gemini 2.0 Flash Thinking Experimental提炼出来的,使用16个英伟达H100 GPU进行了26分钟的训练。

记者了解到,“不到50美元”仅为云计算服务费用,不包括服务器、显卡等硬件投入费用,因这部分已经由云厂商承担。

END


来源:财联社

免责声明:文章内容如涉及作品内容、版权和其它问题,请在30日内与本公众号联系,我们将在第一时间删除内容。文章只提供参考并不构成任何投资及应用建议。



点亮







请到「今天看啥」查看全文