专栏名称: 小韭菜的成长记录
深度研究行业及公司基本面, 一起探索大牛股的内在基因, 与企业一起分享净利润的增长。
目录
相关文章推荐
Foodaily每日食品  ·  当预制菜遇冷,“土味” 餐厅凭什么逆袭? ·  2 天前  
润农畜牧报价  ·  2025年2月14日 ... ·  昨天  
网信安徽  ·  这种食物深受追捧!尽量少吃,不只糖多→ ·  2 天前  
企鹅吃喝指南  ·  又挖到一款国产金酒,像甜橙龙井茶香水...... ·  4 天前  
51好读  ›  专栏  ›  小韭菜的成长记录

DeepSeek老板登上新闻联播!参加总理座谈会

小韭菜的成长记录  · 公众号  ·  · 2025-01-26 00:22

正文

由于微信公众号试行乱序推送,您可能不再能准时收到推送。为了不与小韭菜失散, 请将“ 小韭菜的成长记录 ”点亮为星标账号,并常点文末右下角的“ 在看 ”。

国产AI大模型领域,非常热闹!

1月20日下午,总理主持召开专家、企业家和教科文卫体等领域代表座谈会。


此前,非常少露面的DeepSeek老板梁文锋,受邀参加并发言。


中国AI界的传奇大佬,真人比想象中还年轻啊,皮肤保养好,看着还以为是学生代表。

这是见证历史性一刻,AI大佬上新闻联播了。

在参加总理会议的同一天,DeepSeek在官微上,发布了DeepSeek-R1 发布,性能对标 OpenAI o1 正式版。


DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。

在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。


R1的32B和70B版本,性能远远超过了OpenAI的GPT-4o,并逼近 o1-mini。


现在,DeepSeek已经全面上线了 R1,大家可以直接体验。


美国建筑设计工作室 Workshop-APD 的创始人Matthew Berman 表示:DeepSeek R1 拥有我所见过的最像人类的内心独白。

现在本地运行的 14b DeepSeek R1 蒸馏模型,能够把问题回答成这样,咱还要啥自行车呢?


17岁考入浙大
30岁创办幻方

如此厉害的DeepSeek大模型,背后并是不什么互联网科技大厂,而是炒股的。


DeepSeek深度求索,来自金融领域的头部量化:幻方量化。


梁文锋是幻方量化的实际控制人,他在DeepSeek最终受益的股份比例超80%。


1985年,梁文锋出生于广东湛江,那里盛产生蚝。他本硕就读于浙江大学,攻读人工智能,年轻读书时就笃定“AI定会改变世界”。

2008年,在浙大读书期间,23岁的梁文锋与同学一起组团队开始积累市场行情数据、金融市场其他相关数据以及宏观经济等数据。

梁文锋开始使用机器学习等技术,探索量化交易。

他的硕士毕业论文题目是《基于低成本PTZ摄像机的目标跟踪算法研究》。


梁文锋表示:自己是八十年代在广东一个五线城市长大的。
我的父亲是小学老师,九十年代,广东赚钱机会很多,当时有不少家长到我家里来,基本就是家长觉得读书没用。

但现在回去看,观念都变了。因为钱不好赚了,连开出租车的机会可能都没了。一代人的时间就变了。

毕业后,梁文锋没去做程序员,而是下场做量化投资,成立幻方量化。

他主导的幻方量化在2016年首次上线AI策略,并于2017年实现投资策略全面AI化,成为量化投资领域的创新先锋‌。

幻方量化成立仅6年管理规模即曾达到千亿,被称为「量化四大天王」之一。


也是国内唯一公开宣称有拥有万张英伟达A100显卡的企业,其算力储备量就算是在一众互联网公司科技公司里,也豪不逊色。

2023年,梁文锋创立了深度求索(DeepSeek)。


有消息称,DeepSeek团队不招聘高级技术专业人员。

员工的工作年限约为3到5年,而那些拥有8年以上研发经验的人还可能会被直接拒绝。因为他们害怕这样的人包袱太重、缺乏创新的动力。

梁文锋曾对36氪暗涌说:
“如果追求短期目标,找现成有经验的人是对的。但如果看长远,经验就没那么重要,基础能力、创造性、热爱等更重要。”

就像大家不可能猜到,做游戏显卡的英伟达,最后会成为AI界最重要的公司。

大家也不可能猜到,中国AI大模型的希望,可能就在炒股的公司身上。

背靠幻方量化的DeepSeek还不差钱。

梁文锋在2024年表示,短期内没有融资计划,面临的问题从来不是钱,而是高端芯片被禁运。

不参与融资,也很少对外发声,闷声去做AI。

外界都觉得DeepSeek很神秘。

近期“雷军千万年薪挖95后天才AI少女”的热门话题也间接地与梁文锋有关,因为雷军尝试挖走的这位90后少女罗福莉,此前正是梁文锋旗下深度求索(DeepSeek)团队的研发成员。

2024年12月26日,DeepSeek发布了DeepSeek-V3,并且还公开了由梁文锋、罗福莉等人撰写的53页论文《DeepSeek-V3 Technical Report》。


AI界拼多多

此前DeepSeek一直被冠以“AI界拼多多”。

它开启了中国大模型价格战。

2024年5月,DeepSeek发布的一款名为DeepSeek V2的开源模型,提供了史无前例的性价比:
推理成本被降到每百万token仅 1块钱,在当时约等于Llama3 70B的七分之一,GPT-4 Turbo的七十分之一。
随后,字节、腾讯、百度、阿里、kimi等AI公司跟随降价。

梁文锋表示,自己不是有意成为一条鲶鱼,只是不小心成了一条鲶鱼。没想到价格让大家这么敏感。只是按照自己的步调来做事,然后核算成本定价。

这次新发布的DeepSeek-R1 API 价格,一样给力。

DeepSeek-R1 API定价为:每百万输入 tokens 1 元(缓存命中)/ 4 元(缓存未命中),每百万输出 tokens 16 元。


对比OpenAI o1 的 API 定价:每百万输入 tokens 15 美元、每百万输出 tokens 60 美元。

每百万输出定价,大概仅为OpenAI的3.65%。

DeepSeek极高的性价比,简直是AI大模型界的拼多多。







请到「今天看啥」查看全文