专栏名称: 阿尔法工场研究院
民间投资共享平台——汇集投资高手,发现投资好点子。
目录
相关文章推荐
小兵研究  ·  企业出海:上市、布局和财富 ·  2 天前  
毛有话说  ·  白宫大型翻车实录 ·  2 天前  
投行小兵  ·  企业出海:上市、布局和财富 ·  3 天前  
调研心得  ·  外围,炸锅了! ·  3 天前  
51好读  ›  专栏  ›  阿尔法工场研究院

九坤CEO会成为第二个“梁文锋”吗?

阿尔法工场研究院  · 公众号  · 投资  · 2025-03-03 07:00

主要观点总结

文章主要讨论了量化机构在大模型领域的活动及大模型领域的发展状况。包括九坤成功复现DeepSeek-R1,发现语言混合降低推理能力等问题,宽则在智能学习实验室人才招聘上的动作,以及梁文锋和王琛的创业经历和大模型领域的发展阶段。

关键观点总结

关键观点1: 九坤成功复现DeepSeek-R1并发现新问题

九坤携手微软团队成功复现DeepSeek-R1,并首次发现语言混合会显著降低推理能力等问题。

关键观点2: 宽则在智能学习实验室人才招聘上的动作

宽则发布了智能学习实验室人才招聘通知,表明该实验室将朝着整个人工智能领域发展。

关键观点3: 梁文锋和王琛的创业经历与大模型领域的发展

梁文锋和王琛都是清华系创业人才,王琛的九坤进入大模型领域的原因包括量化本身需要算法支持以及拥有高性能芯片。王琛的创业经历和九坤的发展也反映了量化机构在大模型领域的活动。

关键观点4: 大模型领域的发展阶段

大模型领域虽好,但仍在发展的较早阶段,未来要看大模型和行业结合孕育而出的产品。投资机构在大模型领域的投资也需谨慎。


正文

作者 | 雷教授

来源 | 路边消息社

语:技术创新很难复制,否则,拥有技术的大模型六虎,怎么还在挣扎融资和降低成本中不可自拔?

这帮做量化的,捅了大模型的老巢了?


笔者了解到一个最新消息,梁文锋的幻方量化老对手、量化巨头九坤,携手微软团队成功复现DeepSeek-R1,还首次发现了语言混合(例如中英文夹杂)会显著降低推理能力等问题。


怎么又是做量化的?


这还没完,另一量化巨头宽则在2月24日发布了智能学习实验室人才招聘通知,宣称该实验室将朝着整个人工智能启航。


这真是量化人才捅了大模型的老巢?


笔者问了身边的投资人朋友,“难道以后要去量化机构投资大模型团队了?”一些关注AI领域的投资人的第一反应都是:什么?难道我们要找关系拜访王琛了?


一个评论一针见血:见不到梁文锋,还见不到王琛吗?


这个评论提及的王琛,就是九坤的创始人。


介绍王琛之前,分享一个趣事。其实在梁文锋(浙大毕业)之前,大多数做大模型的都是清华系的,去年下半年,月之暗面在内的大模型六虎估值飞上天的时候,不少投资人想要看类似的、便宜一点的项目,不论是深圳投资人还是上海的,绝对会来北京,去中关村、清华周边挖一挖。


就算是梁文锋在北京的办公室,也距离清华不远,为的就是招聘相关的算法人才。


好像只有清华,才是大模型根红苗正的老家。


但这个王琛,还真又是清华人!不仅清华毕业,还是数学物理学士、理论计算机博士。他曾就职于华尔街对冲基金千禧年,2010年前后,恰逢国内股指期货上市,身在美国的王琛认为国内机会千载难逢,同年和姚齐聪(北京大学数学学士、金融数学硕士)一起回国创业。


其实,之所以这些做量化的纷纷进入大模型领域,有两个原因,其一是做量化本身就需要算法支持,比如九坤内部,设置了三大内部实验室(Data Lab、AI Lab、水滴实验室)和一个外部联合实验室(九坤—IDEA联合实验室),算是有了一些基础。


但更重要的一个原因是,就是做量化的时候,他们已经囤积了一些高性能芯片。


按照笔者的了解,在云算力端,当时除了几家互联网公司(商汤、百度、腾讯、字节、阿里),就只有幻方有超过1万张A100芯片储备。


一家需要GPU做量化的金融机构,囤积一些显卡很正常,但买了1万张,比肩国内头部互联网大厂,甚至还自己建起了集群,就很魔幻了。


而九坤这边,同样也有自己的囤货。


再分享一个好玩的故事,去年11月的时候,黄仁勋到港大参加活动,为了迎接他,香港特区政府财政司长陈茂波组局,邀请了英伟达 CEO黄仁勋、香港科技大学校长叶玉如院士、校董会主席沈向洋、红杉中国沈南鹏等人。



当时,很多人看到了香港最火的大排档爱文生,也关注到了许久未露面的沈南鹏,但其实,九坤的王琛也在其中。


一家量化公司的老板出现在黄仁勋的旁边,面带笑意,也足以说明,对于量化公司,算力的重要性。








请到「今天看啥」查看全文