图片来源:视觉中国
文丨雅萱
编辑丨叶锦言
当
DeepSeek
以其惊艳的
AI
大模型技术席卷海内外科技圈时,镁光灯也不由自主地转向了它背后的母公司——幻方量化及其创始人梁文锋。
据彭博社报道,根据七位创业公司创始人和人工智能专家的估算,DeepSeek的估值介于大约10亿美元到1550亿美元之间。根据彭博亿万富翁指数,按区间中间值计算,DeepSeek估值在20亿美元到300亿美元之间,那么梁文锋持有的84%股份价值介于16.8亿美元到252亿美元,这将使其跃居亚洲最富有科技大亨行列。
而安大略省滑铁卢市电信公司Sweat Free Telecom创始人查纳基亚.拉姆德夫(Chanakya Ramdev)对DeepSeek的估值约是OpenAI 估值的一半(3000亿美元),也就是1500亿美元左右,这意味着,梁文锋的持股价值达到1260亿美元,这或比英伟达CEO黄仁勋还要有钱。
在科技创新领域,从不匮乏资本神话的瞬时闪耀。在财富传奇故事背后,行业内外也在思考:一家深耕量化投资的机构,何以在AI大模型的竞技场上短暂的超越科技巨头与“AI六小虎”,孕育出性能比肩OpenAI的推理引擎?
从表象看,量化投资天然融合了资本配置与模型研发的双重属性,其高频交易系统需处理海量的市场数据流,构建起从数据采集、清洗到存储的全链路基础设施——这与大模型训练的数据预处理流程殊途同归。
“幻方量化从成立至今,投资策略经历了很大的变化,但本质上始终是围绕AI大结构进行的,核心是利用深度神经网络训练模型,所以我们把自己定义为一家完全依靠人工智能来做投资的对冲基金。”幻方量化CEO陆政哲曾如此总结幻方量化的核心特质。
实质上,依靠人工智能来做投资,是梁文锋坚信“人工智能一定能改变世界”
这一理念的具体实践。
回过头看,梁文锋在量化投资领域的职业生涯如同一条隐秘的河流,表面波澜不惊,深处却暗涌着对技术本质的叩问。在这家公司以AI大模型技术搅动行业之前,梁文锋的量化投资生涯早已为其技术哲学埋下伏笔。
量化投资
“信徒”梁文锋
“和很多新技术一样,量化投资刚出现的时候也是被嘲笑的对象,没有人相信计算机可以像人类一样进行投资。但西蒙斯却敏锐地预见到,随着计算机技术的发展,终有一天‘不可能’将会变成现实。”这是梁文锋在詹姆斯.西蒙斯唯一传记《征服市场的人》(中文版)写推荐序时的一句话。
在2023年之前,梁文锋异常低调,鲜有公开言论。给詹姆斯.西蒙斯的传记写推荐
序
是其为数不多的公开言论之一。另一个公开讲话是梁文锋在第十届中国私募金牛奖颁奖典礼现场做的一次关于“中国量化投资的未来”的主题演讲。
詹姆斯.西蒙斯有“量化投资之父”之称,其创办的文艺复兴科技公司于1988年3月设立了第一支基金产品——大奖章基金(Medallion Fund)。有数据显示,在1988—2018年这30年间,扣除5%的管理费和44%的业绩提成后,该基金获得了39.1%的年化复合收益率,为公司赚取的利润超过1000亿美元。
詹姆斯.西蒙斯算是梁文锋进入量化投资这一领域的领路人。梁文锋说,“每当在工作中遇到困难的时候,我会想起西蒙斯的话:“一定有办法对价格建模。”
公开资料显示,梁文锋2008年在浙江大学读研期间,就和同学组队使用机器学习技术进行全自动量化交易,并赚得了人生的第一桶金。而据幻方量化官网信息显示,“自 2008 年起,我们就开始积累市场行情数据、金融市场其他相关数据、宏观经济等数据,累积数据量超过 10PB。”
2015年4月16日,上证50、中证500股指期货交易正式在中国金融期货交易所挂牌交易,这为量化基金创造了更大的操作空间。2个月后,梁文锋和其大学同学徐进创办杭州幻方科技有限公司,后更名为浙江九章资产管理有限公司。
需要注意的是,幻方量化主要包括浙江九章资产管理有限公司(简称九章资产)和宁波幻方量化投资管理合伙企业(有限合伙)(简称宁波幻方量化)两部分。两家都在基金业协会备案,实控人都是梁文锋。其中,梁文锋持有九章资产85%的股份,持有宁波幻方量化76.2684%的股份。
抓住国内量化交易红利期的幻方量化迅速步入了量化投资的快车道。据私募排排网及幻方量化官网数据显示,2016年,幻方量化管理的资金规模大约10亿元;2019年幻方量化跻身百亿私募;2021年年中突破千亿元大关。
2021年也是幻方量化从急速扩容规模转至平稳发展的分界线。2021年年末以来,关于幻方量化大幅回撤、公开道歉、劝告赎回等信息层出不穷。
据私募排排网数据显示,从2021年9月开始,幻方量化的业绩急转直下,至2022年4月,公司最大动态回撤高达23.48%。
对于2021年年底的变动,幻方量化工作人员曾对《每日经济新闻》表示,“2021年的超额收益确实已归零,主要是策略做得不好。规模比较大是一部分原因,市场有效性提高,风格切换频繁,自身策略模型不足,都是原因。”
据财联社报道,至2022年3月初,幻方量化已主动缩减规模至500亿元左右。在收益率方面,据私募排排网数据,2022年—2023年,幻方量化的平均收益率分别为0.38%和4.46%。与2016年—2020年“九章”系列产品超30%的年化收益率相比,明显下滑。
据同花顺数据统计,截至2024年12月20日,幻方量化旗下公开披露净值的65只基金中,29只基金在年内斩获超过10%的涨幅,36只基金在年内处于下跌状态。
幻方量化年化收益率下滑,除受股市变化、国内外多种市场因素交织影响外,还有一个重要原因,即“僧多粥少”。
数据显示,从2017年到2020年,量化基金在所有证券类私募基金中的占比从不足5%提升到15%,管理规模增长了4倍,量化交易成交量在整个A股市场成交量中的占比超过15%。
当量化私募管理规模达到一定数值后,过于庞大的资金会引发市场剧烈波动,波动率也会随之提升,业绩难以继续维持高位,仅凭技术面博弈的量化私募基金盈利难度显著增加。
破解
“
黑暗森林
”
法则
在量化投资领域,不同量化投资机构通常拥有各自独特的策略(如高频交易、统计套利、机器学习驱动等)和因子,策略的独特性是其竞争力的重要来源之一。
为了保证自身策略在不同市场环境下的持续有效,量化机构不仅需要严格保密策略逻辑,还需要构建强大的技术基础设施、动态优化能力、独特的数据优势以及完善的风险控制体系。
这样的量化投资市场犹如三体世界中的“黑暗森林”,每个文明都要隐藏自己,一旦暴露就会被更强大的文明消灭,量化市场也是如此。
量化投资的核心是“信息差”和“速度差”,一旦暴露,策略被竞争对手模仿或反向破解,其超额收益可能会迅速消失。所以,量化投资机构的因子必须像“智子”一样隐形。
当量化投资进入“超限竞争”时,量化投资机构要保证策略的持续进化,需要保证技术工程、认知框架与组织能力等全面迭代。此时,机器深度学习和通用人工智能就成为量化投资机构打破“黑暗森林”法则的路径之一。
幻方量化是最早探索用机器学习替代传统量化策略的量化机构之一。
据幻方官网信息显示,2016 年10月21日,幻方第一个由深度学习算法模型生成的股票仓位上线实盘交易,使用GPU进行计算。在此之前,算法主要依靠线性模型和传统机器学习算法,模型计算主要依赖于CPU。
一个未得到幻方量化官方证实的趣闻是,为了强调数据和AI模型的重要性,避免交易员主观经验干扰,幻方量化内部流传着这么一句话,“工程师的信仰必须纯粹——策略代码是唯一的真理来源。如果某个信号不能通过蒙特卡洛检验,哪怕董事长亲自推荐的也要扔进回收站。”
截至2017 年底,幻方几乎所有的量化策略都已经采用AI模型计算。2018年,梁文锋确立幻方量化以AI为主要发展方向。2019年,成立幻方AI Lab,并开启芯片前端设计工程师/架构师、深度学习科学家/工程师、硬件工程师的招聘工作,年薪在30万—200万之间(据幻方量化公众号信息)。
要发展幻方AI Lab,算力是基础。为满足日益增加的算力需求,梁文锋开始寻求大规模算力解决方案。
2020年5月,幻方量化启用深度学习训练平台“萤火一号”,计算集群搭载1100张高端显卡,每秒可以进行1.84亿亿次浮点运算(18.4PFLOPS, 32位精度),相当于4万台个人电脑算力,平均使用率超过 90%。
2021年1月,幻方AI Lab第二代超算“萤火二号”正式交付使用,已交付的AI算力为325PFLOPS(TF32),是“萤火一号”的18倍。有资料显示,幻方量化对“萤火二号”的投入增加到10亿元,搭载了约1万张英伟达A100显卡。
就在不少AI研究人员还未意识到“万卡”已经成为通用人工智能不可逾越的软硬件壁垒时,幻方量化已经对员工调用算力不设限制。
对于幻方量化为何能在英伟达显卡还未成为“硬通货”之前储备高端GPU这一问题,梁文锋对“暗涌Waves”如此解释:“对很多行外人来说,ChatGPT这波浪潮冲击特别大;但对行内人来说,2012年AlexNet带来的冲击已经引领一个新的时代。AlexNet的错误率远低于当时其他模型,复苏了沉睡几十年的神经网络研究。虽然具体技术方向一直在变,但模型、数据和算力这三者的组合是不变的,特别是当2020年OpenAI发布GPT3后,方向很清楚,需要大量算力;但即便2021年,我们投入建设萤火二号时,大部分人还是无法理解。”
DeepSeek
冲击波
储备算力仅是第一步。在量化投资市场呈现阿尔法(超额收益)衰减的背景下,幻方量化悄然开启了新的征程。
2023年4月14日,幻方量化在官方公众号宣布公司要成立新的研究组织,开启探索AGI本质的新征程。为招募所需的人才,公司海报还用了法国导演、编剧特吕弗写给年轻导演的忠告:“务必要疯狂地拥抱雄心,同时疯狂地真诚。”
据天眼查显示,DeepSeek公司主体杭州深度求索人工智能基础技术研究有限公司(以下简称深度求索)成立于2023年7月17日,实际控制人为梁文锋,持股84.2945%,其余三位合伙人分别为梁文锋在浙大期间的同学陈哲、李欢、郑达韡。
图为杭州深度求索人工智能基础技术研究有限公司的受益股东,数据来源:天眼查
2025年以来,DeepSeek的爆火给AI创业公司、互联网大厂及整个VC行业的冲击不言而喻。
在海外,OpenAI的CEO山姆.阿尔特曼(Sam Altman)在社交平台X上评价称,DeepSeek-R1模型“令人印象深刻”。在国内,曾公开表示“不看好创业公司做大模型”的投资人朱啸虎公开表态“DeepSeek快让我相信AGI了。”
事实上,在DeepSeek-R1快速破圈之前,其模型已经迭代了几个版本。
2024年5月,深度求索发布开源模型DeepSeek-V2。由于其推理成本被降到每百万token仅 1块钱,DeepSeek-V2被戏称为“AI界的拼多多”。2025年1月,DeepSeek-R1发布,并在7天内完成了1亿用户的增长,成为全球现象级产品。
回到开篇的那个问题,触动OpenAI的为何会是一家CEO有没有AI创业光环、未融过资、由量化投资机构孵化出来的DeepSeek?
或许,与当初在量化投资领域相信数学模型和算法能在看似杂乱无章的数据中捕捉到某种规律类似,梁文锋对AGI的信仰已经为持续迭代的DeepSeek谱写了无限可能性。
“我们要做的是通用人工智能,也就是AGI。语言大模型可能是通往AGI的必经之路,并且初步具备了AGI的特征,所以我们会从这里开始,后边也会有视觉等。”梁文锋说。