专栏名称: 晚点LatePost
晚一点,好一点。这是《财经》杂志与小晚团队联合推出的新品牌。全部一手采访,没有二手信息。做你最信任的商业新闻媒体。
目录
相关文章推荐
环球物理  ·  【物理动画】初中物理(八下)动画视频专辑 ·  19 小时前  
中科院物理所  ·  这种化石,中国只发现了四块 ·  昨天  
中科院物理所  ·  二维半导体​MoS₂中非线性圆极化光电流的起 ... ·  2 天前  
51好读  ›  专栏  ›  晚点LatePost

孵化 DeepSeek 的量化交易:一个数据驱动的隐秘世界

晚点LatePost  · 公众号  ·  · 2025-03-10 22:02

正文

从十万次交易到千亿参数的 AI 进化。


孙海宁

编辑 黄俊杰


1994 年,量化公司是当时最神秘最热门的技术公司,他们雇用数学家和物理学家,成批买来高性能计算机做交易。这个行业里的标杆公司是 D.E. Shaw,它能在一天内贡献纽交所超 2% 的订单量。


这一年,D.E. Shaw 为计算机行业做了两个贡献。一个副总裁带队,做出了当时罕见的免费电子邮件产品 Juno,成功上市;另一个副总裁离职,带着自己和老板讨论产生的好点子开车去了西雅图,做出了全世界的电商鼻祖、市值超过 20000 亿美元的亚马逊。


30 年后,又有一家量化公司的 “副业” 影响整个计算机行业:管理数百亿元的中国头部量化公司幻方,推出大语言模型 DeepSeek R1,没花一分钱营销就震撼全球,用户涌来的速度甚至快过早年的抖音。


贝索斯创办亚马逊,或者梁文峰造出 DeepSeek 的主要原因自然不是因为他们做过量化,而是因为他们骨子里都是创业者。但量化投资这个极度追求人才密度且极度保密的行业文化,确实提供了适合大模型研发的环境。


招来一群聪明人不必然导致创新,叠加一个简单的环境才够。量化公司证明了这一点,DeepSeek 则证明这也适用于大模型研发。

剥离主观因素,在数据里挖掘规律

“很多主观投资说难听点,就是靠打听。” 一名从业几十年、调研过数千只基金的投资人说。基金经理们也钻研公开的财务资料,但他们同样乐于组织业内人士研讨会、支付每小时上千元的专家咨询费,甚至 雇上千人守在咖啡店门口拍视频 ,只为更早获得独家信息,抢先同行一步下注。


于是,人脉变得和经验一样重要。尽管桥水基金创始人瑞 · 达利欧把利率、汇率的变动原理写成书,反复讲桥水基金凭它们投资,但《纽约时报》的记者觉得达利欧赚钱的真正秘诀是讨好宏观政策决定者,靠他们 “透题” 赚钱,也写了本书论证。


量化公司完全放弃这些捷径。他们相信任何事都有人更早知道,自己也没能力超越对手做任何判断。他们全部投资决策基于一个简单的事实:人类行为总是不断重复,因此价格运动有规律可循,而计算机可以捕捉到这个规律。


足够多人靠逻辑交易,会产生规律。


可口可乐和百事可乐都做汽水生意,受同样的市场环境影响。如果两家公司股价差距没来由地扩大或收窄,那至少有一家定价错误、价差总要回归。四十年前,先发现这个机会的投资者靠程序监测六、七只相关股票的价差变动,就能撑起一只管理 3000 万美元的基金。


足够多的人靠情绪交易,也产生规律。


可口可乐的投资者中总有自信过头的,他们会更倾向于跟着自己喜欢的消息买入,而把自己不喜欢的消息当作噪音。由此,新消息只会将可口可乐股价向上顶,学界发现过去收益好的公司,未来大概率还会好下去,把这规律称为 “动量效应”。


量化研究员贾乾说,股票每天收益的波动中,最多可能有 5% 可被解释。他的工作就是找到能刻画规律、解释波动的 “因子”,基于它们构建投资策略。可口可乐未来走势与百事可乐过往股价、可口可乐过往涨幅相关,股价、涨幅数据就能作为 “因子” 投入量化模型。


因子可能是上面这样容易理解的信息,也可以更加复杂。


特朗普习惯把各种耸人听闻的想法随手发在 Twitter 上,他第一任期内,J.P. Morgan 的研究员通过程序分析特朗普上万条推文的语义、构建 “Volfefe” 指数,并验证它可以解释美国国债利率变动。靠买卖国债赚钱的量化模型可以把 Volfefe 指数当作因子。


量化公司文艺复兴创始人西蒙斯研究过月球周期对市场的影响。路径之一可能是:月动影响潮汐、潮汐影响航运、航运影响油价。但他最终无功而返。传导链条太长、中间变量太多,因子对价格影响就难以识别。


机器学习方法在量化行业普及后,很多左右股价变化的因子已经完全无法用逻辑理解。研究员确定评价因子的标准,输入开盘价、收盘价、成交量等 “原始因子”,程序就能自动组合、迭代出更能预测股价的新因子。投资机构 WorldQuant 曾分享过一个实际用于交易的 “较为简单” 的因子:


((rank(correlation(sum(((open * 0.178404) + (close * (1 - 0.178404))), 12.7054), sum(adv120, 12.7054), 16.6208)) < rank(delta(((((high + low / 2) * 0.178404) + (vwap * (1 - 0.178404))), 3.69741))) * -1)


除了能增加因子对价格的解释能力外,没人知道公式中的 0.178404 等数字有什么现实意义。但量化研究员不介意。“如果是意义非常明显的信号,早就被用于交易了。有些信号你不理解,但它们就在那里,而且可能相对较强。” 文艺复兴 CEO 彼得 · 布朗说。


量化研究员轩浩告诉我们,基于现实意义、拍脑袋想因子十分困难,“一天能想十个,就是天才了”。人找的因子通常能持续几个月、半年帮基金赚到钱。而机器挖出来的因子失效非常快,“但架不住每天能产生几千个。”


如果知道因子的人多了,抢着做同一种交易,它就会失效。这让量化行业在保密方面近乎偏执。头部量化公司会要求离职员工 18-24 个月内既不能自己交易、也不能去其他公司任职。“俗称 Gardening Leave,回家种花。” 轩浩说。


LinkedIn 简历中的 Gardening Leave

D.E. Shaw 创始人大卫 · 肖曾说自己公司安保水平媲美中央情报局。被记者问 D.E Shaw 是否用神经网络算法构思策略时,这名拥有数十亿美元财富的创始人回答:“我可以告诉你,然后必须杀了你。”


单次买卖可赚可赔,量化公司只关注大量交易时击败市场的概率。2000 年初,文艺复兴的大奖章基金每天交易 15-30 万次,“我们只在 50.75% 的情况下是对的。” 一名员工说,但这已足够成就公司大奖章基金一年管 38 亿美元、赚 21 亿美元的成绩。

雇聪明人,在简单环境里解决复杂问题

美国国家数学博物馆每年举行一次 “数学大师” 锦标赛:聚起一群聪明人,比谁能在限时内能解出最多这样的数学问题:找到最小正整数 m,使 m²+7m+89 能被 77 整除。


2014 年比赛夜的参与者有陶哲轩,他 24 岁成为加州大学洛杉矶分校数学系终身教授,31 岁获得 “菲尔兹奖”——数学界的诺贝尔奖。不过他只是第二,赢过他的是约翰 · 奥弗德克,量化公司 Two Sigma 的联合创始人。


奥弗德克可能也不是 Two Sigma 最聪明的人。2015 年时,这家公司已经招了 130 名博士和 6 名国际数学奥林匹克竞赛获奖者。奥弗德克前东家 D.E. Shaw 直接说自己招聘时有 “毫无歉意的精英主义”,前美国财政部长、哈佛大学校长劳伦斯 · 萨默斯在 2006 年想去 D.E. Shaw 工作,同样要做智力测验。







请到「今天看啥」查看全文