图片来源:DeepSeek
DeepSeek迅速崛起为人工智能领域的明星公司,给这家中国初创企业带来了一个两难的困境:是否应该融资。
作为一家成立仅两年的中国量化对冲基金子公司,DeepSeek迄今为止尚未筹集外部资金,部分原因是为了避免投资者施加压力,要求其过早商业化产品。然而,自从几周前其AI聊天机器人应用一举成名以来,随着用户增长的快速发展,需求不断增加,尤其是为了支持更多的AI芯片和服务器以支持模型开发,公司不得不开始考虑外部融资。
根据The Information报道,在最近几周,许多强大且资金充裕的投资者,包括阿里巴巴、国有基金和主权财富基金,已表达了对融资公司下一阶段发展的兴趣。
除了讨论是否需要融资外,DeepSeek和其母公司——幻方量化的高管们还在讨论,是否应该从主要专注于研究转向建立一个能产生可观收入并最终盈利的商业模式。
DeepSeek的创始人兼CEO梁文峰(同时也是幻方的联合创始人)对融资仍然保持谨慎态度。目前尚不清楚他最终会作出何种决定。
“书呆子”和理想主义者
与梁文峰共事过的人形容他是一位书呆子型的理想主义技术专家。2015年,他共同创办了幻方,专注于使用AI模型进行股票交易,那时这一想法在中国仍然是新鲜事。梁文峰把纽约量化交易基金“文艺复兴科技”(Renaissance Technologies)创始人已故的吉姆·西蒙斯(Jim Simons)作为自己的榜样,这一点可以从梁为《西蒙斯传》中文版所写的前言中看出。
2023年,在OpenAI发布ChatGPT引发AI革命之后,
幻方
将DeepSeek设立为一个独立子公司,主要从事先进的研究项目。梁的目标是实现人工通用智能(AGI),即人工智能在认知能力上达到人类水平。他将DeepSeek设立为一个学术实验室,招募了希望共同追求AGI的研究人员。
DeepSeek曾明确表示没有兴趣融资。
两家中国风险投资公司合伙人曾于2023年末和2024年初就可能的投资联系DeepSeek,但公司明确表示不打算引入任何外部资本。
与此同时,梁文峰一直在密切关注美国的AI发展。在2023年9月OpenAI推出o1推理模型时,梁飞往美国会见了他认识的一些研究人员,包括OpenAI的员工,以跟进最新进展。
在去年的一次内部员工会议中,梁表示DeepSeek在AI领域落后于OpenAI。但他也表示,DeepSeek可以通过降低成本、提高效率为AI产业的发展做出贡献。据参加会议的前员工回忆。
DeepSeek的旧版AI模型去年末开始在美国的AI研究者中获得认可。与此同时,DeepSeek并未急于发布面向消费者的移动聊天机器人应用,尽管其他美国和中国的科技公司纷纷推出类似产品。
例如,去年下半年,当字节跳动的“豆包”等AI应用迅速流行时,梁在一次员工会议中表示,DeepSeek仍未准备好专注于消费类应用。他强调,公司首要任务应始终是研究,提升基础模型的效率。据报道,梁强调,DeepSeek的首要任务应是优化基础模型。
DeepSeek震撼
与此同时,DeepSeek越来越受到关注。去年12月,DeepSeek发布了V3版本,更新了大型语言模型,声称该模型仅使用了2,048颗英伟达芯片,且成本仅为550万美元,比美国AI公司在训练自己模型时的支出低得多。
推理AI模型DeepSeek-R1在硅谷引发了震动,尽管R1的开发成本远低于OpenAI的同类模型,但其表现与OpenAI的类似模型相当。
根据研究公司QuestMobile的统计,
DeepSeek的首款移动应用在一个月前发布,并迅速爆红,短短不到一个月的时间内,便在中国收获了3,000万日活跃用户,成为中国历史上增长最快的应用。
然而,它也未能完全满足需求。在今年春节假期的第一周,当全国大部分地方都进入春节休假模式时,部分DeepSeek员工仍在努力解决基础设施问题。为应对激增的流量,公司已限制了应用的使用,但要更好地适应现有用户的需求,可能需要进一步投入基础设施。
DeepSeek的震撼也引发了华盛顿的担忧。美国长期以来希望遏制中国AI的发展。就在本月早些时候,华盛顿宣布计划推出一项两党法案,禁止DeepSeek的应用在政府设备上使用。
与此同时,公司的融资计划成了一个复杂的问题。若融资来自任何主要的中国投资者,尤其是国有企业,可能会加剧华盛顿的担忧,并限制DeepSeek在美国未来的业务机会。上个月,美国商务部将智谱AI列入了清单。
目前尚不清楚,幻方的对冲基金业务能否继续为DeepSeek提供所需的全部资金。
DeepSeek目前的收入微不足道,其聊天机器人应用是免费的,而其R1模型的API对于每百万个Token仅收取14美分的输入费用和2美元以上的输出费用。
这些价格远低于OpenAI的o1推理模型,每百万标记的输入费用为15美元,输出费用为60美元。
本月初,腾讯的微信——中国普及率最高的即时通讯和社交应用——开始测试一项功能,让用户能够接入DeepSeek的AI模型。目前尚不清楚这将为DeepSeek带来多少收入。
DeepSeek面临的另一个大挑战是如何确保获得足够强大的英伟达AI芯片,以支撑其AI开发。虽然DeepSeek已经使用了英伟达的A100芯片,而幻方在2021年就已经收购了这些芯片,但DeepSeek依然需要更多英伟达的芯片。
[1]