摘要:
在大众眼中,潞晨科技是一家不知名公司。但其创始人尤洋,早先已凭借“90后教授”“加州伯克利博士”等头衔成为资本热追的对象。今年初DeepSeek爆火后,尤洋因质疑MaaS虚假繁荣被行业抨击。在更多小公司all in DeepSeek的当下,潞晨为何要放弃泼天流量?凤凰网科技《浪潮》对话尤洋,聊了聊其在AI爆发潮背后的思考。
今年3月,尤洋陷入了一场漩涡。
作为创业公司潞晨科技的创始人,尤洋曾因顶着清华学霸、伯克利博士、新加坡国立大学校长青年教授等头衔而在业内颇具名气。他还是一个90后,小红书活跃用户,技术控与“社媒活人感”在他身上实现了很好的融合。
争议的起因,来自尤洋公开质疑火热的MaaS(模型即服务)商业模式,称中小云厂商若部署开源大模型DeepSeek-R1“满血版”,每月亏损或达4亿元,这一看法与后续DeepSeek官方宣称的“理论利润率545%”形成了巨大反差,引发行业震动。
更为与业界格格不入的是,
3月1日,潞晨科技成为首个宣布停止DeepSeek API服务的创企,此时距离其上线DeepSeek API仅过去一个月。
凡此种种,被人们解读为了“和DeepSeek唱反调”,从而让尤洋本人遭受到了巨大的非议。
在陷入风波后不久,凤凰网科技与尤洋进行了一场对话,回忆风波中的争议话题,他依旧坚持着自己的想法。在其看来,MaaS业务需承担算力波峰波谷的成本压力,而客户对稳定性和延迟的高要求进一步挤压利润空间,“价格战肉搏”难以为继。
一直以来,尤洋在AI圈子里都不是小透明。其在博士期间开发的LAMB优化器曾被谷歌、微软等巨头采用,将BERT模型训练时间从3天缩短至76分钟,至今仍是行业标杆。2021年回国创立潞晨科技后,他又将技术优势转化为商业产品,推出分布式训练平台Colossal-AI和视频生成模型Open-Sora。
潞晨自创立之初也备受资本追捧,三年多的时间里已拿下6轮融资,且据尤洋表述,其手中仍握有TS(投资意向书)。
在尤洋看来,在中国市场,AI infra层的机会在于利用DeepSeek、通义千问等模型能力,在行业私有数据上做行业模型、企业私有模型。
“这个需求是真实的,账起码能算得清楚,利润也是可观的”。
与此同时,潞晨与其他AI infra层企业的最大不同,是还在自研视频大模型产品。但尤洋对视频大模型的思考不太一样,其认为视频大模型本质上是一个算力优化的生意。“未来3到5年,视频大模型为核心的多模态、世界模型会不断地发展变大。这个过程中,最重要的就是算力优化,要考虑如何去提升训练、推理效率,降低开发、推理成本,这就是AI Infra厂商最应该关注的事情”。
在一个相对清晰的发展思路之下,尤洋已经对潞晨的发展有了初步的规划,即做到 200 亿到 300 亿量级,然后上市。“目标非常量化,也很明确,就是达到 20 亿的收入”。
以下是凤凰网科技《浪潮》与尤洋的对话,经编辑发布:
“抨击MaaS模式,掉入舆论漩涡”
凤凰网科技:春节后那段时间大家都一窝蜂冲上去做DeepSeek API,那时候你在做什么?
尤洋:
我们也确实收到了很多DeepSeek相关需求,潞晨也迅速在训练、微调、推理等多方面都做了方案发布,包括和华为联合推出的一体机。
实际上线验证了MaaS业务,虽然有很多用户,但目前确实不是一个好的商业模式,所以决定集中资源、聚焦高创新业务,拒绝盲目跟风和低效投入,加速核心产品迭代。
凤凰网科技:潞晨现在有哪些核心业务?
尤洋:
主要是三块,大模型开发和部署平台,旨在最大化提升AI大模型的后训练和推理部署效率,打造AI算力版DataBricks;大模型企业私有化部署和一体机,用DeepSeek和通义千问等世界一流大模型的能力,基于高质量私有数据,为企业开发/部署私有模型和行业模型;布局未来,坚信视频生成大模型是世界模型和多模态模型的核心,基于Open-Sora打造效率最高的视频模型及商业产品。
凤凰网科技:你也不是第一次给MaaS模式算账,觉得不是一个好的生意模式,你觉得为什么近期这个话题突然热了起来?有什么变化发生了吗?
尤洋:
对,目前依旧不是,所以潞晨撤掉了MaaS业务。热度起来,一方面确实各家都在接入DeepSeek,另一方面DeepSeek也进一步开源了新内容,本身会有热度和讨论。其中涉及了盈利测算,网上许多人认为和我的观点相差很大,就引起了讨论。
我对DeepSeek没有任何贬低,DeepSeek出圈前,2025年1月2日我就在微博上说过DeepSeek是中国最好的模型。我最开始就是抨击那些倒卖DeepSeek API去赔本赚吆喝的中小云厂商,然后吹嘘自己推理快10倍。在网上被解读成跟DeepSeek去对立。一些厂商会精选特别好看的性能结果发布,我们2月初就已在较真实场景下评估,当然具体的数值随着全世界一起优化探索迭代,对某个特定模型肯定会越来越好,但是我觉得站在2025年初的角度,中小型云厂商不太可能通过MaaS赚到钱。
凤凰网科技:你们在真实场景下评估的结果怎么样。
尤洋:
具体的推理吞吐速度,其实是有许多影响因素的。首先,输入输出序列长度变化的话,吞吐率的变化是很大的,我用的是更现实的情况。因为在实际用的时候,输入输出的序列长度是不会太短的,一长它的吞吐率就下来了。
第二,真正在线服务用户的时候,有的用户在做多轮对话,有的用户在做翻译,有的用户在做摘要,他们的任务也是非常复杂的。
第三,很多情况还需要联网,联网的话要读很多网页,那输入输出序列就更长了。这三个因素加起来后,我那个跑分指标其实已经算是不错的了。
第四,不同规模的厂商,可选择的方案也不同。比如DeepSeek官方发布的推理方案,最小部署资源需要数百张高速互联的H800。对中小厂商来说,MaaS后续可能有上百个模型在运行,每个模型的最佳方案和所需资源可能都不一样,在价格战的情况下,是否为每个模型都做这样的投入需要谨慎。
第五,研究推理优化的门槛,相比训练等还是低得多的。每个大学实验室、公司,有1台服务器就可以做。以DeepSeek的热度,全世界在一起优化探索迭代,具体数值上会随时间有变化。
当然,肯定会有人宣称通过倒卖DeepSeek API盈利了之类的。肯定也有人会做一些FP4量化蒸馏剪枝之类的工作,就是测一些比较美好的数据。
但售卖DeepSeek等标准开源模型API的MaaS业务,现阶段不是最适合市场的一种产品形态,它承担了全产业链的亏损。这种产品形态只适合用户去做测试,但是用户一旦真的想做一个AI App,对稳定性、延迟的要求是非常高的。但是MaaS这种产品卖的是按需token,任意客户任意时间的波动需求都必须时刻满足,不会管供应商后端的机器利用率。比如当前有10万人的请求在用这么多机器,可能过5分钟调用量就变小或变大,因为如果我的MaaS下游接入了很多App,随时都可能有很多用户的调用变动。但我为了容纳高峰保障MaaS服务的商业稳定,机器要能容纳最高峰,低谷还是得放着,成本还是高峰那么多,因为我的算力不管是租还是自建,算力成本都是随时间稳定产生的。
凤凰网科技:所以你怎么看DeepSeek公开的那个利润率?
尤洋:
DeepSeek是很优秀的团队,做出了很好的成果,开源分享了许多内容,也给出了545%的成本利润率,但其实你细读一下,它也做了很多假设,它自己都说是理论营收。如果要做成一个稳定性很好的商业版MaaS的话,实际上基本是不可能达到的。
DeepSeek把它的App、网页版加上MaaS混在一起来统计,能收费的只是其中一部分。另外让To C的网页端、App,用户等个一二十秒钟勉强可以接受。但是我感觉最好不要让用户等待超过15秒,因为我问一个问题,15秒还没回复,或者直接崩溃,你可以想想用户体验好吗?春节的时候大家用DeepSeek,它连这个需求都满足不了,更别说商用MaaS了。To B的MaaS要求会高得多,下游应用企业不会接受上游MaaS供应方没有基本的可靠性,导致自己的下游业务随时崩溃。
凤凰网科技:DeepSeek本身也不是一家追求服务质量的公司。
尤洋:
当然,DeepSeek也没有把自己说成MaaS,用户体验也不是它的最高优先级,用户愿意等1小时或第二天再试也行。目前DeepSeek的情况跟很多模型企业,尤其是使用开源模型部署MaaS的第三方企业还不太一样,因为官方服务能力是供不应求的,用户对它体验的容忍度也不同,它的平台是基本稳定的有超负荷的用户需求打满硬件资源,也不需要覆盖业务的全部成本,所以它很适合MaaS模式。而且DeepSeek也不把自己定为Infra/MaaS厂商,可能也不想去赚这个钱。我觉得DeepSeek完全没必要去关心这个东西的线上体验怎么样,就是把模型训好。反正把模型都开放给大家,哪个想赚钱就拿走,它就专注于做AGI。
凤凰网科技:你觉得中小云厂商和DeepSeek面临的情况完全不同?
尤洋:
这些中小云厂商使用开源模型,真正面向B端提供MaaS的时候,它的要求是非常高的。一旦考虑用户体验,考虑B端对延迟和稳定性的要求之后,就必须得有足量的机器,满足业务需求的忽高忽低。比如我的客户们虽然当前日均输出1000亿个token,但我可能得准备输出4000亿到5000亿token能力的机器,才能保证客户们的业务运行都很稳定。同时,每家都在提供同样的模型API,客户几秒钟内就能在不同厂商之间切换。导致MaaS厂商不仅要满足高要求,还需要相互卷价格。
虽然有全世界一起优化来降低推理成本,包括DeepSeek官方也给出了很高的利润率,但对于MaaS来说,关键在于大家能否自己直接复现达到理论盈利上限。以及在大家都获得优化降本的情况下,售卖DeepSeek等标准开源模型 API的MaaS业务,能否脱离当下的价格战?
其实很简单就可以验证:如果MaaS是好的商业模式,大家都在挣钱,为什么各种大小云厂商,比如阿里云、火山云、优刻得、并行科技、首都在线这些全都要在卖MaaS API的同时,要再费力气去推私有化的一体机和专属实例。因为一体机和专属实例是客户独占的,是稳定和不亏损的。
凤凰网科技:这个生意如果换大厂来做可能更好理解,亏损换规模。
尤洋:
大厂的优化手段和可选方案可能比中小型厂商会更好一点,也更可能收回更多成本。况且他们还有长远的战略性布局,完全可以承受一时的亏损。
比如腾讯有微信,最近元宝快速增涨到了App榜单第一,字节有飞书、抖音,百度有搜索,即使短期内亏损几十亿,它们日后通过这些超级App和其他业务,是可以消耗很多token的,再通过一些额外付费或整体业务考虑,就把这个亏损补回来了。
但初创企业即使融了几个亿,可能还没大厂一个月的营销推广费高。我觉得只使用第三方开源模型以当下的MaaS模式卖API的话,肯定是亏的。如果它作为一个功能点提供到其他产品里,最终通过那个产品赚钱,是有可能的。
凤凰网科技:潞晨作为一个创企,如何保证不被大厂射程扫中?
尤洋:
我们不是MaaS厂商,把我们叫成AI基础设施厂商或者AI基础软件厂商比较合适。我跟大厂也没有任何竞争,我创业如果去跟它们直接竞争,完全是“自杀式创业”。
我们现阶段主要产品就两个。一个是我们的算力平台,或者也叫大模型开发+推理平台。第二个产品就是帮一些中小型企业去做大模型私有化。他们的数据甚至不能出自己的公司,我们就提供一套大模型私有化的开发+推理的工具软件。需要机器的话,再把我们的一体机一起卖给他们。
我觉得在中国市场,利用DeepSeek、通义千问的能力,在珍贵的行业私有数据上去做出行业模型、企业私有模型,再用云算力或者一体机帮企业高效地部署起来。这个需求是真实的,账起码能算得清楚,利润也是可观的。
凤凰网科技:DeepSeek之前发了一些开源项目,你怎么评价这些开源?
尤洋: