明年AI应用到什么量级？

信息平权 · 公众号 · 互联网安全科技自媒体 · 2024-12-07 22:17

正文

因为部分渠道已经报道了豆包年底的MAU目标是1亿，基于此，我们来聊聊明年AI应用会到一个什么用户量级，以及因此会需要什么级别的算力。

首先，按照ZJ的习惯，KPI一定是非常具有挑战性的。1亿的MAU到了25年会到多少？个人认为保守2亿，激进点3亿也不为过。刚一位朋友说的很好，豆包其实还没发力，什么叫发力？当你地铁电梯看到广告的时候。从我个人刷抖音体验来看，豆包似乎也没全量推送。到了3亿什么水平？OpenAI的ChatGPT到2024年底目标是超过4.3亿MAU、2.1亿周活、7千万日活。也就是豆包明年如果全量推广，有希望在2025年底达到今年chatGPT的水平。

值得吗？或者说，能赚回来吗？

值得。简单来说，ZJ就是国内最强的商业化机器，几乎实现了各个商业模式的闭环：广告、电商、游戏（发行）、O2O，甚至金融/教育/硬件等等等等。只要前端能获取、刻画、截留用户需求，后端就能交易闭环。而无论豆包还是chatGPT，实质上都有潜力成为“超级入口”。比如仅仅替代搜索，就可以实现巨大商业价值。用朋友话说，百度过去几年搜索赚的钱，像卖BF一样暴利。从网民整体来看，他们不一定人人使用移动端搜索，但一定刷抖音或头条。不少人已经拿豆包当日常搜索用。如果你好奇为什么豆包的MAU涨得竖起来了，别问同龄人，问问身边亲戚朋友。因此，如果能用几百亿，烧出一个若干年后可能现金流就每年几百亿的入口，算长期ROI也是划得来的，何况内部很多场景可以复用算力。

需要多大的算力？

之前文章我们提过capex的问题（已删），不如从用户规模角度，我们自己推导下算力需求有多少。

除了豆包，推理算力需求还来自：1）ZJ内部自用，例如客服场景、视频审核、抖音评论生成、飞书等等，随着内部应用AI化只会越来越多。2）外部调用，基于火山引擎，支持荣耀、OPPO、小米等等API调用。上述三个部分，每个目前都是几千亿token/每日，意味着合计总量接近1万亿token/每日。

如果明年豆包MAU从1亿到2-3亿、内部应用AI化加速、外部toB爆发（今年基数低），那么日均token量很可能是数万亿。具体是3万亿还是5万亿还是10万亿，存在很多不确定性。比如多模态增加、多步骤的agent出现、类似sora这种token吞金兽是否上线等等。

假设真的做到日均10万亿token，对应一年大概3600T token，需要多少算力？之前我们分享过一个《agent需要多少算力》的测算报告，有两张图可以借鉴：

这里面因子很多，比如模型参数、文本/图片/语音占比、集群利用率等等，但大的结论就是，明年的推理需求量是以10倍量级去准备的。而且这只是一家，以及我们更多从2C角度去测算。从海外目前进展来看，2B场景的商业模式看起来会很快跑通（客服/coding/CRM），且2B一旦进入生产场景，token用量是惊人的。

最早我们探讨AI超级应用何时出现，认为算力的不断“通suo”在推动应用的出现。现在看，一个合适的商业化场景，也是必要条件之一。一头是算力迭代在降低推理成本，一头是ZJ这样的超强商业化生态在完成AI商业闭环变现，最终让AI在社会生产中的普遍ROI不断提升，可能是一个越来越清晰的模板。

（全文完，只求转评赞！）

以上报告上传星球了，以及一份国内某H算力企业的收入拆分模型，还挺细的