专栏名称: 信息平权
理性 客观 朴素
目录
相关文章推荐
Java知音  ·  放弃Websocket,使用 SSE ... ·  昨天  
短剧内行人  ·  小程序短剧投资圈的奇闻怪事 ·  4 天前  
短剧内行人  ·  小程序短剧投资圈的奇闻怪事 ·  4 天前  
勤于奋  ·  这个平台大家不要提现 ·  4 天前  
碳索储能  ·  11.25MW/22.5MWh!广西院贺州钟 ... ·  5 天前  
果核剥壳  ·  企鹅出了个好东西,但我猜你玩起来有点迷 ·  6 天前  
果核剥壳  ·  企鹅出了个好东西,但我猜你玩起来有点迷 ·  6 天前  
51好读  ›  专栏  ›  信息平权

明年AI应用到什么量级?

信息平权  · 公众号  · 互联网安全 科技自媒体  · 2024-12-07 22:17

正文

因为部分渠道已经报道了豆包年底的MAU目标是1亿,基于此,我们来聊聊明年AI应用会到一个什么用户量级,以及因此会需要什么级别的算力。
首先,按照ZJ的习惯,KPI一定是非常具有挑战性的。1亿的MAU到了25年会到多少?个人认为保守2亿,激进点3亿也不为过。刚一位朋友说的很好,豆包其实还没发力,什么叫发力?当你地铁电梯看到广告的时候。从我个人刷抖音体验来看,豆包似乎也没全量推送。到了3亿什么水平?OpenAI的ChatGPT到2024年底目标是超过4.3亿MAU、2.1亿周活、7千万日活。也就是豆包明年如果全量推广, 有希望在2025年底达到今年chatGPT的水平。

值得吗?或者说,能赚回来吗?

值得。简单来说,ZJ就是国内最强的商业化机器,几乎实现了各个商业模式的闭环:广告、电商、游戏(发行)、O2O,甚至金融/教育/硬件等等等等。只要前端能获取、刻画、截留用户需求,后端就能交易闭环。而无论豆包还是chatGPT,实质上都有潜力成为“超级入口”。比如仅仅替代搜索,就可以实现巨大商业价值。用朋友话说,百度过去几年搜索赚的钱,像卖BF一样暴利。从网民整体来看,他们不一定人人使用移动端搜索,但一定刷抖音或头条。不少人已经拿豆包当日常搜索用。如果你好奇为什么豆包的MAU涨得竖起来了,别问同龄人,问问身边亲戚朋友。因此,如果能用几百亿,烧出一个若干年后可能现金流就每年几百亿的入口,算长期ROI也是划得来的,何况内部很多场景可以复用算力。

需要多大的算力?

之前文章我们提过capex的问题(已删),不如从用户规模角度,我们自己推导下算力需求有多少。
除了豆包,推理算力需求还来自:1)ZJ内部自用,例如客服场景、视频审核、抖音评论生成、飞书等等,随着内部应用AI化只会越来越多。2)外部调用,基于火山引擎,支持荣耀、OPPO、小米等等API调用。上述三个部分,每个目前都是几千亿token/每日,意味着合计总量接近1万亿token/每日
如果明年豆包MAU从1亿到2-3亿、内部应用AI化加速、外部toB爆发(今年基数低),那么日均token量很可能是数万亿。具体是3万亿还是5万亿还是10万亿,存在很多不确定性。比如多模态增加、多步骤的agent出现、类似sora这种token吞金兽是否上线等等。
假设真的做到日均10万亿token,对应一年大概3600T token,需要多少算力?之前我们分享过一个《agent需要多少算力》的测算报告, 有两张图可以借鉴:
这里面因子很多,比如模型参数、文本/图片/语音占比、集群利用率等等,但大的结论就是,明年的推理需求量是以10倍量级去准备的而且这只是一家,以及我们更多从2C角度去测算。从海外目前进展来看,2B场景的商业模式看起来会很快跑通(客服/coding/CRM)且2B一旦进入生产场景,token用量是惊人的。
最早我们探讨AI超级应用何时出现,认为算力的不断“通suo”在推动应用的出现。现在看,一个合适的商业化场景,也是必要条件之一。一头是算力迭代在降低推理成本,一头是ZJ这样的超强商业化生态在完成AI商业闭环变现,最终让AI在社会生产中的普遍ROI不断提升,可能是一个越来越清晰的模板。
(全文完,只求转评赞!)

以上报告上传星球了,以及一份国内某H算力企业的收入拆分模型,还挺细的