今天晚点发布了对 MiniMax CEO IO 的访谈。
全文充满了反共识的点,可以说是「暴论频出」。
-
中国人工智能产业过去一两年一直有个巨大的误区:就是认为用户越多,模型能力提升越快。这个逻辑非常错。
-
千万不要用上一代做移动互联网产品的方法论来思考新产品。
-
如果一个产品特别依赖推广,大概率就不太对
-
是 Scaling Law 撞墙了,我就放弃了,而是我要做什么事能让它延续。
-
一年前最喜欢说信仰的那些人,信仰都兑现了吗?
实践出真知,这篇访谈的内容非常值得参考。
全文链接:
https://mp.weixin.qq.com/s/VBnm3KCsYd4fuXcBpDgiaA
但是这句话「千万别套用移动互联网的逻辑来做 AI——因为技术特性导致 AI 不是用户越多,模型能力提升越快。」
剥离原有语境之后,就变成了一种巨大的非共识,似乎挑战了过去十几年积累下来的移动互联网经验,引起了一些争议。
问题来了
上面的争议,严格来说是个概念的混淆,可以归结为一个小误会。
抛开争议不谈,真重要的问题是:
大模型进步到底需要不需要用户?
本文将通过以下产品的案例,为大家讨论这个问题提供一些背景信息
-
ChatGPT
-
GPT4
-
国产模型
-
Character AI
-
Kimi
-
海螺视频
-
DeepSeek
-
Claude
请带着问题一起思考:
移动互联网的经验有多少可以复用?
大模型产品,是否需要推流?
字节会是国内的大赢家吗?
语言大模型的大进步不需要用户
先从 ChatGPT 聊起。
ChatGPT 于2022年11月30日上线,虽然很快就拿到了100万用户,但是这些用户数据回流到模型至少也要一个月,所以我们可以理解为用户是0。
虽然 ChatGPT 在线上是持续进步的,但 ChatGPT 刚上线的表现已经非常惊艳了。
能达到这个惊艳的水平,并不依赖用户的输入。
实际上看过 GPT4 论文的朋友都知道,GPT4 的表现是远比 ChatGPT 3.5 惊艳的。
而 GPT4 的训练完成时间其实是 2022年8月,比 ChatGPT 的发布早三个月。
所以 GPT4 这么巨大的进步也不需要用户输入。
国产模型在 2023 年上半年,一直在做的事情就是追平 ChatGPT。
最后他们一个一个都追平了,包括有用户的,没用户的。
甚至可以这么说,2023年上半年,国产模型的进步,最重要的功劳在蒸馏和开源,跟用户没什么关系。
Kimi 在2023年底上线了长文本功能,长文本相关的任务完成的很好,惊艳四座。
但它的惊艳主要靠产品经理和算法对长文本任务的优化以及对老师模型的蒸馏。
也跟用户没什么关系。
DeepSeek 在 2024 年的海内外口碑特别好,开源代码能力第一名,2024年都没怎么做产品推用户,直到最近才上了 APP。
所以这么看下来,大模型的进步似乎确实不太需要用户。
不光是语言模型
大模型进步不需要用户这件事不光发生在语言模型上,也发生在视频模型上。
2024年中,可灵视频模型一出,大家惊呼,还是有用户有数据的短视频公司厉害。
可是字节的数据和用户总比快手要多的,但是字节的模型那时候可没出来。
到年底的时候,第一梯队的视频模型就两个:可灵,海螺。
海螺视频那时候用户也是0。
后来一家公司的算法大佬透露,短视频数据质量太低,不是什么好的训练数据。
类似的事情还发生在图像领域。
Midjourney,出道即巅峰,到现在虽然不是用户数最多的,但依然是审美天花板。
所以这么看下来,视频和图像模型的进步似乎确实不太需要用户。
大模型的小进步还是需要精英用户的
话说回来,虽然大模型的大进步不太需要用户,但是迭代和优化,还是需要用户的输入作为参考的。
只是 99% 的用户输入都没太大意义,只有 1% 的精英用户输入是有意义的。
很多人说更多用户可以解锁更多场景,其实本质是更多精英用户的输入才能解锁更多场景。
而精英用户在用什么大模型,大家都也是很清楚的。
精英用户选择模型靠的也不是广告,而是其他精英用户的口碑。
不过由于蒸馏这一特殊知识传递系统的存在,精英用户所用的大模型是老师。
老师最终会教会学生。
所以,该要用户还是需要一点的,只是没必要疯狂推流。
大模型和产品的矛盾
大模型本身是反网络效应的。
以前用户要获取信息,只能通过内容,这就需要有创作者来生产内容。
现在用户要获取信息,大模型可以直接生产很多内容,并不需要创作者来构建双边网络。
技术可能没那么刚需用户了,但是产品还是需要用户的。
没有用户,收入从哪里来?
所以当主题回到 AI 产品,移动互联网的那套经验,又是非常重要的。
这里就出现了最矛盾的现象。
大语言模型产品疯狂推流是为了什么?