《晚点》:音乐生成产品 Suno 三月底上线,Udio 四月初上线,最近昆仑万维也发布了音乐生成产品 SkyMusic,这么多产品扎堆发,你是什么感受?
方汉:行业竞争非常激烈。我们此前内部测试时,SkyMusic 在中文指标上已经 Beat Suno 了。Udio 是 Google 出来的人做的,现在也完全 Beat Suno 了。
《晚点》:昆仑万维过去的哲学是不要去红海竞争,做巨头看不上的生意,现在却一头扎进竞争激烈的 AIGC。为什么?
方汉:竞争激烈并不代表是红海。原来的红海是指,大家技术差不多,都可以迅速在某个领域做产品创新。但这一波不太一样,大模型会重塑所有行业,翻出来的机会太多了,蓝海太多了。
一开始我低估了这一波 AI,以为它只会颠覆内容行业。现在我认为它将超过互联网跟移动互联网两波大浪潮,AIGC 直接把内容生成方式改变了。未来所有的消费电子、所有的行业都有机会被重做一遍,机会太大了。
《晚点》:所以 All in 也是因为如果不做,昆仑万维本来的业务会被洗牌?
方汉:这我倒不是特别担心,因为我们已经在很多海外国家布局了很多业务。
但说实话,作为一家中型互联网公司,唯一的梦想就是成为巨型互联网公司,所以一直在找第二曲线。
2020 年时,我们面前有三个选择:VR/ 元宇宙、Web3 和 AIGC,最后我们选了 AIGC。
《晚点》:怎么选出来的?
方汉:我们认为前两个最后都没有 AI 大。
首先 VR 上限比较明显。我们的手表是 70 克,手机是 300 克,我们能携带的设备的重量非常有限,而当时 VR 设备都是 1.5 公斤的,苹果 Vision Pro 现在做到了 800 克,还是重。VR 设备的市场太小了。
元宇宙是从娱乐内容的角度看,我们认为所有娱乐内容产品本质都是拼两件事——激素生产的频率和幅度。短视频已经把频率做到了极致,它生产多巴胺的频率是 13 秒一次。
Web3 是过于理想主义了,过于理想主义的产品最后都不会被大众接受。
AI 要大得多。我是 1995 年开始上网,玩的第一个游戏是 MUD,MUD 衍生了网易的第一个产品《天下》,《天下》衍生了《大话西游》,《大话西游》衍生了《梦幻西游》,《梦幻西游》是网易现在最赚钱的产品。1995 年看到 MUD 时我特别震惊:还有这么好玩的网络游戏!
我 2020 年玩了 GPT-3,当时让我大受震撼——这跟我 1995 年的感觉是一模一样的。
当然我是从技术角度。周总(周亚辉)商业触觉非常灵敏,他立刻预判内容行业会被全部洗牌。
《晚点》:洗牌会如何发生?
方汉:AI 要分成 AGI 通用人工智能和 AIGC 内容生成。2020 年我们选择 All in 的是 AIGC,后来是 AGI 和 AIGC。
AIGC 内容生产最可怕的是降低了所有内容创作的门槛。这个变化可以类比手机摄像头出现以后,视频创作门槛一下低了几倍,原来拍电影要各种工种配合,中国打灯的人可能都是一个村的,现在人人可以拍短视频。
内容行业的规模还与多元性紧密相关。当一个语言的使用人数低于 5000 万时,养不起自己的文化产业,只能接受强势文化。印度有 30 多种语言,有 10 种语言的使用人数在 1000 万以上,但因为说印地语与英语的人最多,所以所有印度电影只有这两种语言。但 AIGC 把门槛降低后,会促进文化平权,各种长尾的亚文化族群都会生产内容。
生产内容的门槛每降低一倍,创作内容的人数增长十倍。
《晚点》:昆仑万维要做什么去抓住它?
方汉:我们 2022 年考虑 AIGC 的终局是什么?这里面绕不开的话题就是 Google、字节这样的巨头会做什么。
刻舟求剑地看,互联网和移动互联网那波,最后起来的全是 “免费 +C 端” 模式,首先要免费,第二要 C 端。订阅模式会小一个量级。全世界能付得起 OpenAI 每个月订阅费的只有 1 亿人,剩下的 79 亿人怎么办?
但现在大模型推理成本太高了,想要完成商业闭环,我们想了三种路径:第一是通过模型优化把推理成本压低,压到低于广告收入就能打平。第二是 AI UGC 平台,我们给 1% 的内容创作者提供服务,99% 的用户消费内容。第三是 AI 终端,这个我们判断是大模型的终局。
还有一个规律是:巨头递减。互联网起来时,传统企业看不上互联网业务,互联网企业长得很大之后反过来把传统企业都干死了。但到移动互联网兴起时,第一波互联网留下来的巨头 BAT、Google 占了很多坑,导致移动互联网的新巨头就比较少,中国是字节、美团、滴滴,美国可能就一个 Uber。现在巨头还尤其有个好处,谁有卡谁牛。
所以我们估计 AI 这一波,巨头还要递减, 国内会新长出两三家,美国有两三家。
《晚点》:巨头递减的趋势下,想变成巨头岂不是更难了?
方汉:移动互联网时代有两个特别好的例子:为什么巨头林立的现在,B 站、小红书还能活得特别好?是因为这两家在垂类做到极致,再去泛化。小红书是美妆、穿搭起家,泛化到线下的酒旅;B 站是从二次元泛化到中视频、长视频。
另外还有一个判断,就是刚才提到的文化平权。内容创作成本降低后,每个语言都需要自己的一套产品,这时 AIGC 平台就能在全球得到红利。
综合来看,我们的机会一是做可以泛化的垂类,二还是做全球市场。
《晚点》:这个垂类具体是什么?
方汉:可能是偏网文、短剧、动画的 IP 创作。
《晚点》:所以你看到的还是娱乐性的机会。
方汉:肯定是偏娱乐的。娱乐是有价值的,人类除了繁衍基因,就是获取快乐,不然人就崩了。我是学核物理的,所以我说话特别社会达尔文主义,不好意思。
《晚点》:你不看好用 AI 做生产力工具?
方汉:看好。to B 是容易挣钱的,但很难做成巨头。
互联网、移动互联网巨头,从 to B 起家的有多少?有一批中型的、能挣钱的,Salesforce、Adobe 之类的,但都比 C 端小一个量级。
《晚点》:微软是 to B 起家的巨头,它只是特例吗?
方汉:微软也很难定义为纯 to B,微软面向个人操作系统起家,面向最终用户居多。
《晚点》:免费 +C 端的终局,前提是大模型也有边际成本递减效应,但现在服务每个用户都有推理成本,还不便宜,成本也不能显著递减。
方汉:广告收入大于推理成本时,这个商业模式就成立。我觉得这会发生,但很难判断何时发生,因为现在模型能力还在飞速增长,GPT-3.5 免费了,大家又都想用 GPT-4,不断增长的模型能力和不断降低的推断成本,双方还在互相拉扯。
比较确定的是,我们认为端侧推理一定能萌发巨头。就是直接在手机上跑大模型,3000 块买手机等于买了个卡,把大部分推理成本直接覆盖了。
当然,现在端侧推理肯定还远不如云侧推理,端侧只能推 7B 到 13B 的模型,但我认为三到五年后端侧大概能推 70B 的模型,到时在手机上跑 GPT-4 没有问题。
《晚点》:为什么是三到五年?
方汉:因为全民换 AI 手机大概要三到五年。而且手机现在卖不动了,所有手机厂商、芯片厂商也都在找新噱头,会全面转向 AI。
那时在手机上可以做很多事情,而且天然满足了免费和 C 端这两件事,就会出现一个巨大的蓝海市场。所以端侧加云侧混合推理会是 AIGC 竞争的发展方向。
《晚点》:那等模型能力和 AI 手机都 ready 后不是更好的发力时机吗?
方汉:你不能等到那时再创建公司。我有时开玩笑说,最好的 AI 公司应该是 2023、2024 年就创建完毕了,到 2026、2027 年开始成为真正的巨头了。
《晚点》:中间这 3 到 5 年,你们做什么?
方汉:我们做内容创作平台,1% 的创作者用 AI,99% 的消费者不用 AI。绝大多数人没有创作内容的兴趣,全中国 9 亿人刷抖音,也就几千万人愿意拍吧。这样把成本直接砍了一百倍。
大量 IP 靠小说和漫画生产,在影视和游戏里变现。《斗罗大陆》最早在起点中文网连载,后来被改成漫画,火了,腾讯视频又把它改成动画,又火了,最后拍了电视剧,又做了很多网游。《指环王》《哈利波特》《漫威》都是类似逻辑。
中国的小说作者最多,个人过去做不了影视、动画、漫画,但 AIGC 把门槛降低了。而我们全链条能力包括小说生成、漫画生成、影视生成和音乐生成,这形成了昆仑万维的商业闭环。
《晚点》:你之前说做小公司有很强的不安全感,做 AIGC 后,不安全感缓解了吗?
方汉:还是不安全,别人十万张卡,我一万张卡,我能安全吗?实话实说,这是最大的不安全感。
但我们很有动力,因为大公司钱赚得太舒服,他们对 “难挣的钱” 兴趣不大,所以大公司的创新速度是跟不上小公司的。这也是中国很多大公司出海,最初都做得都不好的根本原因。
《晚点》:如果这一次第二曲线成功了,昆仑万维会变成什么样?
方汉:我们梦想变成更大的公司,去年收入是 48 亿,我们至少收入先干到 500 亿,到 1000 亿。这是我们的目标,然后再往后说,想象都没用。
本来都觉得没有上赌桌的机会了,AIGC 又给了我们一次上桌的机会而已。
《晚点》:为什么对变大这么执着?
方汉:因为在中国没有腰部企业,只有头部和尾部企业。