专栏名称: 晚点LatePost
晚一点,好一点。这是《财经》杂志与小晚团队联合推出的新品牌。全部一手采访,没有二手信息。做你最信任的商业新闻媒体。
目录
相关文章推荐
杭州本地宝  ·  2025年浙江普通高校专升本计划发布!明天开 ... ·  2 天前  
余杭发布  ·  无人机洗楼!过程很流畅…… ·  3 天前  
余杭发布  ·  1万元,连发三年!这笔补贴别忘了申请 ·  3 天前  
51好读  ›  专栏  ›  晚点LatePost

对话昆仑万维方汉:信不信仰不重要,做出东西来才重要

晚点LatePost  · 公众号  ·  · 2024-04-20 00:05

正文

AIGC 会让内容行业重新洗牌。

文丨王与桐

编辑丨程曼祺

做一家既不是巨头、又不是创业公司的中型公司,是什么感觉?昆仑万维董事长兼 CEO 方汉说是 “习惯卷了”,因为中国没有腰部公司,只有巨头和长尾。


今年 50 岁的方汉看起来比实际年轻,他有工程师羡慕的浓密乌发,说话像连珠炮,对亲历过的激荡互联网历史如数家珍。


1995 年,刚从中科大近代物理系毕业的方汉在中科院高能物理研究所工作,他在这里开始上网,中科院计算机室副主任许榕生在 1993 年建起了中国第一条互联网专线和第一个 Web 服务器。


和很多第一代上网者一样,方汉信奉互联网应开放、自由、去中心化,他是开源操作系统 Linux 的第一代中文核心作者之一,此后又研发了国内第一款 P2P 下载软件和第一款商业化 的 P2P 流媒体播放器。


2008 年,他加入了周亚辉刚刚创立的昆仑万维。这位见证了局域网到互联网的资深网虫,此后与昆仑万维一起经历了互联网到移动互联网的多轮大战,历任昆仑万维副总经理和 CTO,2021 年开始担任 CEO。


16 年来,眼见大小巨头在身边崛起,没站上江湖之巅的昆仑万维曾经信奉一套自己的哲学:不轻易进入红海,不和巨头正面竞争。


短视频、头条类的新闻推荐应用和打车,昆仑万维都做过,但都因为判断烧钱也烧不出结果而退出竞争。在国内移动互联网曾经杀成一片红海之际,昆仑万维的主要市场早已转移到海外,在东南亚,在非洲,去全球淘金。


“字节的人觉得开罗就够苦了,我们在尼日利亚,差点得了好几次疟疾。” 方汉说。


但在 2020 年,方汉看到了 AIGC,即 AI 生成技术。


方汉说他第一次体验 GPT-3 就像 1995 年第一次玩 MUD(多人即时虚拟类游戏):“MUD 衍生了网易的第一个产品《天下》,《天下》衍生了《大话西游》,《大话西游》衍生了《梦幻西游》,《梦幻西游》是网易最赚钱的产品。当时我特别震惊:还有这么好玩的网络游戏!


2020 年我玩了 GPT-3,简直就像是个真人,那时候给我的震惊就跟 1995 年时一模一样!”


方汉判断,内容行业一定会被 AIGC 重新洗牌。他认为这能实现中型互联网公司昆仑万维的夙愿——成为巨型互联网公司。


自 2020 年起,昆仑万维从文本大模型做起,陆续做了音乐生成模型和文生图模型等。


“那时候大家做 AI 都是 BERT 路线(Google 最初做大模型的路线),行业里根本没有 GPT 路线的人,想 ‘套壳’ 都没法套,只能自己搞。” 方汉说。


两年之后,在 2022 年春节的 7 天假期里,昆仑万维的核心管理人员聚在一起开战略会,复盘、碰撞、推演,最终明确了一件事—— All in AIGC。


同年 12 月,ChatGPT 刚上线一个月后,昆仑万维就发布了 AIGC 模型系列。2023 年 4 月,昆仑万维又发布天工 1.0 大模型系列。


方汉现在推演的终局是:AIGC 做大的可能性在于做 “免费 C 端产品”,中期通过 AI UGC 平台完成商业闭环,终期是终端 AI 手机的全面普及,推理成本成为用户购机成本的一部分。订阅模式和 to B 可以赚钱,但规模会小一个量级。AIGC 超级 App 3-5 年内就会跑出来,因为那时主流人群已换上了能支撑大模型的新手机,这个过程中,更高效、便宜的端侧推理是关键。


今年 4 月 17 日,昆仑万维发布 4000 亿参数的 MoE(混合专家系统) 大模型天工 3.0 ,它集自然语言处理、计算机视觉、多模态、AI 搜索和 AI 智能体于一体,而且是昆仑万维首次开源 MoE 基础模型。


昆仑万维看重经营效率,每一个业务都要衡量 “吃水线”,昆仑万维创始人周亚辉甚至一度每个季度都要点数服务器,考察成本。但对大模型,方汉说 “买卡就花了 8 个亿”。


截至 2023 年 9 月,昆仑万维的现金及等价物超过 16 亿元。近 3 年,昆仑万维的年营收保持在 35 到 45 亿元的水平。用 8 亿元买卡是大投入。


这家成立于 2008 年,从多轮互联网热潮中存活的中型公司,决定背水一战。


以下是《晚点 LatePost》与昆仑万维董事长兼 CEO 方汉的对话:

想变巨头,AIGC 是重上牌桌的机会

《晚点》:音乐生成产品 Suno 三月底上线,Udio 四月初上线,最近昆仑万维也发布了音乐生成产品 SkyMusic,这么多产品扎堆发,你是什么感受?


方汉:行业竞争非常激烈。我们此前内部测试时,SkyMusic 在中文指标上已经 Beat Suno 了。Udio 是 Google 出来的人做的,现在也完全 Beat Suno 了。


《晚点》:昆仑万维过去的哲学是不要去红海竞争,做巨头看不上的生意,现在却一头扎进竞争激烈的 AIGC。为什么?


方汉:竞争激烈并不代表是红海。原来的红海是指,大家技术差不多,都可以迅速在某个领域做产品创新。但这一波不太一样,大模型会重塑所有行业,翻出来的机会太多了,蓝海太多了。


一开始我低估了这一波 AI,以为它只会颠覆内容行业。现在我认为它将超过互联网跟移动互联网两波大浪潮,AIGC 直接把内容生成方式改变了。未来所有的消费电子、所有的行业都有机会被重做一遍,机会太大了。


《晚点》:所以 All in 也是因为如果不做,昆仑万维本来的业务会被洗牌?


方汉:这我倒不是特别担心,因为我们已经在很多海外国家布局了很多业务。


但说实话,作为一家中型互联网公司,唯一的梦想就是成为巨型互联网公司,所以一直在找第二曲线。


2020 年时,我们面前有三个选择:VR/ 元宇宙、Web3 和 AIGC,最后我们选了 AIGC。


《晚点》:怎么选出来的?


方汉:我们认为前两个最后都没有 AI 大。


首先 VR 上限比较明显。我们的手表是 70 克,手机是 300 克,我们能携带的设备的重量非常有限,而当时 VR 设备都是 1.5 公斤的,苹果 Vision Pro 现在做到了 800 克,还是重。VR 设备的市场太小了。


元宇宙是从娱乐内容的角度看,我们认为所有娱乐内容产品本质都是拼两件事——激素生产的频率和幅度。短视频已经把频率做到了极致,它生产多巴胺的频率是 13 秒一次。


Web3 是过于理想主义了,过于理想主义的产品最后都不会被大众接受。


AI 要大得多。我是 1995 年开始上网,玩的第一个游戏是 MUD,MUD 衍生了网易的第一个产品《天下》,《天下》衍生了《大话西游》,《大话西游》衍生了《梦幻西游》,《梦幻西游》是网易现在最赚钱的产品。1995 年看到 MUD 时我特别震惊:还有这么好玩的网络游戏!


我 2020 年玩了 GPT-3,当时让我大受震撼——这跟我 1995 年的感觉是一模一样的。


当然我是从技术角度。周总(周亚辉)商业触觉非常灵敏,他立刻预判内容行业会被全部洗牌。


《晚点》:洗牌会如何发生?


方汉:AI 要分成 AGI 通用人工智能和 AIGC 内容生成。2020 年我们选择 All in 的是 AIGC,后来是 AGI 和 AIGC。


AIGC 内容生产最可怕的是降低了所有内容创作的门槛。这个变化可以类比手机摄像头出现以后,视频创作门槛一下低了几倍,原来拍电影要各种工种配合,中国打灯的人可能都是一个村的,现在人人可以拍短视频。


内容行业的规模还与多元性紧密相关。当一个语言的使用人数低于 5000 万时,养不起自己的文化产业,只能接受强势文化。印度有 30 多种语言,有 10 种语言的使用人数在 1000 万以上,但因为说印地语与英语的人最多,所以所有印度电影只有这两种语言。但 AIGC 把门槛降低后,会促进文化平权,各种长尾的亚文化族群都会生产内容。


生产内容的门槛每降低一倍,创作内容的人数增长十倍。


《晚点》:昆仑万维要做什么去抓住它?


方汉:我们 2022 年考虑 AIGC 的终局是什么?这里面绕不开的话题就是 Google、字节这样的巨头会做什么。


刻舟求剑地看,互联网和移动互联网那波,最后起来的全是 “免费 +C 端” 模式,首先要免费,第二要 C 端。订阅模式会小一个量级。全世界能付得起 OpenAI 每个月订阅费的只有 1 亿人,剩下的 79 亿人怎么办?


但现在大模型推理成本太高了,想要完成商业闭环,我们想了三种路径:第一是通过模型优化把推理成本压低,压到低于广告收入就能打平。第二是 AI UGC 平台,我们给 1% 的内容创作者提供服务,99% 的用户消费内容。第三是 AI 终端,这个我们判断是大模型的终局。


还有一个规律是:巨头递减。互联网起来时,传统企业看不上互联网业务,互联网企业长得很大之后反过来把传统企业都干死了。但到移动互联网兴起时,第一波互联网留下来的巨头 BAT、Google 占了很多坑,导致移动互联网的新巨头就比较少,中国是字节、美团、滴滴,美国可能就一个 Uber。现在巨头还尤其有个好处,谁有卡谁牛。


所以我们估计 AI 这一波,巨头还要递减, 国内会新长出两三家,美国有两三家。


《晚点》:巨头递减的趋势下,想变成巨头岂不是更难了?


方汉:移动互联网时代有两个特别好的例子:为什么巨头林立的现在,B 站、小红书还能活得特别好?是因为这两家在垂类做到极致,再去泛化。小红书是美妆、穿搭起家,泛化到线下的酒旅;B 站是从二次元泛化到中视频、长视频。


另外还有一个判断,就是刚才提到的文化平权。内容创作成本降低后,每个语言都需要自己的一套产品,这时 AIGC 平台就能在全球得到红利。


综合来看,我们的机会一是做可以泛化的垂类,二还是做全球市场。


《晚点》:这个垂类具体是什么?


方汉:可能是偏网文、短剧、动画的 IP 创作。


《晚点》:所以你看到的还是娱乐性的机会。


方汉:肯定是偏娱乐的。娱乐是有价值的,人类除了繁衍基因,就是获取快乐,不然人就崩了。我是学核物理的,所以我说话特别社会达尔文主义,不好意思。


《晚点》:你不看好用 AI 做生产力工具?


方汉:看好。to B 是容易挣钱的,但很难做成巨头。


互联网、移动互联网巨头,从 to B 起家的有多少?有一批中型的、能挣钱的,Salesforce、Adobe 之类的,但都比 C 端小一个量级。


《晚点》:微软是 to B 起家的巨头,它只是特例吗?


方汉:微软也很难定义为纯 to B,微软面向个人操作系统起家,面向最终用户居多。


《晚点》:免费 +C 端的终局,前提是大模型也有边际成本递减效应,但现在服务每个用户都有推理成本,还不便宜,成本也不能显著递减。


方汉:广告收入大于推理成本时,这个商业模式就成立。我觉得这会发生,但很难判断何时发生,因为现在模型能力还在飞速增长,GPT-3.5 免费了,大家又都想用 GPT-4,不断增长的模型能力和不断降低的推断成本,双方还在互相拉扯。


比较确定的是,我们认为端侧推理一定能萌发巨头。就是直接在手机上跑大模型,3000 块买手机等于买了个卡,把大部分推理成本直接覆盖了。


当然,现在端侧推理肯定还远不如云侧推理,端侧只能推 7B 到 13B 的模型,但我认为三到五年后端侧大概能推 70B 的模型,到时在手机上跑 GPT-4 没有问题。


《晚点》:为什么是三到五年?


方汉:因为全民换 AI 手机大概要三到五年。而且手机现在卖不动了,所有手机厂商、芯片厂商也都在找新噱头,会全面转向 AI。


那时在手机上可以做很多事情,而且天然满足了免费和 C 端这两件事,就会出现一个巨大的蓝海市场。所以端侧加云侧混合推理会是 AIGC 竞争的发展方向。


《晚点》:那等模型能力和 AI 手机都 ready 后不是更好的发力时机吗?


方汉:你不能等到那时再创建公司。我有时开玩笑说,最好的 AI 公司应该是 2023、2024 年就创建完毕了,到 2026、2027 年开始成为真正的巨头了。


《晚点》:中间这 3 到 5 年,你们做什么?


方汉:我们做内容创作平台,1% 的创作者用 AI,99% 的消费者不用 AI。绝大多数人没有创作内容的兴趣,全中国 9 亿人刷抖音,也就几千万人愿意拍吧。这样把成本直接砍了一百倍。


大量 IP 靠小说和漫画生产,在影视和游戏里变现。《斗罗大陆》最早在起点中文网连载,后来被改成漫画,火了,腾讯视频又把它改成动画,又火了,最后拍了电视剧,又做了很多网游。《指环王》《哈利波特》《漫威》都是类似逻辑。


中国的小说作者最多,个人过去做不了影视、动画、漫画,但 AIGC 把门槛降低了。而我们全链条能力包括小说生成、漫画生成、影视生成和音乐生成,这形成了昆仑万维的商业闭环。


《晚点》:你之前说做小公司有很强的不安全感,做 AIGC 后,不安全感缓解了吗?


方汉:还是不安全,别人十万张卡,我一万张卡,我能安全吗?实话实说,这是最大的不安全感。


但我们很有动力,因为大公司钱赚得太舒服,他们对 “难挣的钱” 兴趣不大,所以大公司的创新速度是跟不上小公司的。这也是中国很多大公司出海,最初都做得都不好的根本原因。


《晚点》:如果这一次第二曲线成功了,昆仑万维会变成什么样?


方汉:我们梦想变成更大的公司,去年收入是 48 亿,我们至少收入先干到 500 亿,到 1000 亿。这是我们的目标,然后再往后说,想象都没用。


本来都觉得没有上赌桌的机会了,AIGC 又给了我们一次上桌的机会而已。


《晚点》:为什么对变大这么执着?


方汉:因为在中国没有腰部企业,只有头部和尾部企业。

从不想烧钱到大投入

《晚点》:昆仑万维创始人周亚辉认为创业公司做大模型没有机会,他说 Antropic 最好的出路就是现在卖给亚马逊,越晚越不值钱。你是怎么想的?


方汉:首先技术一定会泛化、白菜化。现在算法工程师可能四、五百万一年,我相信不到五年,就不会这么贵了,因为技术会逐渐扩散。OpenAI 把 GPT-4 的机密保守了两年多还是挺牛的。


长期来看大公司的优势主要是卡。2022 年时我们就觉得卡太贵了。当时上线做个实验,卡都费好多钱。在美国谁有百万卡谁牛,在中国谁有十万卡谁牛。


《晚点》:中国谁有十万卡?


方汉:字节、阿里?创业公司谁也没有。


《晚点》:你觉得大模型创业公司有独立发展的机会吗?


方汉:太多因素了。以中国人的创业能力,机会仍然是有,只是说不一定是纯大模型公司,我更认为未来他们会从大模型转成基于大模型的超级 App。大模型最后都差不多。


《晚点》:就是以技术起家,但最后的壁垒不能是技术。


方汉:是商业模式。


《晚点》:昆仑万维作为中型公司,资源比大公司少,但是不是比创业公司多呢?现在头部大模型创业公司的累计融资在 10 亿美元量级。


方汉:这是长跑。我们对商业价值的思考也是优势,你看我们在海外这么快就能打平,是因为经验不一样。做 App 的人,跟做算法的人不是一拨人。


《晚点》:2022 年初你们内部就开始讲  All in AIGC,同年 12 月你们发布了 AIGC 模型系列,比大部分创业公司早。这带来了什么?


方汉:我们 2021 年就已经训了 13B 的模型。当时觉得能追上来 GPT 了,我们还做了聊天机器人。当时只是觉得很好玩,模型没有对外发布,但我们一直在研究。


当时已经开始买卡了,到 2022 年中,我们买了更多的卡,到了千卡级别。2022 年底,我们觉得不行,必须得到万卡。


我们买卡比国内其他公司更早,所以我们现在才能在第二线的公司里面有最多卡。


《晚点》:在已经有游戏、社交平台等产品的情况下,All in AIGC 资源如何分配?


方汉:AI 的投入就是人和卡。一开始把最好的人调去做 AIGC,之后投入钱开始买卡,我们买卡就花了 8 个亿。


《晚点》:AIGC 和你们的已有应用,比如 StarMaker (一款基于 K 歌的社交产品)等产品怎么结合?


方汉:AI 技术外露一点给 StarMaker 就可以做一波大增长,我们以前吃到过类似的红利。


StarMaker 当初为什么能起来?之前 K 歌产品都拿不到伴奏带,那谁把人声分离做好,谁就能抢占市场。我们买了版权,又用算法把人声分离做到了全球最好,就受到一部分用户喜欢。AI 作曲也类似,我们肯定能吃到红利。


《晚点》:过去的积累对你们做 AIGC 的帮助是什么?


方汉:数据和经验。还是以 StarMaker 举例。我们把全世界 BGM 的人声分离都拆出来了,这就是别人都没有的训练数据。国内有这个能力的、音乐数据最多的,只有字节、腾讯和我们三家,只有要做 K 歌软件的、要给短视频配音的会去研究这个技术。


再比如我们原来做游戏,所以我们做 3D 生成就更有经验。


为什么在 3D、音乐领域中国人能冒出来?因为这个领域数据太少了,只要数据到顶,中国劣势就不明显。


《晚点》:相比新公司可以完全搭建新组织,昆仑万维现在要同时兼顾做已有成熟业务的团队和做 AIGC 的团队,怎么平衡新老团队的管理方式、激励方式?







请到「今天看啥」查看全文