出品丨深网·腾讯新闻小满工作室
AI光年/追踪中国AGI崛起之路
“AI一定是命运对美图的馈赠。”在厦门市美图大厦21层,美图创始人、董事长兼CEO吴欣鸿告诉《AI光年》。
这与业界对当下生成式AI市场的悲观态度截然相反。有数据统计显示,全球AI领域去年从英伟达采购了大概500亿美元规模的GPU,但是同时只产生了大概30亿美元的营收。
而吴欣鸿的乐观,来源于美图在垂直大模型应用上的进展。财报显示,2023年美图总收入27亿元,同比增长29.3%,净利润3.7亿元,同比增长233.2%。官方称,总收入与净利润增长主要得益于AI推动主营业务的收入增长。目前美图用户每天处理数亿份图片和视频,约83%都用到了泛AI功能。
这符合投资人朱啸虎和全球知名AI科学家贾扬清等业内人士的判断,朱啸虎认为大模型的商业机会在垂直应用市场;贾扬清也认为,一个通用的大模型的效果固然非常好,但是在企业实际应用当中,中小型模型加上自己的数据,可能反而能够达到一个更好的性价比。
“诞生Supper App的机会很少,目前我们看到AI应用中,有两大类应用,已经跨越死亡谷,开始有比较持续的流量:一个是提效,另外一个是娱乐。”贾扬清说。
在大模型商业化难的迷惑中,美图业绩的提升,也给了一些行业借鉴。
截至2023年12月31日,美图付费订阅用户数超911万人,创历史新高,同比增长62.3%。同时,该业务全年收入13.3亿元,同比增长52.8%。
“AI这波的时代红利美图无论如何都要抓住。”吴欣鸿说,“我以感恩的心态面对这样巨大的时代红利,但我也担心这样的机会从手上溜走。现在危机感其实比过去加剧了,整个生成式AI发展太快了,过去的一年里,以周为单位,生成式AI有很多新的技术和产品,竞争一直在加剧。当然,对我们冲击最大的还是Sora这样的视频大模型。”
吴欣鸿回忆,美图曾经也有过一次这种来自时代的馈赠,美拍当年已经是中国排名第二的短视频社区,但没抓住后来短视频时代的巨大红利。
对43岁的吴欣鸿来说,抓住AI机会,一定是要全情投入的。3月26日凌晨2:17的美图微信工作群,吴欣鸿还在跟同事分享各种技术文章,《画漫画变零门槛?AI通过文字帮你画一本漫画》,十分钟后他分享了《2024年MidjourneyV6人人必学的命令》,三十分钟后吴欣鸿又分享了《用IPadapter FaceID生成一致性角色》。
“昨天晚上我三点多还没睡,早上八点多又起来了,整个人非常兴奋”,吴欣鸿告诉《AI光年》,“这个工作状态跟我2001年创业的时候有点像,那时候也是经常晚上兴奋的睡不着,研究各种各样的知识,然后早晨回家睡觉。”
那一时期,吴欣鸿在远离互联网中心的泉州古城创业。早晨回家,举目皆是青砖红瓦、飞檐翘角的骑楼古建筑,而晚上在互联网上,吴欣鸿看到的是另外一个技术变革带来的新世界。“我觉得很奇妙,好像在两个世界中穿越一样,会有一种时空交错的感觉”,吴欣鸿说。
2023年6月,蔡文胜辞任美图董事长,吴欣鸿接任董事长,兼任CEO,成为董事会唯一的执行董事。蔡文胜与吴欣鸿,是一起创业的老搭档,蔡文胜懂资本运作;吴欣鸿擅长产品开发。曾经“工具自卑”的美图,在吴欣鸿掌舵后,现在回归到工具本身,以AI重构全线产品。
以下是腾讯新闻《AI光年》与吴欣鸿对话实录整理:
“五虎最好的归宿是抱大厂大腿”
《AI光年》:2024年,美图的关键词是什么?
吴欣鸿:
2024年刚过去一个季度,今年我觉得关键词有可能是“速度”,Sora的发布实际上压缩了整个模型层的时间窗口,原本它没出来的时候,大家还是慢悠悠的,现在它出来了,留给大家时间不多了,所有行业都在加速。
《AI光年》:去年ChatGPT出来之后,你说“战战兢兢,如履薄冰”,现在一年过去了,美图的财报也很好看,你的危机感有没有缓解?
吴欣鸿:
危机感其实比过去加剧了,整个生成式AI发展太快了,过去的一年里,以周为单位,生成式AI有很多新的技术和产品,竞争一直在加剧。
《AI光年》:竞争来自互联网大厂和大模型创业“五虎”吗?
吴欣鸿:
大模型创业五虎,所有的互联网大厂、手机巨头,都有自己的大模型和AI助手,有一些已经亮相,有些还在准备。
大模型的AI新秀们,融资也都比较多,这意味着一级市场和巨头们对大模型的投资差不多到一个阶段了,往后想要大的融资,可能比较难了。
《AI光年》:一级市场有一个观点,认为大模型创业五虎最后好的归宿是抱互联网大厂的大腿,就像OpenAI与微软,你怎么看?
吴欣鸿:
的确是。比如最近“月之暗面”公布的最新一轮融资,超10亿美元,阿里出了8亿美元。
《AI光年》:去年一年大家都卷大模型,现在大模型的格局初定,卷应用层你觉得从什么时候开始?
吴欣鸿:
总的来说,过去一年国内对通用大模型关注的比较多,但对应用层的关注相对少。但国内应用层的卷,我觉得从去年就开始了,这实际上是有一个先后顺序的,要等到国内大模型厂商提供API或者SDK,应用开发者才能往前推进。
《AI光年》:美图在应用层和大模型领域的战略定位是什么样的?
吴欣鸿:
美图过去16年一直在应用层做影像工具,但它也要应用计算机视觉的算法,所以我们自然而然就接触了AI,也无缝衔接了生成式AI这一波。美图为什么要投入大模型?主要是我们用别人的模型有些受限,比如别人已经训练好的图像大模型,我们只能去调用它,但它的效果可能只是六七十分,但我们要求是八十分,怎么办?必须自己下场,才能对效果有所把控。
美图同时在大模型和应用层投入,但我们做的是图像和视频大模型,相对垂直。
美图跟互联网巨头、AI新贵还是有一些差异化,他们都在做LLM模型,图像和视频只是他们未来多模态能力的一环。另外我们现在能看到,大模型公司也在尝试做应用,如果不下场做应用,没有办法构建数据闭环,很难快速提升模型能力。
《AI光年》:你的压力是不是也源于此——图像和视频只是大模型未来多模态能力的一环?
吴欣鸿:
不是,美图在纵深上有自己的优势。压力大是因为生成式AI有了确定性趋势,大家都下场,竞争更激烈了。
《AI光年》:你怎么看去年妙鸭的昙花一现?
吴欣鸿:
大模型的竞争是一个系统能力的竞争,不是单点的。应用层大部分是靠订阅和单购来变现的,比如说订阅成为美图的VIP会员,我们的产品可以提供几十项能力,但价格是一样的。就单点来说,我们的AI写真效果也很好,但营销做的还不够好。
“Sora给视频大模型明确了技术路线”
《AI光年》:Sora刚出来的时候业界都觉得很惊艳,当时内部有没有一些讨论,有没有一些结论?
吴欣鸿:
其实Sora发布,我们的感受是心理冲击很大。原本我们觉得两三年后才能出来的效果,居然被Open AI这么早就实现了,当然它也给很多视频大模型的团队明确了一个技术路线。
《AI光年》:视频大模型的技术路线是什么?
吴欣鸿:
Open AI下面有三个模型,一个是以ChatGPT为代表的文本的大模型或者语言大模型,第二是以DALL-E为代表的图像大模型,第三是SORA为代表的视频大模型。