专栏名称: 市界
博闻雅识,非凡之客。
目录
相关文章推荐
天下泉城  ·  接下来的济南 将与春和景明撞个满怀 ·  昨天  
天下泉城  ·  接下来的济南 将与春和景明撞个满怀 ·  昨天  
武汉发布  ·  大年初七:人胜节 ·  2 天前  
武汉发布  ·  大年初七:人胜节 ·  2 天前  
旅拍誌  ·  摄影师拍的绿,怎么这么好看啊!! ·  2 天前  
旅拍誌  ·  这样拍家人,超暖!超治愈! ·  4 天前  
51好读  ›  专栏  ›  市界

轮到字节追赶快手一次了

市界  · 公众号  ·  · 2024-07-30 18:02

主要观点总结

本文主要围绕快手与字节在文生视频赛道上的竞争展开,描述了可灵和即梦的对比,分析了可灵的优势以及字节的挑战和策略。

关键观点总结

关键观点1: 可灵和即梦的对比

可灵在文生视频赛道中表现意外火爆,相比之下,字节的即梦在目前的竞争中尚未显现明显优势。可灵被认为是在技术上快速迭代,具备生成高质量视频的能力。

关键观点2: 字节的挑战和策略

字节在文生视频赛道上暂时落后,但其在AI大模型方面的布局十分激进。字节正在努力追赶,推出了一系列产品并采取措施降低大模型的使用成本,以期通过教育和合作等途径来获得市场地位。

关键观点3: 字节与快手的不同策略

快手更注重将技术和市场相结合,积极推出产品并参与市场竞争;而字节更在意从基础大模型到AI应用层的全生态竞争,寻求构建最开放的AI生态。

关键观点4: 其他领域的竞争和合作

字节也在AI硬件和其他相关领域展开合作和收购活动,并在各个渠道积极探索创新和发展机遇。无论是应对当前的竞争还是探索新的应用领域,字节都展现出积极的态度和决心。


正文

快手可灵以及文生视频赛道的意外火爆,不免让同序列的字节有些尴尬。究其原因,今年“激进”行军的字节,大模型布局要更为复杂——而上半年,字节更重要的对手或许是阿里与腾讯。随着AI战略在内部的优先级强化,奉行“大力出奇迹”的字节,并不缺少后发制人的机会。

作者 | 董温淑
编辑 李   原
运营 刘   珊

2024年2月,Sora的横空出世,让许多大模型公司的春节都没能过好。

“春晚还在重播,我们就在紧急拉群讨论”,一家AI头部公司员工对「市界」急切地说。看到Sora丝滑的体验,连卖课博主都蜂拥而动,赶着上线教程,大赚一把。

谁能最快时间“复制”出国内版的Sora,更多人将目光放在了阿里、百度、“大模型五虎”身上。但无人想到,拔得头筹的会是技术表现相对“佛系”的快手。
6月7日,快手突然上线了文生视频模型“可灵”(Kling),并可支持长达2分钟的视频生成。此外,与Sora至今仍在“期货”阶段相比,可灵一经公布便开放了测试,生成效果亦可圈可点。
“可灵是最近圈内,被讨论最多的对象”,一位风投行业人士对「市界」说。据官方数据显示:可灵上线一个月有超50万人申请,已开放给超30万用户使用,生成了超700万条短视频。
可灵的意外火爆,不免让字节有些尴尬。今年5月,字节也开放了文生视频模型“即梦”测试,但效果在目前火爆的文生视频赛道中,尚不具明显优势。
突然被曾经“忽视”的对手甩开身位,字节需要埋头追赶。据钛媒体报道,近期,字节跳动将AI大模型设为集团“P0最高级别”的方向。抖音、剪映等多个团队也在抓紧研发AI视频模型应用,预计将在近期公布。

做可灵,快、糙、猛

多位开发者对「市界」表示,可灵的上线与亮眼表现,在行业内也算是个意外。

近日,「市界」以一段“黑猫”为关键词,在可灵、即梦,以及智谱AI刚刚上线的“清影”中分别输入了相同的提示:“下雨天的城市街道上空无一人,一只可爱的黑猫奔跑而过。它的眼珠是绿色,脖子上带有黄色的项圈和铃铛,全身长着黑亮的长毛。视频用摄像机的视角拍摄,地面的积水反射出黑猫的身影。”
在生成的三段视频里,可灵版虽然未能实现快速奔跑的效果,但视频大致符合客观规律。
与之对比,“即梦”版地面没有积水,黑猫也没有向前走动。“清影”版虽有积水,黑猫行走时,步态古怪,尾巴也出现了丢帧。

(视频依次为可灵、即梦、清影生成作品)

据“硅星人”报道,可灵是快手花了3个月的时间打造的;团队规模很小,仅有20余人,牵头人是现快手视觉生成与互动中心负责人万鹏飞,其大部分的研究方向为图像/视频信号处理、计算摄影和计算机视觉、减少Loss函数、视觉生成等。
可灵的前身,来自快手在2023年10月重启的一个不起眼的项目“噗叽”,这是一款将静态图片通过AI生成2s Gif表情包的工具软件。今年3月初,快手内部开了一个小会,万鹏飞的想法得到了快手高级副总裁盖坤(于越)的肯定,迅速确定了将噗叽作为预调研的产品。
据“硅星人”了解,“做可灵的时候,执行层面有个共识,就是快、糙、猛。”
可灵项目开始不到一个月,就获得了快手创始人程一笑的支持,将其视为公司战略级项目。盖坤也常说:公司的卡都给你们用,公司全力支持。
数字人赛道创业者柯燃对「市界」分析道:“可灵的成功,很大程度上要归功于快手积累的视频数据素材。放眼国内,这方面可以与之一战的也只有抖音。”
可灵风光的同时,字节显得有些落寞。
虽然“即梦”5月9日便官宣上线;6月17日,即梦也作为首席AI技术支持方,在AIGC短剧集《三星堆:未来启示录》中亮相。但无论是在C端的表现,或是相较于快手7月13日上线的AIGC短剧《山海奇镜》,即梦的声量均不甚响亮。
7月17日,市场曾传出消息称,字节将公布类Sora的文生视频技术进展。外界也将其解读为,字节要奋起直追,与可灵正面迎战了。
但字节方面随后向「市界」表示,该消息并不准确。7月17日当日,「市界」注意到,活动更类似一场技术分享会。会议主要由豆包大模型视觉基础研究团队负责人冯佳时主持,并由字节研究科学家、机构学者等,做了整场的英语技术分享。
看起来,字节的“大招”或许还需要等些时日。

字节还没回过神

那么,在最近如火如荼的文生视频赛道里,字节为何错过盛宴;最近字节又在忙些什么?

某种程度上,或许因为比起快手押注“可灵”,可以“一力降十会”。字节的大模型布局要更为复杂——而今年上半年,字节更重要的对手放在了腾讯与阿里。
面对大模型,字节的步调已不可谓不“激进”。毕竟2个多月前,率先在行业内发起大模型价格战的,正是字节。
5月15日,在字节跳动“FORCE原动力大会”上,字节推出了基于其自研豆包大模型的API服务。同时,火山引擎总裁谭待一步到位,亮出了“豆包”的最新价格:0.0008元/千Tokens,宣布这是低于行业99.3%的“地板价”。
彼时,字节的“发难”曾先声夺人。据「市界」从多方了解,头部玩家对字节的出击缺少准备;各方虽感无奈,也只能被动追随。
接下来几天,阿里云、百度文心大模型、腾讯云先后宣布,将旗下大模型推理输入token以及API大幅降价。在此影响下,如今头部大模型的C端调用,已几乎悉数免费,行业也开始朝着下一个生态量级“卷”去。
据一家法律AI应用企业创始人向「市界」透露,API服务开放后几乎没有时间差,火山引擎的销售人员就开始积极接触客户、推介产品。这也侧面印证了,市场流传的字节已将大模型标记为最高级别战略的猜测。
谭待于2024“FOECE大会”。图源/火山引擎)
而最近,字节的“当家产品”豆包,增长得较为明显。
据Questmobile数据显示,截至2024年6月,在国内AIGC App中,豆包、天工、Kimi智能助手、猫箱增长亮眼——其中豆包流量排名第一。
图源/QuestMobile)
与快手相比,字节如今更在意的,或许是从基础大模型、到AI应用层的全生态竞争。此外,考虑到2021年才正式做云的火山引擎,在巨头云厂商里是“最年轻”的一朵。三年多来,火山云也一直被视为云市场的挑战者角色。字节如何将基础大模型、应用层、云市场协同起来,更是一项综合命题。
近日,据“光子星球”报道,字节“扣子”平台的大量使用者,正寻求如何将创建的智能体、bot接入微信公号或小程序,讨论十分活跃。
去年12月,字节在海外推出了AI应用开发平台“coze”。今年2月,国内版“扣子”上线。大量抖音体系商家,也希望从中迅速掘一桶金。
考虑到腾讯在今年5月才姗姗来迟,发布了AI智能体创作与分发平台“腾讯元器”。彼时,扣子的访问量已达到了233万次。而截至目前,腾讯元器尚未打通小程序、公众号、客服订阅号微信系列生态。
毕竟当下,AI发展仍在早期阶段。字节与腾讯一样,都还需要花费大量时间教育用户。争夺AI时代的分发权,先声夺人,或许是字节为了瞄准腾讯要做的更大功课。

后发制人,尚有时间





请到「今天看啥」查看全文

推荐文章
武汉发布  ·  大年初七:人胜节
2 天前
武汉发布  ·  大年初七:人胜节
2 天前
旅拍誌  ·  这样拍家人,超暖!超治愈!
4 天前
煮酒论史  ·  你真以为古代女性很封闭保守?
8 年前
安卓开发精选  ·  实现翻转卡片的动画效果
8 年前
电子商务研究中心  ·  原创|一文读懂生鲜电商的七种模式
7 年前
环球旅行  ·  中国最美精华 | 一句话一个古镇
7 年前