可灵AI在视频生成领域取得了显著进展,获得了马斯克等业内名人的关注和认可。其视频生成效果惊艳,甚至超过了国外同类产品。可灵AI的出色表现不仅体现在视频生成上,还广泛应用于影视行业、媒体及商业领域。快手的创始人程一笑也分享了未来在AI领域的长远规划,包括加强商业化变现、提升模型性能等。
可灵AI不仅用于视频生成,还广泛应用于影视行业、媒体及商业领域,包括帮助创作者生成高质量的视频内容,提升商业化广告主的效率等。
除了可灵AI,快手也在语言大模型和文生图模型等领域取得了显著进展。未来,快手将继续加强在大模型领域的研发和投资,包括降低模型推理成本、提升模型性能以及探索新的应用场景等。
马斯克:AI Entertainment is happening fast!
作者丨王悦
8月20日,AI插画艺术爱好者Déborah在推特上发布一段时长为五秒钟的视频,内容为女人手捧一朵燃烧的玫瑰,画面表现堪称电影级别的画质与动态效果。而这一视频背后,是由可灵AI完成图生视频过程。
没过多久,这条视频获得了埃隆·马斯克(Elon Musk)的关注,并且他在评论区回复「AI Entertainment is happening fast」。
到目前为止,大部分国内初创的文生视频公司并没有拉开太大差距,风头都被国外的Sora、Runway占据之时,
可灵
AI
是国内唯一被马斯克点赞的一个,可以说是十分争气。
但其实,在马斯克亲自点赞之前,
可灵
AI
的风早就已有吹遍国内外之势。
6月初,快手自研的视频生成大模型
可灵
AI
正式发布。问世之初,在海外社交媒体上就掀起了一波热度,大量海外网友在「求」一个
可灵
AI
的内测机会。
之所以有这么高的热度,是因为
可灵
AI
确实是继Sora后效果最惊艳的文生视频模型,并且能开放公测,让公众看得见摸得着,更增强其可信性。
市场分析机构摩根士丹利公开评论道:
可灵
AI
的表现要比抖音和腾讯过往发布的视频生成模型都更加优秀。其成功发布,将有望使快手的用户规模和活跃度进一步提升,从而长期影响快手在电商和商业化等领域的货币化潜力。
从视频生成效果本身来看,
可灵
AI
不仅能够模拟物理世界特性,还具备了强大的概念组合能力和想象力,生成的视频分辨率高达1080p,时长最高可达2分钟。更有网友表示:
可灵
AI
生成的内容比真实世界世界还好。
甚至,
可灵
AI
的效果引起了美国科技界权威杂志《麻省理工科技评论》的注意,发表题为《我测试了一个令人兴奋的中国新型“文生视频”人工智能模型》的文章,对照了
可灵
AI
与Sora的生成效果以及对物理世界的还原能力。
6月21日,
可灵
AI
再度进化,正式推出图生视频功能,支持用任意静态图像生成 5s视频,并且可搭配不同的文本内容,实现丰富的视觉叙事 。马斯克点赞的视频,也是出自
可灵
AI
这一核心爆款功能。
在海外,快手的图生视频得到了广泛的使用。被点赞视频的作者Déborah也多次用
可灵
AI
制作视频 。
7月6日,在上海举行的2024世界人工智能大会上,正式上线了网页端(
https://klingai.kuaishou.com),
推出了更加清晰的高画质版,在视频处理的精细度上有了大幅提升。其中,首尾帧控制、镜头控制等新功能也一起上线,并且创作者单次生成的文生视频时长也增加至10秒。
7月底,
可灵
AI
大模型全面开放内测,并正式面向全球上线会员体系,针对不同类别的会员,提供相应的专属功能服务。
可以见得,在如今的AIGC竞争格局中,
可灵
AI
已经取得了自己的身位优势。
在马斯克点赞
可灵
AI
视频的同一天,快手发布2024年第二季度及中期业绩,总营收同比增长11.6%至310亿元。经调整净利润达46.8亿元,超过市场一致预期。
本季度,快手更是在AIGC领域取得了里程碑式的突破。在
可灵
AI
正式面向全球开放会员体系后,截至目前,已有超过百万人使用过
可灵
AI
,并累计生成超千万视频。
在当天晚间举行的业绩电话会上,快手联合创始人、董事长兼CEO程一笑表示,针对
可灵
AI
的商业化,除了加强C端会员付费的全球运营外,也将寻求更多与B 端合作变现的可能性,力争尽快实现可观的商业化变现规模。
除了视频生成大模型,快手的语言大模型和文生图模型也都实现了显著的性能提升:目前,快意语言大模型已经实现了在中文场景下综合性能超过GPT4.0的目标;多模态大语言模型也在视频内容的理解方面,达到了GPT4v的水平。此外,快手的文生图大模型可图经过多个版本的迭代,综合性能已经超越了Midjourney V5,可图也在近期宣布正式开源。
在具体业务场景中的应用层面,快手的大模型矩阵已经可以覆盖内容生产、理解、推荐等多个层面,并深度服务快手的商业生态场景。例如,基于快意大模型构建的视频和直播脚本生成、广告线索客服,叠加数字人技术,可以助力商业化广告主低成本生成高品质的视频和直播内容,提升线索转化效率。数据显示,今年上半年,有近2万商家借助快手大模型实现智能化经营,其中AIGC营销素材在6月的日均消耗已经达到2000万。
程一笑对接下来在大模型上的相关动作及长远规划进行了阐述:
首先,在语言大模型上,快手将侧重研发训练更适配业务场景的专项语言模型,大规模降低模型的整体推理成本;其次,在视觉生成模型方面,
可灵
AI
依旧是重点发力方向,未来,快手将进一步升级
可灵
AI
大模型,带来模型性能的进一步提升,以保持行业的领先地位;最后,也会探索将大模型进一步运用到商业化推荐中,提升算法推荐效率,从而给线上营销服务收入的增长带来更强劲的支撑。
「快手将坚定执行AI战略,在赋能现有业务场景的同时,努力创造新的业务变现模式。」程一笑说道。
自正式推出两个多月的时间以来,无论是在C端用户群体的自发使用还是在影视行业的专业运用,
可灵
AI
都具有较高的参与度。
在前段时间网络中掀起的「AIGC让老照片动起来」、「拥抱小时候的自己」的话题中,有很多网友选择
可灵
AI
作为工具来让照片动起来,连接过去和现在的自己。
除此之外,
可灵
AI
也被媒体和影视行业广泛应用于专业视频制作流程中。在巴黎奥运来临之际,中央广播电视总台推出首部生成式AI微电影《百年前的那次出发》,就是由
可灵
AI
提供技术支持,生动还原了100年前4名网球选手代表中国奔赴巴黎奥运会的历程。
尤其在七月下旬,由
可灵
AI
提供深度技术支持国内首部AIGC原创奇幻微短剧《山海奇镜之劈波斩浪》收官。作为星芒短剧暑期档的精选剧集,《山海奇镜之劈波斩浪》在5集的篇幅里,利用
可灵
AI
对奇幻的上古传说进行当代“转码”,将古代的浪漫想象进行赛博复现。
截至7月27日,《山海奇镜之劈波斩浪》正片5集播放量超过5200万,全网话题曝光量超4.3亿,同时还登上全平台热搜21个,德塔文短剧景气指数top1、猫眼短剧热度日榜top2。