专栏名称: 浙江日报有风来
云世界再美,也要有风。
目录
相关文章推荐
杭州交通918  ·  小S最新发声 ·  13 小时前  
杭州交通918  ·  痛心!发现19具遗体,腐烂严重! ·  3 天前  
FM93交通之声  ·  取消!多地发布紧急提醒 ·  5 天前  
51好读  ›  专栏  ›  浙江日报有风来

人类画龙,AI点睛

浙江日报有风来  · 公众号  · 浙江  · 2024-12-11 19:23

主要观点总结

文章介绍了Sora官网发布的南朝梁画家张僧繇的小故事,并引出AI视频生成模型Sora的发布。Sora具有多种功能,如生成高质量视频、实现文生视频和图生视频等。此外,专家对其表现进行了解析和探讨,国内的相关技术和全球的影响也被提及。同时,也提出了对滥用AI技术的担忧和对公众鉴别能力的重视。

关键观点总结

关键观点1: AI视频生成模型Sora的发布与功能

Sora提供多种功能,如生成高质量视频、实现文生视频和图生视频等。用户可以通过指令实现视频重混、重新剪辑等功能。

关键观点2: Sora的技术变化与比较

相较于首次预告,新版本的Sora在画质、时长等方面有所变化,解决了AI视频生成模型一次性难以修改的问题。但仍有物体相互穿过等缺陷。

关键观点3: 国内追赶与专家观点

从Sora亮相到发布期间,国内多家公司推出类似技术。专家表示,目前Sora的表现还未达到惊艳程度,不能完全替代国内某些AI视频生成模型。

关键观点4: AI技术的滥用风险与教育系统应对

随着AI技术的迅速发展,公众对AI生成内容的鉴别能力变得尤为重要。滥用风险引起了人们的担忧,教育系统需要积极应对这一问题。


正文

Sora官网


《历代名画记》里面有篇挺有意思的小故事:


南朝梁画家张僧繇在金陵安乐寺墙壁上画了四条龙,但没有画眼睛,他说:“画上眼睛龙就飞走了。”大家都不相信。于是张僧繇为其中一条龙点上了眼睛。一会儿,雷电交加,那条龙破壁而出,乘云飞上了天,没有被点上眼睛的龙仍然留在璧上。


百字小文中,透露着古人对提笔成真的朴素愿望,千年未改。


12月10日,备受期待的AI视频生成模型Sora正式向用户开放——只要输入一段文字,就能轻松生成视频,画面清晰丰富,栩栩如生。


画龙点睛的梦想似乎触手可及。Sora会是那点睛一笔吗?



 一 


相较于今年2月的首次预告,可以说新版本的Sora有两大变化。


一是在画质(最高支持1080p)、时长(最长20秒)以及画面长宽比方面都为用户提供了选择,还可实现文生视频、图生视频和视频生视频。


二是用户可以通过指令实现视频重混、重新剪辑、循环、混合和风格预设等功能,这让它更像是一个加强版的视频编辑器。


Sora功能演示,图源官网


此前,AI视频生成模型最大的痛点在于其一次性,即一经生成难以修改,Sora在一定程度上解决了这个问题。


在社交网站上,OpenAI首席执行官奥特曼表示,大家可以将Sora看作视频版的GPT-1。2022年,ChatGPT一经发布就迅速风靡全球,用户数在短短两个月内就突破了1亿,被认为是通用人工智能的里程碑时刻。


当然,Sora在遵循物理规律的欠缺依然无法解决。比如物体相互穿过、凭空出现和消失的现象频繁发生,在网友分享的视频里,还会出现动物跑着跑着就飞起来的情况。有专家表示,作为扩散模型和 Transformer 的结合体,Sora很可能出现对时空子块单元进行组合时作出了概率统计意义上的“合成谬误”等问题。


Sora之所以被人们津津乐道,根本的原因在于,它能够像人类一样对真实世界有一个较为准确的认知。就像是维特根斯坦在《逻辑哲学论》里说,句子是实在的图像语言。放在人工智能的场景里,通过语言我们在Sora中构筑了一个世界模型,它不仅包括对事物的描述和分类,还包括对事物的关系、规律、原因和结果的理解和预测,从而进行推理和决策。这是它超越视频生成层面的重要意义所在。


价格与权限页面,图源官网


至于大家最关心的价格,ChatGPT plus或ChatGPT Pro的订阅用户可免费使用Sora。前者为20美元/月,最多可生成50次,分辨率最高为720p,时间最长为5秒。ChatGPT Pro为200美元/月,在慢速队列模式下可以无限制生成,快速模式下可生成500个视频,分辨率最高可达1080p,生成的视频时间最长为20秒。



 二 


从Sora亮相到发布的这10个月里,国内的Sora们一直在抓紧追赶。


字节跳动推出了即梦Dreamnia,快手发布了可灵大模型,腾讯以混元大模型作为核心,发布并开源了混元多模态生成模型,上海稀宇科技的海螺大模型火爆海外等等。


AI生成视频赛道又要卷起来了吗?


有专家表示,Sora最高只能生成20秒视频,较之预告的版本缩水了三分之二,效果离预期有偏差。单看技术指标,Sora的表现还谈不上惊艳,并没有实现对国内有的AI视频生成模型的完全替代。


怪不得有网友评论:“每个人都对OpenAI Sora感到兴奋,但目前对我来说,最适合制作视频还得是海螺和可灵。”


可以说,OpenAI的本次发布给国内的Sora们带来了紧迫感,但还达不到恐慌的地步。


生成视频“落霞与孤鹜齐飞,秋水共长天一色”

来源网络


对于影视行业从业者而言,AI视频模型将改变电影工业的生产方式。





请到「今天看啥」查看全文