专栏名称: 健谈计算机
第一时间分享科技行业独到见解,定期更新每周观点及研究成果。关注我们,与您一同并肩在科技浪尖和股市前沿。
相关文章推荐
发现新西兰  ·  罕见离婚官司,把新西兰知名艺术家打跑了…… ·  2 天前  
白鲸出海  ·  对话Haivivi李勇:用AI做Jellyc ... ·  2 天前  
阿里开发者  ·  AI 推理场景的痛点和解决方案 ·  2 天前  
51好读  ›  专栏  ›  健谈计算机

行业点评:Sora重磅发布,AI产业迈入新阶段【开源计算机陈宝健团队】

健谈计算机  · 公众号  ·  · 2024-02-18 20:30

正文

评论

1、 事件:2月16日,OpenAI发布首个文生视频工具Sora
(1)Sora支持生成一分钟的高质量视频。 AI视频生成技术已出现一年多,此前发布的Runway Gen 2、Pika等AI视频工具仅支持十秒以内的视频生成,Sora最高支持生成一分钟的1080p视频,且视频更加真实、人物更人性化,表现惊艳
(2)Sora理解事物在物理世界的存在方式。 根据OpenAI介绍,Sora能够生成具有多个角色、特定运动类型以及细节准确的复杂场景视频,Sora不仅理解用户提示词的要求,而且理解事物在物理世界的存在方式。NVIDIA 高级研究科学家Jim Fan表示,Sora是由数据驱动的物理引擎,或采用虚幻引擎5进行训练
(3)Sora是采用Transformer架构的扩散模型。 根据OpenAI介绍,Sora是采用Transformer架构的扩散模型,生成过程从类似静态噪声的视频开始,通过多个步骤消除噪声,最终生成清晰的视频。OpenAI表示,扩展视频生成模型是构建物理世界通用模拟器的有前途的途径
(4)Sora将图片和视频转化为补丁,从而可以用更广泛的数据训练。 OpenAI将图片和视频数据转化为统一的表示方式——补丁(patches)来进行训练,补丁类似于大语言模型中的tokens,并且可以高度扩展。通过统一数据的表示方式,Sora可以用更广泛的数据训练,使生成的视频更加真实。
(5)Sora目前正进行安全测试,最早或于8月向公众开放。 OpenAI表示目前Sora处于安全测试阶段,仅向有限的创作者开放。根据彭博社报道,GPT-4经过6个月的测试后正式向公众开放,参考GPT-4,预计Sora或将于8月向公众开放

2、 AI视频工具将打开更为广阔的AI应用市场,算力厂商将持续受益
视频/3D/游戏是AIGC技术最复杂、应用前景最广阔的方向。AI视频生成工具可以大幅减少实景拍摄、降低视频制作成本,Sora的发布或将成为AI视频应用的里程碑事件,有望打开更为广阔的AI应用市场,看好其在短视频、游戏、电影等领域的应用。此外,考虑到视频数据量相对文本和图片有几何级的提升,AI视频生成对训练和推理的算力需求将大幅提升,OpenAI、Meta等巨头在算力领域持续布局,也侧面反映了未来对于算力的旺盛需求,算力厂商有望持续受益







请到「今天看啥」查看全文