开服就被挤爆服务器!OpenAI的Sora正式开放,带着革命性的AI视频生成技术,突破性地从文本生成高质量视频。
新Sora功能突破不仅代表了视频生成技术的进步,也表明OpenAI在多模态生成能力上的技术突破。
新版Sora分辨率从480-1080可选
!
生成1080P的视频最长约为20秒!
擅长抽象和流畅性动作!
这次我邀请了
QS前100大牛联合打造了
《世界模拟器—Sora解读》
,带你深入了解Sora如何运作、如何突破技术瓶颈、以及它如何逐步推动人工智能向通用人工智能(AGI)迈进。
随着Sora正式版的发布,OpenAI同时也
提供了该模型背后的技术细节。
Sora基于OpenAI在视觉生成领域的前沿技术,
建立在DALL·E和GPT模型的基础
上。作为
一种扩散模型
,
Sora通过从噪声开始并逐步去噪的方式生成视频。它的核心创新在于使用Transformer架构,这使得模型具备了强大的扩展性和生成能力。
Sora的强大之处在于它能够理解和模拟现实世界。在生成视频时,它能够处理多帧视频数据,
在保持主体一致性的同时确保画面流畅,即便主体暂时离开画面,也能准确保持其位置和运动轨迹
。
这种能力解决了传统视频生成中,短暂丢失主体导致画面不自然的挑战。
Sora利用了视觉patch这一创新数据表示方法,将视频数据转化为较低维度的潜在空间,经过分解和转化
,
模型得以生成高质量的视频内容。
目前AI新拐点已至,对于感兴趣的开发者和研究者,
我们邀请了QS前100大牛联合打造了
《世界模拟器—Sora解读》
,带你深入了解
Sora如何运作、如何突破技术瓶颈、以及它如何逐步推动人工智能向通用人工智能(AGI)迈进。