模拟世界！OpenAI 王炸来袭！

王吉伟 · 公众号 · · 2024-12-19 10:56

正文

开服就被挤爆服务器！OpenAI的Sora正式开放，带着革命性的AI视频生成技术，突破性地从文本生成高质量视频。

新Sora功能突破不仅代表了视频生成技术的进步，也表明OpenAI在多模态生成能力上的技术突破。 新版Sora分辨率从480-1080可选！生成1080P的视频最长约为20秒！擅长抽象和流畅性动作！

这次我邀请了 QS前100大牛联合打造了 《世界模拟器—Sora解读》 ，带你深入了解Sora如何运作、如何突破技术瓶颈、以及它如何逐步推动人工智能向通用人工智能（AGI）迈进。

回复关键词 “扩散模型”

领 扩散模型论文200篇

Sora系列课

随着Sora正式版的发布，OpenAI同时也提供了该模型背后的技术细节。

1. Sora：一款创造性工具的背后技术

Sora基于OpenAI在视觉生成领域的前沿技术， 建立在DALL·E和GPT模型的基础 上。作为 一种扩散模型 ， Sora通过从噪声开始并逐步去噪的方式生成视频。它的核心创新在于使用Transformer架构，这使得模型具备了强大的扩展性和生成能力。

2. 模型核心：视频生成的创新突破

Sora的强大之处在于它能够理解和模拟现实世界。在生成视频时，它能够处理多帧视频数据， 在保持主体一致性的同时确保画面流畅，即便主体暂时离开画面，也能准确保持其位置和运动轨迹。 这种能力解决了传统视频生成中，短暂丢失主体导致画面不自然的挑战。

3. 强大的数据支持与训练方法

Sora利用了视觉patch这一创新数据表示方法，将视频数据转化为较低维度的潜在空间，经过分解和转化 ，模型得以生成高质量的视频内容。

目前AI新拐点已至，对于感兴趣的开发者和研究者， 我们邀请了QS前100大牛联合打造了《世界模拟器—Sora解读》 ，带你深入了解 Sora如何运作、如何突破技术瓶颈、以及它如何逐步推动人工智能向通用人工智能（AGI）迈进。

课程大纲

回复关键词 “29.9”

即可解锁 Sora系列课