4K 视频生成！Google 版 Sora 深夜秀肌肉，再度狙击 Open AI

APPSO · 公众号 · app · 2024-12-17 07:13

主要观点总结

Google DeepMind 推出了新的视频模型 Veo 2 和 Imagen 3。Veo 2 具备高级视频制作功能，支持高分辨率，并改进了物理和动作理解，同时减少了错误生成。Imagen 3 能在多种艺术风格中更精确地转化文字描述为图像。两者都受到了高度评价，并伴随着新工具 Whisk 的推出，用于创作数字化产品。

关键观点总结

关键观点1: Veo 2模型的新功能

支持最高4K分辨率的视频制作，具备更真实的物理现象和人类表情模拟，降低了错误生成频率，并嵌入SynthID水印以增强安全性。

关键观点2: Imagen 3模型的突破

支持多种艺术风格，更精确地将文字描述转化为图像，生成更明亮、构图更协调的视觉作品。

关键观点3: Veo 2和Imagen 3的推出与测试

这两款产品已在多个国家推出，并进行了性能测试和对比，显示出其领先性能。DeepMind计划逐步将Veo 2功能引入YouTube Shorts等产品，并持续优化性能。

关键观点4: 新工具Whisk的推出

Whisk整合了Imagen 3模型和Gemini的视觉理解能力，用户可以通过导入或创作图像来表达特定主题、场景和风格需求，并创作数字化产品。

正文

就在刚刚，Google Deepmind 推出了新的视频模型 Veo 2 和 Imagen 3。

Google CEO Sundar Pichai 第一时间在 X 平台发文介绍了这两款产品：

我们非常荣幸推出 Veo 2，这款全新、最先进的视频模型（具备更强的真实世界物理与运动理解，支持最高 4K 分辨率）。

你可以在 VideoFX 上加入等候名单。

我们改进后的 Imagen 3 模型同样达到了行业领先的成果，并将于今天在 100 多个国家推出，届时将在 ImageFX 平台上线。

根据官方介绍，Veo 2 带来了多项重要突破：

支持制作高达 4K 分辨率的视频

能够识别指令中的摄像机控制，例如广角、第一人称视角和无人机拍摄

能更真实地模拟物理现象和人类表情变化

相比其他视频模型常见的「错误生成」问题（如多余手指或意外物体），Veo 2 显著降低了这类错误的出现频率，大幅提升了输出结果的真实度。

在安全性方面，所有由 Veo 2 生成的视频都会嵌入不可见的 SynthID 水印，便于识别其 AI 生成的属性。

Google Labs 的视频生成工具 VideoFX 已集成了 Veo 2 的新功能，同时扩大了用户访问范围。