这个厉害,消费级显卡支持的AI视频生成来了!
阿里云开源视频大模型Wan2.1!8G显卡就能跑🔥
以140亿参数版本在权威评测中超越Sora、Luma等国际竞品,还首次实现消费级GPU(如RTX 4090)的流畅运行。核心亮点:
1. 性能全面开挂:
- SOTA级表现:在VBench评测中以86.22%总分登顶,支持复杂运动(如跳跃、翻滚)、物理规律还原(重力、碰撞)及影院级画质生成,甚至能精准捕捉“眼神忧郁”等细腻情感。
- 多模态任务全覆盖:文生视频、图生视频、视频编辑、文生图、视频生音频一网打尽,首创中英文文字渲染能力,无需插件直接生成艺术字。
2. 消费级硬件友好
- 低门槛部署:13亿参数版本仅需8.2GB显存,4分钟生成5秒480P视频;140亿专业版则面向高画质需求,支持多卡分布式推理优化。
- 无限长视频处理:自研因果3D VAE技术突破长度限制,可编码/解码任意时长的1080P视频,内存占用降低29%。
3. 架构与训练革新
- 高效并行策略:结合DP、FSDP、RingAttention等混合并行技术,实现近线性加速,训练稳定性与效率双提升。
- 数据链路优化:四步数据清洗流程构建大规模高质量数据集,支持多语言长文本指令理解,生成内容更贴合用户需求。
现可通过GitHub、HuggingFace等平台下载体验,或直接在通义官网在线试玩。
项目: github.com/Wan-Video/Wan2.1
官网:tongyi.aliyun.com/wanxiang/
#ai创造营# #科技# #deepseek#
阿里云开源视频大模型Wan2.1!8G显卡就能跑🔥
以140亿参数版本在权威评测中超越Sora、Luma等国际竞品,还首次实现消费级GPU(如RTX 4090)的流畅运行。核心亮点:
1. 性能全面开挂:
- SOTA级表现:在VBench评测中以86.22%总分登顶,支持复杂运动(如跳跃、翻滚)、物理规律还原(重力、碰撞)及影院级画质生成,甚至能精准捕捉“眼神忧郁”等细腻情感。
- 多模态任务全覆盖:文生视频、图生视频、视频编辑、文生图、视频生音频一网打尽,首创中英文文字渲染能力,无需插件直接生成艺术字。
2. 消费级硬件友好
- 低门槛部署:13亿参数版本仅需8.2GB显存,4分钟生成5秒480P视频;140亿专业版则面向高画质需求,支持多卡分布式推理优化。
- 无限长视频处理:自研因果3D VAE技术突破长度限制,可编码/解码任意时长的1080P视频,内存占用降低29%。
3. 架构与训练革新
- 高效并行策略:结合DP、FSDP、RingAttention等混合并行技术,实现近线性加速,训练稳定性与效率双提升。
- 数据链路优化:四步数据清洗流程构建大规模高质量数据集,支持多语言长文本指令理解,生成内容更贴合用户需求。
现可通过GitHub、HuggingFace等平台下载体验,或直接在通义官网在线试玩。
项目: github.com/Wan-Video/Wan2.1
官网:tongyi.aliyun.com/wanxiang/
#ai创造营# #科技# #deepseek#