专栏名称: GitHubStore
分享有意思的开源项目
目录
相关文章推荐
大家居洞察  ·  大股东出手!美凯龙或获建发6亿元租金收入 ·  昨天  
大家居洞察  ·  大股东出手!美凯龙或获建发6亿元租金收入 ·  昨天  
会计雅苑  ·  深圳证券交易所2024-2026年财务报告审 ... ·  2 天前  
会计雅苑  ·  审计费2260万!律师费1696万!一公司即 ... ·  3 天前  
马靖昊说会计  ·  央财与上财并列第一,2025ABC中国财经大 ... ·  3 天前  
51好读  ›  专栏  ›  GitHubStore

数字人动作视频生成资源库

GitHubStore  · 公众号  ·  · 2024-10-17 08:31

正文

项目简介

本项目认真总结了👍2D数字人动作视频生成👏相关领域的最新进展,包括论文、数据集和代码库。

Repo以 Vision-driven、Text-driven、Audio-driven 三大方向作以总结,同时考虑 LLM Planning 前沿论文。

分类时,我们定义Audio>Text>Vision优先级,当出现文本不出现音频时,归纳为Text-Driven方法,当文本音频同时出现时,归纳为Audio-Driven方法,以此类推。

区别于以往的总结,项目明确总结了数字人视频生成领域的五大阶段:

🌑 第1阶段 明确驱动源(Vision、Text、Audio)与驱动区域(Part、Holistic),其中Part主要以脸部为主;

🌒 第2阶段 动作规划阶段,大多数工作以特征Mapping学习动作映射,少部分工作以大语言模型LLMs进行动作规划;

🌓 第3阶段 人体视频生成,大部分工作以Diffusion Models为基础,少部分工作以Transformer为基础;

🌔 第4阶段 视频优化阶段,针对脸部、嘴唇、牙齿、手部单独做Refinement优化;

🌕 第5阶段 加速输出阶段,尽可能地加速训练与部署推理,目标Real-Time实时输出。



项目链接

https://github.com/Winn1y/Awesome-Human-Motion-Video-Generation

扫码 加入技术交流群,备注 开发语言-城市-昵称

合作请注明







请到「今天看啥」查看全文