专栏名称: 黄建同学
数码博主 超话主持人(ChatGPT超话) 头条文章作者 我的学习笔记,关注AI+新能源
目录
相关文章推荐
宝玉xp  ·  Google 的 Gemini 2.0 ... ·  16 小时前  
宝玉xp  ·  Anthropic 并不鼓励用 AI ... ·  昨天  
量子位  ·  华为昇腾推理DeepSeek-R1,性能比肩 ... ·  昨天  
爱可可-爱生活  ·  《爱可可微博热门分享(2.2)》 ... ·  3 天前  
51好读  ›  专栏  ›  黄建同学

新的虚拟穿衣:单网络虚拟试穿方法 MN-VTON★ 挑战虚拟试穿-20250124165327

黄建同学  · 微博  · AI  · 2025-01-24 16:53

正文

2025-01-24 16:53

新的虚拟穿衣:单网络虚拟试穿方法 MN-VTON

★ 挑战
虚拟试穿(VTON)已成为电商的重要工具,可以在保持原始外观和姿态的同时,逼真地模拟服装穿着效果。然而,早期单网络方法在提取和融合服装细节特征方面存在局限性,难以保留精细纹理。近期的双网络方法通过引入“参考网络”(ReferenceNet)提升特征处理能力,但这也显著增加了计算开销,限制了高分辨率或长时图像/视频虚拟试穿的应用。

★ MN-VTON 方法简介

单网络虚拟试穿方法(MN-VTON),通过“模态特定归一化”(Modality-specific Normalization)策略有效解决上述问题。

1. 关键创新:对于多模态输入(如文本、图像、视频),MN-VTON 采用 AdaLN-zero 归一化,对相似模态(如参考服装与图像/视频)应用相同的归一化处理,而对不同模态(如文本与视觉输入)采用独立归一化方式。

2. 共享权重自注意力机制:通过跨所有输入令牌共享的自注意力模块,实现高效的特征融合和服装模拟,仅需一个单网络即可完成任务。

实验结果表明,MN-VTON 在图像和视频试穿任务中均能生成更高质量、更细致的结果,与双网络方法表现相当,同时显著提升了计算效率。

访问:ningshuliang.github.io/2023/Arxiv/index.html

#ai创造营##ai##科技#





请到「今天看啥」查看全文