正文
简介
Fader networks: Manipulating images by sliding attributes.NIPS-2017,Cited-196.
Open source,official,pytorch,star-708.
关键字
特征解耦,属性增益,Image-to-Image,深度学习,机器学习
正文
1. 任务和思路
给定一个含有某些属性的图像,论文希望训练一个模型,模型可以按照给定的属性值将不同程度的属性结合进给定的样本,生成目标样本,使得目标样本与给定样本相似,但在属性上与给定的属性值具有一致的变化。说的有点绕,上图(原文Fig1)就明白了,从左到右逐渐变化。
怎么搞定这个任务,把代表图像内容和属性变化的特征解耦,就是说属性变化的时候不影响上面关于图像内容的特征。解耦的过程可以使用编码器来实现,但是要求解耦出来的图像内容特征
不受到属性特征
变化的影响,这一点可以借助GAN的思想来完成,让判别器仅有
的信息下无法判断出
来实现。一句话概括:在与属性无关的特征上完成对抗。
2. 模型
模型如图(原文Fig2),包含3个部件:编码器En,解码器De,判别器Di。En负责从样本
编码出与属性特征
无关的内容特征
;De负责根据En生成的
和真实的
重构出原来的样本
;Di从En生成的
判断出属性
。整个模型可以看做是AE和GAN的结合体,上面那一行构成GAN,En是生成器,Di是判别器;粉色的背景部分是一个AE。
3. 目标函数和训练过程
总的目标函数如下:
这里的损失函数如下:
上面的目标函数还有个判别器的
要解决,因此实际是和GAN一样交替训练,判别器损失项如下:
4. 实验
(1)同一张脸对应不同属性(原文Fig3):
(2)多属性插值(原文Fig4):
(3)花的数据集上颜色变化(原文Fig5):
参考资料
[1] Lample, Guillaume, et al. "Fader networks: Manipulating images by sliding attributes." Advances in Neural Information Processing Systems. 2017.