专栏名称: jiangweijie1981
目录
相关文章推荐
51好读  ›  专栏  ›  jiangweijie1981

文献阅读·Image-to-image translation with conditiona...

jiangweijie1981  · 简书  ·  · 2020-02-25 18:16

正文

请到「今天看啥」查看全文


简介

Image-to-image translation with conditional adversarial networks.CVPR-2017,Cited-4432.Open source: https://github.com/phillipi/pix2pix ,Star-7.5k.

关键字

GAN,CGAN,图像转换,深度学习,机器学习

正文

(1)任务和思路

本文的主要贡献是利用CGAN实现了一个图到图的转换框架。这个框架是利用两个域之间的样本对进行监督学习的,损失由两部分构成,1)CGAN模型的判别器损失,使用二分类交叉熵来计算;2)图像像素损失,使用 L_1 来计算。

(2)框架和目标函数

框架如图(原文Fig2)所示,基本框架使用CGAN,但与CGAN不同的是:1)C不是类别而是图像;2)没有了噪声输入。

框架.png

总体的目标函数:

G^*=\arg \min_G \max_D L_{cGAN}(G,D)+\lambda L_{L_1}(G)

其中第1项是GAN的损失:

L_{GAN}(G,D)=E_y[\log D(y)]+E_{x,z}[\log(1-D(G(x,z)))]

其中第2项是像素损失:

L_{L_1}(G)=E_{x,y,z}[\mid \mid y-G(x,z) \mid \mid _1]

(3)应用

用两幅图来说明应用,刚好是原文的一头一尾,开篇的图(原文Fig1):

应用1.png

收尾的图(原文Fig10):

应用2.png

参考资料

[1] Isola, Phillip, et al. "Image-to-image translation with conditional adversarial networks." Proceedings of the IEEE conference on computer vision and pattern recognition. 2017.







请到「今天看啥」查看全文