来源:微软研究院AI头条
新智元获授权转载
“全球有一半的人正在用Pokemon GO抓精灵,另一半的人则在用Prisma修图。” 去年,艺术画风格的图片处理工具Prisma风靡全球的社交网络,人们可以通过应用让普通的生活照片变身大师级风格图片。随着社会发展和生活水平的提高,普罗大众对艺术的追求也越来越高。
就在近期,盛产“黑科技”的微软亚洲研究院在提高人民群众艺术水平方面取得了新的研究进展。今天,我们就和大家分享三个关于图片和视频的高科技新玩法。(没错,直播时代视频的处理必不可少!)
首先,简单介绍一下“照片-风格”方面的技术革新。这是由微软亚洲研究院视觉计算组发明的一种新的前馈网络,可以同时学习多种艺术风格,而训练和运行时间也都有很大的提升。因此,该技术使得多种艺术效果在运用方面能够非常的灵活,它可以做到快速训练 (可以将一种效果的训练时间从4-5小时减少到10分钟以内)、快速调整用户想要的效果图,实现多种风格间的融合。不仅如此,该技术还可以做到对图片的某一部分进行风格提取,再融合到目标图片上。而这项工作已经被今年的CVPR接收。
话不多说,先放点图来感受一下神奇的效果~
从上图可以看出,计算机通过学习第二幅图的特征,对第一幅图进行了编辑,轻松实现了不同艺术风格之间的融合和过渡切换。
还可以将不同的图片区域渲染成不同的风格效果,再进行融合。
接下来是另一种玩法。
大家先来猜猜下面哪张是原图,哪张是合成的?
那么,下面这两张中哪一张是合成的呢?
(请不要拿两组原图来糊弄读者啊!)
大家都知道,Prisma主要是内容和风格的合成。但是微软亚洲研究院的研究员则更进一步,将图像识别转换的能力进行了增强。上图中,图二和图三是原图,而图一和图四则是图二和图三互为风格样本的合成图片。这项研究工作也已被今年的SIGGRAPH接收。该项研究的核心难点即两张输入图片之间的匹配问题,具体来说就是语义级别的匹配 (比如眼睛到眼睛,嘴巴到嘴巴),难度颇大。
微软亚洲研究院的研究员们将风格转移问题转化为图像类别问题,并提出了Deep PatchMatch算法来查找图片中所有像素的对应关系(dense correspondence)。该方法将利用CNN中表现较好的属性,如内容和细节的分解、深层特征(deep feature),更好地表达两张纹理、颜色、风格差别很大的图片之间的匹配问题,并且通过一个从粗至细的方式获得全局最优解。
换句话说,我们做到了下面三种形式的图片转化:
•风格-风格
(双向的!双向的!双向的!重要的事情说三遍……)