专栏名称: 脑极体
你的困惑,来自于无路贴近未知。我们在技术、思想、传播的异界,贩来极限脑量下的TMT。
目录
相关文章推荐
云南省商务厅  ·  外贸促进信息 | 第二十期《重点贸易促进活动》 ·  17 小时前  
云南省商务厅  ·  外贸促进信息 | 第二十期《重点贸易促进活动》 ·  17 小时前  
四川商务  ·  市州观察 | ... ·  昨天  
51好读  ›  专栏  ›  脑极体

从一个“换脸”魔法开始,让我们走近优酷AI魔法学院

脑极体  · 公众号  ·  · 2018-10-30 17:35

正文

利用AI完成视频换脸,曾经在去年底引起过全球科技媒体的广泛讨论。时至如今,普通人是否能够玩一下这个有点“科幻”味道的技术呢?

刚刚一条微博引起了办公室的注意。情况是这样的,正当我春困秋乏地琢磨着工作,突然我一位身为居老师迷妹的同事尖叫了起来。整个让全办公室瞬间清爽的分贝,引发了我的好奇,原来她在看一条长这样的微博:



本着对AI换脸的关注,我在居老师粉丝们的热烈讨论背景音中,研究了一下这个优酷提供的换脸玩法。发现值得一聊的技术因素还真是挺多。

我相信大家都会认同这样一个逻辑:当你看到一个技术驾轻就熟的时候,背后其实有千万个技术支撑着它。而从换脸这件事中,我们或许也有机会一窥优酷这样的视频平台,是如何部署、研发和应用AI技术,打造用户体验升级的。

看过《哈利波特》的小伙伴都知道,一个咒语背后,是一个巫师的法力,再背后是一个魔法学院的教育。而AI也是如此,我们看到了一个AI玩法,背后可能隐藏着整个技术实体和无数工程师、科学家的辛勤努力。优酷的换脸魔法恰好可以看做这样一个入口,让我们可以窥视背后的那个视频魔法王国。

当然了,首先让我们先从这个引发无数尖叫的“换脸跟居老师组CP”到底是怎么实现的说起。


咒语显灵:

想跟爱豆组CP,一秒就够了


研究了一下我们发现,视频大换脸是优酷为了今年双11打造的一个互动玩法。


进入优酷搜“换脸”关键词,就会跳转到这样的画面。



用户只要输入一张正面照,就可以轻松完成视频换脸。把一段视频中的主角换成自己,跟爱豆组CP,参与热门综艺,变身丞相骂王朗,都不是问题。

其中有一些选项,简直对粉丝是大杀器啊。比如:



请迷妹们暂时收起口水,咱们先正经起来,看看这个玩法为什么受欢迎,尤其是它的技术突破在哪里。

显然,我们可以看到的是,相比纯技术平台的换脸服务,优酷提供了一项普通用户不需要任何技术门槛就可以尝鲜的换脸。也就是说,普通用户心水了很久的把男/女主角换成自己的心愿终于达成,可以跟爱豆直接生成视频CP,代入感极强。

值得注意的是,观看优酷生成的换脸视频,很容易发现两件事:


1. 效果精准逼真,对人脸的捕捉和还原非常自然。不会出现五官僵硬,或者跳帧的情况。这是很多复杂的换脸程序做不到的。


2. 精准的体验建立在简单的数据输入基础上。优酷的换脸玩法,操作非常简单,只需要一张照片就可以完成换脸。要知道,正常的换脸程序是需要用户上传前后左右各种照片的,普通用户甚至根本没有那么多角度的照片。

要做到这些,其实并没有那么容易,背后隐藏着优酷在AI技术上的充沛积累。


魔杖中的秘密:

换脸术背后的优酷AI秘籍


神奇换脸术的背后,是一大堆技术难题等待解决,比如视频是立体多角度的,那么用户上传的照片没有这些角度怎么办?比如每个人的五官和脸型都不同,如何保证替换精度?这些难关的攻破,隐含着优酷整体上的AI技术高度。



比如我们可以从这几个技术逻辑,看待换脸魔法背后,优酷在AI领域的积累。

1. 海量数据训练,磨炼出的小数据学习能力。


大部分换脸系统,都需要用户上传大量图片,并对肤色、光线环境等有苛刻要求,优酷可以用一张图片完成换脸,秘诀在于背后海量的人脸数据学习,已经让系统达成了通用人脸能力。而这直接体现出的,就是优酷作为积累海量内容的视频平台,在AI三要素中的数据积累上达成的高度。之前很热门的优酷吻戏鉴定师话题,侧面折射出优酷的训练数据量之庞大,以及对数据深度挖掘的意愿与能力,这些数据能力,正在转化成优酷的AI优势。



2. 面部动作捕捉精准算法。


换脸玩法当中,优酷的算法模型不只是对五官进行标注,而且对包括颧骨、下颚等36个标注点进行标注。这意味算法模型在人脸识别、图像分割、动作捕捉等领域的精准能力。AI是算法精度打天下,显然优酷在换脸上也展示了算法研发能力的优势。



3.相对高鲁棒性的人脸融合。


换脸的一大问题,在于用户上传照片,可能在光源、颜色、光影等方面与原视频不同,从而可能产生贴合度等问题。从优酷的换脸效果看,其算法本身的鲁棒系数较优,而这也是更多AI视频应用落地的先决条件。

看似简单的换脸背后,实际隐藏着优酷在AI世界中的三张王牌。如果向更上一层看去,会发现AI技术正在带给优酷全方位的能力加持。对于AI能力的搞研发力与高应用度,正在流媒体行业中等待发挥重要作用。


悄悄打开的魔法学院大门:

AI正在成为文娱新引擎


从优酷接连抛出的AI技术惊喜,我们已经可以看出优酷在AI技术上的追求。这些高水准的AI技术能力,又与其他AI技术体系联合在一起,构成了今天我们在视频平台追片时,可能体验到的各种AI应用。







请到「今天看啥」查看全文