腾讯AI Lab科学家内部讲座：技术将如何变革传媒业

清元宇宙 · 公众号 · 舆情 · 2017-12-26 18:37

正文

本文经全媒派（quanmeipai）授权转载

主题为“多媒体AI：技术实现和行业影响”，请来的主讲嘉宾是腾讯AI Lab计算机视觉中心负责人刘威博士，同时我们还请来了腾讯新闻OMG资讯运营部副总经理王永治老师，担任对话嘉宾，与刘威博士围绕AI与传媒业展开一系列探讨。

腾讯在多媒体AI方面的探索已覆盖图像和视频的处理、识别、理解等多个领域，而AI具体对内容产品产生了何种影响，未来又会向什么方向发展？这场讲座能够揭示一些答案。仅限于腾讯内部的高峰对话，清博为你揭秘。

“打造机器之眼”

刘威博士与腾讯AI Lab

腾讯AI Lab成立于2016年，专注于机器学习、计算机视觉、语音识别、自然语言处理等人工智能基础研究，同时在内容、社交、游戏和平台工具型AI四个方面进行研发与应用合作。

而本次主讲嘉宾，担任腾讯AI Lab计算机视觉中心负责人、负责图像视频数据相关AI研究的刘威博士，是世界计算机视觉方向的领军人物之一。在之前“2017腾讯媒体+峰会”中，他也带来了专业而精彩的分享，从计算机视觉方向，来拆解人工智能重塑的资讯星球新版图。

始终站在行业前沿的“打造机器之眼”的科学家，在讲座中都提出了哪些洞见？

十八般武艺，玩转计算机视觉

在会上，刘威博士大方分享了团队正在进行的各项“黑科技”研发。从图片到视频，从人像到环境，AI Lab在计算机视觉领域已经创造出亮眼的成绩，未来在这里，触手可及。

人脸超分辨率&跨年龄识别

AI Lab最近成功研发的人脸超分辨率项目，可以将人脸长度、宽度成倍数放大，提升分辨率。“例如一张人脸本来是80*20的分辨率，我们把80和20各放大8倍，20放大到160，80放大到640。”从技术层面来说，已经完全可以保证放大得出的人脸图像可以满足感观需求。

人脸检测

通过构建全新的安防网络，图像中非常小的脸都可以检测出来。该技术的应用，可以极大地发挥出人脸检测的功能，目前已接入腾讯互联网+公共服务平台等多个应用场景，每日技术调用量超六亿次，未来有望更广泛应用到政务、金融、安防等多个领域。结合人脸超分辨率，我们可以把检测的人脸进一步放大，后续使用人工或者机器算法进行后续的辨别。

#人脸检测视频

而对于不同年龄阶段的同一个人，AI Lab构建的新的深度网络也可以将其识别出来。在现场，刘威博士分享了一段哈利波特电影的集锦视频，对于不同年龄段的同一演员，跨年龄识别技术展现出了强大的实力。

#哈利波特电影集锦视频

图像描述生成

图片如何产生文字以描述其所代表的语义内容？AI Lab大开脑洞，将这一图像到文本的转换做得高端又有趣。团队即将推出“把照片唱给你听”活动，结合了图像描述生成技术（image captioning）和文本转语音（text to speech）的AI技术。用户上传照片，AI会识别照片内容、生成相关的文字描述并匹配歌词，再通过合成语音配合旋律唱出来。

#“把照片唱给你听”

肢体动作追踪技术

近日，手机QQ正式上线了“高能舞室”功能，让一批舞痴大呼超过瘾。而在这背后，就是AI Lab提供支持的肢体动作追踪技术。

当用户使用跳舞功能时，系统会给出一个指定的姿势。此时AI Lab构建的深度网络可以基于用户照片估计出人体22个关键点的信息。通过实时的人体关键点的检测，计算人体动作，进而判断人体动作与系统预先设定的动作的匹配度，输出分数。