专栏名称: 清元宇宙
中国新媒体大数据权威平台,国内最重要的舆情报告和软件供应商之一,国内制定各类互联网、新媒体、大数据排行榜的权威机构。www.gsdata.cn
目录
相关文章推荐
网络舆情和危机公关  ·  11月的舆情态势分析和研判 ·  1 周前  
人民网舆情数据中心  ·  干部任前公示中,三名专科学历“95后”女干部 ... ·  3 天前  
人民网舆情数据中心  ·  支付宝就出现故障致歉、校方通报网传学生会干部 ... ·  3 天前  
网络舆情和危机公关  ·  两场“集聚”事件的背后真相:社会分拣机制和精 ... ·  5 天前  
人民网舆情数据中心  ·  年轻员工轻生离世,银行回应如何平复舆论猜疑| ... ·  1 周前  
51好读  ›  专栏  ›  清元宇宙

腾讯AI Lab科学家内部讲座:技术将如何变革传媒业

清元宇宙  · 公众号  · 舆情  · 2017-12-26 18:37

正文

本文经全媒派(quanmeipai)授权转载


主题为“多媒体AI:技术实现和行业影响”,请来的主讲嘉宾是腾讯AI Lab计算机视觉中心负责人刘威博士,同时我们还请来了腾讯新闻OMG资讯运营部副总经理王永治老师,担任对话嘉宾,与刘威博士围绕AI与传媒业展开一系列探讨。


腾讯在多媒体AI方面的探索已覆盖图像和视频的处理、识别、理解等多个领域,而AI具体对内容产品产生了何种影响,未来又会向什么方向发展?这场讲座能够揭示一些答案。仅限于腾讯内部的高峰对话,清博为你揭秘。


“打造机器之眼”

刘威博士与腾讯AI Lab


腾讯AI Lab成立于2016年,专注于机器学习、计算机视觉、语音识别、自然语言处理等人工智能基础研究,同时在内容、社交、游戏和平台工具型AI四个方面进行研发与应用合作。



而本次主讲嘉宾,担任腾讯AI Lab计算机视觉中心负责人、负责图像视频数据相关AI研究的刘威博士,是世界计算机视觉方向的领军人物之一。在之前“2017腾讯媒体+峰会”中,他也带来了专业而精彩的分享,从计算机视觉方向,来拆解人工智能重塑的资讯星球新版图。



始终站在行业前沿的“打造机器之眼”的科学家,在讲座中都提出了哪些洞见?


十八般武艺,玩转计算机视觉


在会上,刘威博士大方分享了团队正在进行的各项“黑科技”研发。从图片到视频,从人像到环境,AI Lab在计算机视觉领域已经创造出亮眼的成绩,未来在这里,触手可及。


人脸超分辨率&跨年龄识别


AI Lab最近成功研发的人脸超分辨率项目,可以将人脸长度、宽度成倍数放大,提升分辨率。“例如一张人脸本来是80*20的分辨率,我们把80和20各放大8倍,20放大到160,80放大到640。”从技术层面来说,已经完全可以保证放大得出的人脸图像可以满足感观需求。


人脸检测


通过构建全新的安防网络,图像中非常小的脸都可以检测出来。该技术的应用,可以极大地发挥出人脸检测的功能,目前已接入腾讯互联网+公共服务平台等多个应用场景,每日技术调用量超六亿次,未来有望更广泛应用到政务、金融、安防等多个领域。结合人脸超分辨率,我们可以把检测的人脸进一步放大,后续使用人工或者机器算法进行后续的辨别。


#人脸检测视频


而对于不同年龄阶段的同一个人,AI Lab构建的新的深度网络也可以将其识别出来。在现场,刘威博士分享了一段哈利波特电影的集锦视频,对于不同年龄段的同一演员,跨年龄识别技术展现出了强大的实力。


#哈利波特电影集锦视频


图像描述生成


图片如何产生文字以描述其所代表的语义内容?AI Lab大开脑洞,将这一图像到文本的转换做得高端又有趣。团队即将推出“把照片唱给你听”活动,结合了图像描述生成技术(image captioning)和文本转语音(text to speech)的AI技术。用户上传照片,AI会识别照片内容、生成相关的文字描述并匹配歌词,再通过合成语音配合旋律唱出来。


#“把照片唱给你听”


肢体动作追踪技术


近日,手机QQ正式上线了“高能舞室”功能,让一批舞痴大呼超过瘾。而在这背后,就是AI Lab提供支持的肢体动作追踪技术。


当用户使用跳舞功能时,系统会给出一个指定的姿势。此时AI Lab构建的深度网络可以基于用户照片估计出人体22个关键点的信息。通过实时的人体关键点的检测,计算人体动作,进而判断人体动作与系统预先设定的动作的匹配度,输出分数。



对话实录

AI将带来何种行业影响


最后一个环节,刘威博士与王永治老师展开一轮对话,以下为部分摘录。


问题一:AI会取代人类编辑吗


王永治老师:第一个问题关于从业者的焦虑,将来AI技术会怎么发展,会不会取代人?


刘威博士:拿照片转化为艺术风格的照片的实践应用举例,新闻报道中可能说,AI会取代画家。但不尽然。刚才展示的几项技术虽然比较成熟,但相比人的视觉神经识别,色彩分布、饱和度等指标还是不太能达到要求。不过,在识别图片并匹配为文字这方面,或是根据文字来匹配插图,AI还是做得比较好的。


王永治老师:图文等常规编辑任务,基本就可以识别(完成)了,可以大大节省编辑的工作量。


刘威博士:机器可以辅助人来完成,但是现阶段还不能完全替代人。



问题二:媒介中的AI技术


王永治老师:之前见过有人评论峰会的机器人写作,说这也不过是语音识别而已。媒体和大众对AI技术、算法大数据等产生的误解,是不是就像我们曾经不懂小提琴,把小提琴叫做拉锯一样?


刘威博士:现阶段,很多技术概念模型是基于深度神经网,可以解决复杂的问题;但如果不应用深度神经网,简易的模型现阶段只能完成一些简单的任务和问题。


王永治老师:可能被炒作得已经不新鲜了,还是要小心被频繁出现的报道误导。


从人脸识别再到面部特效,AI已然在资讯业的各个链条上发挥着不容小觑的作用。技术大潮之下,未来已来。

— [ THE END ] —


清博舆情系统地址(http://yuqing.gsdata.cn)

点击文末“阅读原文”可免费使用清博舆情系统



| 清博报告 |


2016清博微传播 | 微信公号估值测试

微信千强年度报告 |  2017年度清博盛典

  网红产业报告 | 企业新媒体报告

清博指数3.0版 | 清博舆情指数