澎湃新闻记者 张枭翔
2017年1月6日晚间江苏卫视播出的最强大脑第四季中,“小度”首战告捷:在跨年龄人脸识别任务上,以3比2的比分险胜“最强大脑”代表王峰。 视频来源 百度公司(09:56)
谷歌旗下的AlphaGo(阿尔法狗)在围棋赛中横扫中日韩高手斩获60连胜后,百度的人工智能机器人“小度”也在中国版“人机大战”中胜出。
2017年1月6日晚间,江苏卫视播出的节目最强大脑第四季中,“小度”首战告捷:在跨年龄人脸识别任务上,以3:2的比分,险胜“最强大脑”代表王峰。
有人将这场比赛称为 “中国电视史上首次人机对战”的比赛。
对于这场险胜的意义,百度首席科学家吴恩达说,世界顶级的科学家也只能理解人脑运作机制的一部分,百度人工智能算法参考人脑较少,更多基于数据分析和深度学习,“人脸识别,对于哪怕是世界上最先进的AI技术也是非常困难的。”
吴恩达说,对于之前看过的“人机比赛”,人工智能都表现非常出色。是因为大部分项目对人类都是困难的,所以全世界棋类比赛中顶级的选手很少,但是人脸识别能力每个人都具备。“今天的比赛其实是顶级的人脸识别选手,和擅长棋类游戏的人工智能进行比拼,尤其是王峰的名人堂团队。小度跟这样高水准的团队比赛,我认为很公平。”
关于“小度”和AlphaGo的区别,百度深度学习实验室主任林元庆进一步说,百度和谷歌做的方向很不一样,特别是“人机大战”的方向非常不一样,谷歌擅长下棋这一块,百度擅长识别等技术,“去年AlphaGo出来的时候,我们正在投入非常大的力量在无人车上面,百度内部没有做围棋的项目。”
比赛现场
回顾“小度”和王峰的这场对决,按照百度和《最强大脑》节目组的约定,第四季《最强大脑》设置人机对战环节,百度公司将“百度大脑”的人工智能技术植入到机器人“小度”人上,与名人堂选手约战三场,主要在人脸识别、语音识别方面“一决高下”。
据悉,前三场“人机大战”,采用三局两胜制,百度大脑如果在前三场比赛中获胜,将参加角逐最后的脑王争霸。
“小度”和王峰的“决战”分为两轮,第一轮,嘉宾(章子怡)从20张蜜蜂少女队成员童年照中挑出3张高难度照片,选手通过动态录像表演将所选童年照和在场的成年少女向匹配。第二轮,人机共同观察一位30岁以上的观众,随后将他从30张小学集体照中找出。
根据节目组的安排,“小度”和王峰第一轮需要识别两个对象。对第一个对象的识别,王峰和“小度”都答对了。第二个对象的识别,现场出现了一个事先没有想到的“状况”:“小度”为一个对象给出了两个匹配答案,这让现场嘉宾大为困惑。查证后发现,原来是识别对象群组中有一对双胞胎,“小度”经过识别后,给出了72.98%、72.99%两个非常接近的答案。
最后,负责“百度大脑”的百度首席科学家吴恩达,现场选择72.99%的照片,匹配正确。这一环节上,王峰识别错误。第一轮的比赛,小度拿下1分,王峰0分。第二轮比赛,双方都成功识别出照片中的人,均拿下2分。因此,最终小度以3:2的比分拿下了第一场比赛。
百度深度学习实验室主任林元庆坦言,比赛之前,对于让“小度”和《最强大脑》选手“过招”并没有十足的把握,自己当时在节目录制现场很紧张。
据介绍,在录制《最强大脑》节目之前,百度团队进行了两个多月的备战。林元庆称,从2016年国庆开始就没有给自己放过假,一直到节目录制完,加班到凌晨两三点是常有的事,甚至到第二天清晨,“这个(备战的)过程很忐忑,也很兴奋。忐忑的是(怀疑这件)事情能搞定吗?兴奋的是终于有一个机会去看一看我们做了这么多年的人工智能技术,跟人还有多大的差距,或者是已经达到什么样的水平。”
吴恩达还称,这次比赛涉及的人脸识别、语音识别等,对人类来说相对容易,对机器来说是个巨大的挑战。“人们可以通过直觉来进行很好地判断。但是机器必须从大量数据进行训练,有些项目中甚至需要识别不清晰的、老旧的照片。”吴恩达表示。
百度方面进一步表示,人脸识别技术研究的困难,不同于普通的图像识别。就人的脸部特征而言,每个人的脸部结构都是相似的,这对于利用人脸区分人类个体不利,还有一些特殊情况,比如双胞胎甚至多胞胎。其次就是表情、光照条件、整容等外因影响。不同的表情、角度观察,光照条件的影响,人脸遮盖物,如口罩、墨镜、头发、胡须,甚至是整容、P图等行为,都增加了人脸识别的难度。
据悉,百度大脑为了达到与人类相似的水平学习了2亿张图片,主要包括网上公开的人脸照片、视频影像资料、第三方版权购买内容及一些向大众公开征集的人像照片。百度公司宣称,百度大脑看过的这2亿张人脸,相当于中国单身汉的总人口、2/3美国人口(总人口约为3.19亿)。
百度方面还介绍,一般而言,在跨年龄阶段人脸识别中,类内变化通常会大于类间变化,这造成了人脸识别的巨大困难。同时,跨年龄的训练数据难以收集。没有足够多的数据,基于深度学习的神经网络很难学习到跨年龄的类内和类间变化。
据了解,针对跨年龄人脸识别的第一个难点,百度深度学习试验室的人脸团队选择用度量学习的方法。即通过学习一个非线性投影函数,把图像空间投影到特征空间中。在这个特征空间里,跨年龄的同一个人的两张人脸的距离会比不同人的相似年龄的两张人脸的距离要小。针对第二个难点,考虑到跨年龄人脸的稀缺性。百度深度学习试验室用一个用大规模人脸数据训练好的模型作为底座,然后用跨年龄数据对他做更新。这样不容易过拟合。
在1月5日举行的第四季《最强大脑》首场比赛内部看片会上,林元庆透露,截至2016年9月,在人脸识别测试集上,百度已经将错误率降到2.3%。
全球主要人工智能公司研发投入数据
全球AI巨头研发进展情况
百度的人工智能研发团队认为,目前“小度”的水平还有很大的提升空间。
吴恩达表示,“小度”目前不能完全明白人类的思想,要向王峰及名人堂其他顶级大脑学习,更好服务人类。“小度不仅代表百度人工智能,更代表中国。这次人机大战是百度大脑第一次出现在公开场合的比赛。”吴恩达称。
林元庆表示,百度这几年在人工智能上投入了相当的力量做技术研发,“我们想在人比较擅长的领域和人较量一下,到底我们的水平做到什么样了,在这些方面是不是和人接近,还是说有很大的差距。”
林元庆进一步表示,打败人类不是目的,希望我们能演化出很好的技术服务人类。
据林元庆介绍,百度深度学习试验室主要做的三个项目是自动驾驶、人脸识别和增强现实,其中,自动驾驶项目已于2015年独立出去成立了百度自动驾驶事业部。两周之前,增强现实项目也独立出去成立了增强现实实验室。“这两个项目都已经做得非常好,我们觉得应该给它更多的空间发展,从实验室走到现实当中。”林元庆表示。
林元庆还透露了百度人脸人别的三个应用方向,一是以“刷脸”的方式在景区闸机处通行;二是百度金融远程预授信;三是和手机厂商合作将百度人脸识别技术嵌入手机中。
谈及“小度”和谷歌旗下人工智能公司Deepmind开发的人工智能AlphaGo区别时,林元庆表示,AlphaGo是研发了一个非常有效的方法搜索空间。人工智能方面,百度和谷歌做的方向很不一样,特别是“人机大战”的方向非常不一样,谷歌擅长下棋这一块,百度擅长识别等技术。“去年AlphaGo出来的时候,我们正在投入非常大的力量在无人车上面,百度内部没有做围棋的项目。”林元庆表示。
百度的人工智能刚刚又落下一枚“棋子”。1月5日,在2017年国际消费类电子展(CES)上,百度发布了对话式人工智能操作系统DuerOS。同时,还宣布与北京小鱼儿科技有限公司达成深度战略合作,并将于今年春节面向中国市场发售搭载了DuerOS的“小鱼在家”视频对讲机器人。