如今,我们凝视镜头的一秒钟,已经可以承载超越自拍的更大意义——登陆账户,支付购买,实名认证,领取养老金,办理贷款……从实验室到落地,这一秒钟的凝视背后有一个漫长的开发过程,其中蕴含着社会变化、人性探索、自我认知过程。这是一个不为人所知的故事。
文|尤尔敏
编辑|金焰
北京中关村一家科技公司最近来了一位新员工,身高一米四五,体重80公斤,又矮又胖没房没车,却一入职就成了办公室最受追捧的明星,因为这位同事拥有一项独门技能——看人脸色。
只要有人从它面前走过,不管是化着浓妆的漂亮姑娘,还是长相一样的同卵多胞胎,它都能迅速而准确地做出判断,识别出身份,准确率超过99.99%。
它是一个机器人,名叫蚂蚁佐罗,英文名ZOLOZ。它和它的「东家」,蚂蚁金服旗下全球可信身份平台ZOLOZ同名。它身上搭载着各种金融级生物识别技术,为我们解决「你是谁」的身份识别问题。它身上最前沿的技术是眼纹识别,11月17日CCTV1「机智过人」节目上,佐罗同学在数秒内就识别出一对同卵四胞胎,这意味着识别长相高度相似的人的世界难题首次被攻破。
在节目中,蚂蚁佐罗先是一一看了四兄弟扮鬼脸的照片,再一一看了真人,几秒钟后就给出了四兄弟的正确排序。
佐罗有120多位同事,来自世界十几个国家,分布在北京、杭州、美国堪萨斯三地办公。这个中国科技公司中最为全球化的团队,正在推动一个名副其实「看脸时代」的到来。
如今,我们凝视镜头的一秒钟,已经可以承载超越自拍的更大意义——登陆账户,支付购买,实名认证,领取养老金,办理贷款……从实验室到落地,这一秒钟的凝视背后有一个漫长的开发过程,其中蕴含着社会变化、人性探索、自我认知过程。这是一个不为人所知的故事。
识别同卵多胞胎,很轻松
陈继东是ZOLOZ中国总经理。因为工作的缘故,他经常接到科技展会的邀请电话,「我们要搞一个酷炫的展会,你们来吧!」
这大概是大部分人对于这项技术的第一印象。2015年3月,阿里巴巴集团董事局主席马云受邀参加德国汉诺威消费电子、信息及通信博览会,在开幕式上,他现场演示了当时还是DEMO的刷脸支付:不用输入支付密码,直接对着屏幕,让机器识别到自己的脸,就为嘉宾从淘宝网上买到了1948年的汉诺威纪念邮票。
但每次接到这样的邀请电话,陈继东还都会认真地补充一句,纠正对方,「我们不是为了酷炫才做这件事情的,真的不是。」
生物识别技术的应用来自实际交易过程中亟待解决的迫切问题。陈继东介绍说,之前他在负责蚂蚁金服风险控制工作,就意识到了生物识别技术的迫切性。「风控的一个核心是做身份验证,识别你是谁,识别你是你,来验证这次交易。」
在这个员工来自全球十几个国家的团队,英语流利是最基本的技能。
最开始的时候,团队尝试过各种生物识别的可能方案——人脸、指纹、声纹、掌纹、笔迹,还有虹膜。最后发现,人脸识别是最合适的,因为它足够权威,所有国家认可的证件上都会有人脸这个特征,安全等级比较高,而且它是非接触式的,只要拍照就能获得,不像是指纹还需要接触设备。2015年底,支付宝9.0上线人脸识别,用户可以通过刷脸登陆支付宝。
尽管准确率达到了99.6%,但人脸识别的短板——识别多胞胎,尤其是极端相似的同卵多胞胎——始终没能很好解决。最新推出的苹果FaceID,也明确提示那些多胞胎用户,请改使用密码。
这是Reza Derakhshani加盟ZOLOZ的原因。这位前美国密苏里大学堪萨斯分校教授是眼纹识别技术的发明者。早在攻读博士学位的时候,他就因为提出活体指纹识别技术而出名,登上了生物领域最权威科学杂志的头条新闻,而他之后的研究让他发现了一项未被人知晓的秘密——眼纹。
ZOLOZ科学家、眼纹识别发明者Reza提交论文后,收到的修改意见只有「改一下几个符号错误」,这意味着,在他之前,眼纹识别在业内是一片空白。
它识别的是人眼白的血管排布,这是人类唯一性的生物特征,即便是同卵多胞胎也不一样,且终身不变。并且,识别眼纹的准确率堪比虹膜,但是它要比虹膜识别容易得多。识别眼白只需要一台相机,识别虹膜可就得动用红外线了。
参与眼纹研发的李亮是ZOLOZ资深算法专家,他对这一还处于实验室阶段的前沿技术充满期待, 「我们希望它未来能做一些有社会价值的事情,比如帮助寻找走失儿童,尤其是走失多年的儿童。11岁以前的小朋友面貌变化很大,人脸识别往往很难识别长大后的他们,但是他们的眼纹是不会变的。」
「让用户零付出」,技术才能真正实现
每隔一段时间,分布在北京、杭州、美国堪萨斯三地工作的团队成员就要聚在一起,当面讨论技术落地的具体问题。他们的讨论会内容五花八门,非常具体,包括如何理解用户、如何提高技术本身安全性,甚至还包括中美不同文化背景的团队成员内部沟通效率问题,「当一个中国同事回答美国同事maybe的时候,他指的是他办得成,还是办不成?」
讨论之所以要这样事无巨细,是因为决定技术落地成败的恰恰正是细节。一旦走出实验室,所有想象中的美好都会被现实击败。
中美团队会不定期聚在一起,举办各种outing,图中右二是ZOLOZ中国总经理陈继东,在他左边,是ZOLOZCEO Toby。
陈继东说,人脸识别产品成型后,他们会拿去让其他部门同事试用。其中一位同事是个老花眼。他拿起手机,习惯性地举得老远,眯起眼睛看镜头,这显然无法获取足够量的眼白信息。最后,那位同事和手机尴尬地僵持了15秒后,刷脸失败。
林述民是负责人脸识别在中国市场落地的产品负责人,他曾经把失败反馈挨个查了一遍。不同手机的前置摄像头拍摄效果千差万别,拍摄地点的光照角度也差异巨大,就连说中国话都变成了一件令人费解的事情。当手机指示「摇头」,有的人疯狂摇头,速度快到无法取样;有的人把脸摇到一边以后就不转回来了,刷脸失败。
动作修改为「眨眼」后,陈继东在聚会拉着朋友试用,偏偏他的朋友眼睛小,因此眨眼的幅度很小,加上盯着镜头紧张地飞快眨眼,机器很难识别出眨眼的动作,陈继东只能眼睁睁看着他又一次失败。
负责海外产品推广的陶冶也遇到同样的困难。在实验室一切顺利,但在现实中打开手机,识别页面永远过不去——因为印度网速太慢了。
就连主要负责技术的李亮,都在这些细节面前败下阵来。在技术世界,他解决过一个个难题,但现实摆在他面前的是完全没想到的困难。浓密的假睫毛,遮黑眼圈的黑框眼镜,覆盖全脸的面膜,都是严重影响识别通过率的因素。它们对于女人是变美利器,但对机器而言是过于强烈的面部特征,很难学会区分。只有调取大量黑框眼镜照片,训练机器反复识别它们。很长一段时间里,这个团队的成员看到带黑框眼镜的人就头疼。即便现在接受采访,李亮还在一个劲儿追问,「戴美瞳的人多吗?为什么要戴美瞳啊?为什么啊?」
人脸识别技术落地遭遇了这么多现实困境,更不要说还处于实验室发现阶段的眼纹识别技术了。如果想要实现金融级别的生物识别,他们必须要想办法解决这些问题。
得到现实中的挫败反馈后,陈继东和他的技术团队重新修正了自己的设计。不再要求瞪大眼睛,也不再要求用户摇头、点头,原则上「让用户零付出」,技术才能真正实现。
ZOLOZ上下左右都是对称的,陈继东说,这个LOGO隐含的意思是「无论你是在线或是离线,数字世界还是物理世界,都是唯一的你。」
「一个技术从(实验室)出现到(落地)应用,要考虑非常非常多的细节。特别是做产品的时候,就得揣摩人们的内心。」林述民说,从技术上来讲,机器只要获得足够信息量的图片就行了,但是在实际操作中,用户会觉得,自己的脸占满整个屏幕「太丑了」,所以传往后台的图片保存原样,但呈现在屏幕上的图像要缩小,「脸越小越好看」。
「我们整个团队都是产品意识很强的,就是要从用户角度出发,然后来设计这个产品,而不是从技术角度出发。我觉得这是我们跟其他团队最大的差异。没有范例可以遵循的,没有人做出来的,全靠自己去摸索。」他说。
对于更前沿的眼纹识别技术,这个团队也进行了针对现实场景的取样优化。Reza发现,眼球上的血管并不是只存在于眼白上,密密麻麻的血管纹路从眼白上延伸到上下眼睑,而这些纹路分布方式也是独一无二的。上眼睑因为眨眼一直动,不容易收集,但是下眼睑保持了足够的稳定。既然眼白处的纹路不容易采集,那不妨再加上下眼睑处的纹路,从而保证足够的准确度。
「在上亿级的APP上面,让每个人都能用到,而且能够好用,这中间其实经历了好几个阶段,这不是说一个算法就能解决的问题,所以过去两年,我觉得这个团队最成功的一点,就是把一个比较前沿的实验室的算法能够落地到一个人人都能用,而且用的还挺好。」陈继东说。
正在变成现实的科幻梦
如果一切进展顺利,在未来十年,生物识别技术将在更多国家落地,世界上将有20亿人用上它,改变生活习惯,开始「刷脸」。这个听上去像科幻小说情节的技术正在变成现实。
眼下,ZOLOZ的生物识别技术,服务着超过两亿的支付宝用户,人们在手机上刷刷脸就能做公积金查询、养老金领取认证。在线下,「靠脸吃饭」、「靠脸办理酒店入住」、「靠脸取快递」也逐步进入我们的视野。 Kpro餐厅开张当天,蚂蚁金服首席技术官程立发表致辞时说,「也许还有人会说,现在的支付方式都还蛮方便的,为什么要用刷脸支付?我们在面对这个问题时,可能会看得比较远,我们服务于当下,也想着眼于未来……过去几十年,互联网是我们生活中的一部分,可也许不用10年,我们将成为互联网的一部分。我们的生物识别技术,正是在为这样的一个未来做技术准备。」
陈继东说,未来五年,人们出门很可能连手机都不带了,吃饭、购物、取快递、进火车站、入住酒店,全靠一张脸就行,「脸就是我们的身份证、钱包」。
2017年10月,全球首个商用落地的刷脸支付在杭州万象城的Kpro餐厅和大家见面。
在家里,陈继东经常拿产品给自己家孩子做测试。「当时他三岁,我就让他去试,看他会不会用。」他的标准是,如果三岁的孩子都能用得非常好,这产品就是真的好。而现在,林述民六岁的女儿已经学会了刷脸登陆。他还乐此不疲地推销给家里亲戚,「你们试试这个吧!这个不用输密码了。」
「他们真的有可能生活在一个再也不需要密码的时代。」林述民说,那是一个更便利的未来。
在陈继东描述里,未来最自然的一种人机交互方式是,短信来了,你看着手机,短信就自动打开了;想解锁屏幕,你看它一眼,就自动解锁了。「你不需要频繁地告诉机器,你是谁,机器始终知道你的身份。」他说,只有在异常或者高风险情况下,才需要重新验证身份。
「我看过很多科幻小说,各种各样的故事。在科幻世界里,超能力同时意味着超级危险。你可以拿它做好事,也可以用它做坏事。新技术也一样,它让我们做到了从来没想过的事,也能成为带给我们伤害的大麻烦。」ZOLOZ CEO Toby Rush说,「我想成为第一个发现『超能力』的英雄,这样我们就能抢先在其他人之前,保护用户,让这项技术只用来做好事,并且阻止坏人作恶。」
为了保证这项技术的安全性,这个全球化团队还在不断改进自己的算法。2016年11月,全球领先的专利多级活体防攻击算法上线,实现了人脸识别金融级的安全性。在识别人脸和眼纹过程中,机器识别的并不是原始图片,而是拍摄的眼纹转换成的数学模型,这串数字只在识别过程中生成,「当你看着镜头,它才会生成,当你不再看着镜头,它就消失了」。而且它经过了加密,传输信息即便被中途截获,看上去也只是一串无意义的代码。
「所有人对新事物都有恐惧感的,但哪怕恐惧,如果这是一种更自然、更安全的方式,我相信人的习惯肯定是会慢慢改变的。就像是指纹识别,刚开始的时候,所有人都在质疑指纹不安全,但你会发现现在用的人越来越多,特别是用指纹支付也越来越多。因为它特别方便,手一按就支付了。」陈继东说,他们的目标就是保证技术的安全性,同时让人们的生活变得更简单。
他们把这个愿望印在了自己团队的T恤上,这也成了这个全球化技术团队的共同信条:「Make Trust Simple(让信任更简单)。」
没看够?
长按二维码关注《人物》微信公号
更多精彩的故事在等着你