3 月 9 日,马云在阿里巴巴技术峰会上,首次重磅推出了阿里 “NASA” 计划,这非同一般的具有太空感的名字,连同马云点名的五大核心技术,一石激起千层浪,引发人们的无限猜想。
阿里采用 “NASA” 这个名称的用意何在?阿里要针对五大技术建立新的独立研发团队,这会对行业形成什么样的影响?阿里反复强调的 “核心技术” 是在释放什么信号?雷锋网 AI 科技评论本文要解答这几个问题。
阿里采用 “NASA” 名称,用意何在?
首先我们要明确的是,阿里巴巴是在表达要 “构建世界第五大经济体” 的愿景之下,把即将建立的新研发体系称为 “NASA” 的。马云是这么表述的:
“阿里巴巴未来 20 年的愿景是构建世界第五大经济体,服务全球 20 亿消费者,创造 1 亿就业机会,帮助 1000 万家企业盈利。就像美国航空航天局 NASA 驱动人类科技和生活的极大进步。”
阿里想要成为世界第五大经济体,这不是马云第一次这样说。在今年 2 月,马云在于四川省政府签署战略合作协议的会上,就说了类似的一句话:
“目前我们是世界第 21 大经济体,刚刚好超过阿根廷。希望通过 20 年努力成为世界第 5 大经济体。”
雷锋网获悉,根据阿里巴巴财报显示,在 2016 年财年,阿里巴巴总成交额(GMV)为 4850 亿美元。而 2016 年世界第五大经济体是英国,该国的 GDP 总量为 26498 亿美元。这么算来,阿里对自己的期望值是:20 年内总成交额翻 5 倍。
如果阿里给自己许诺的是这样一个雄心勃勃的未来,那么把即将建立的新研发体系赋予 “NASA” 这样一个大胆的名字,也颇为合理了。
NASA 原本是美国太空总署的英文简称,代表着太空、尖端科技,和人类精神上的英雄主义理想。NASA 虽然探索者宇宙的奥秘,但这个机构所产生的尖端技术,随时在对整个社会产生巨大的普惠价值。
1970 年,NASA 的火箭科学家 Ernst Stuhlinger 博士就曾在一封回复 MaryJucunda 修女的信中谈及 NASA 推进整个社会技术进步的价值,他说道:
“每年大约有 1000 个从太空项目中产生的新技术被用于日常生活,厨具、农具、缝纫机、收音机、轮船、飞机、天气预报…… 乃至你我身边的各种小玩意儿。这些技术为我们的生活带来了巨大的改变。”
而阿里使用了 “NASA” 这么名字,意在强调阿里 “NASA” 将会对整个社会产生普遍的技术贡献,同时也想借助全社会的力量,来促进技术的整体进步。
马云说道:
“以前我们的技术是跟着业务走,是兵工厂模式,但手榴弹造得再好,也造不出导弹来。我们必须思考建立导弹的机制,成立新技术研发体系,聚焦到几个核心领域的研究。这些研究的目标是为了解决 10 年 20 年后的困难。”
阿里巴巴是一家商业基因很强的公司,其人工智能技术往往是跟着业务线走的。知乎上 “在阿里做机器学习是一种怎样的体验?” 的提问下面,几位在阿里从事 AI 研究的人的回答,都往往指向一个同样的观点:业务导向严重。这样固然能直接为阿里巴巴产生巨大的业务价值,但容易让阿里困囿于已有的商业光环里,也失去了发现新的价值增长点的机会。建造导弹是举全国之力才能办成的事情,阿里 “导弹机制” 意在转变已有的分部、小团队的打法,转向 “集中精力干大事”。
对于 AI,“NASA” 下一步要干什么?
被马云点名的五大技术:机器学习、芯片、IoT、操作系统和生物识别,这其中与人工智能最相关的就是机器学习、生物识别和芯片。在谈阿里对这几大技术的未来部署时,必须结合阿里已有的技术积累来谈。
以一种底层的眼光看待 “机器学习”
机器学习是任何做人工智能的公司要掌握的最基础的技术。阿里在这一领域投入颇多,并且已经推出产品,比如人工智能 ET、电商大脑、阿里小蜜和蚂蚁金服智能客服等。
而如今火热的深度学习技术只是机器学习中的一种方法,在当前的计算资源下产生了很好的效果。南京大学周志华教授曾提到一个非常重要的观察:如果我们把神经网络每次热潮期往前推 5-10 年,你会发现那时计算机硬件设备上有比较大的改变,他表示:“今后进一步发展的技术未必一定是深度学习,但一定是能够有效利用现代计算资源的技术”。而阿里巴巴显然也十分关注下一代最具颠覆潜力的 “计算资源技术”-- 量子计算机。
量子计算机是一种遵循量子力学规律,进行高速运算、存储及处理量子信息的物理装置,其运行的是量子算法,处理速度惊人,比传统计算机快数十亿倍。
阿里巴巴在列举自己过去 10 年来的 “十宗最” 技术成就的时候,特地将 “量子计算与通信” 摆在了第四名,摆在了其 “VR 技术” 和 “生物识别” 技术前面,可见其重视程度。2015 年 7 月,阿里巴巴与中国科学院成立了一个量子计算实验室,并且 2017 年阿里云正式开放了 “云上量子安全加密数据传输服务”。该实验室还计划,到 2025 年,量子模拟将达到当今世界最快的超级计算机的水平。
目前从事量子计算还有很多大公司,IBM、微软、谷歌都对量子计算展开了研究。谷歌与 NASA 联合成立了量子人工智能实验室(QuAIL),加拿大 D-Wave 公司已经在出售退火量子计算机。可以说,阿里是在以一种长期和底层的眼光在看待机器学习技术。
阿里既有业务场景作为试验田,输出生物识别技术并非不可能
“生物识别” 这一技术含义非常广泛,既包含我们平常熟知的人脸识别、活体检测,也包括声纹识别、指纹识别、虹膜识别等等。315 晚会上展示的只是人脸识别技术的一部分。实际上,新技术领域的漏洞攻防战一直都在上演,央视展示的攻破技术在业界也并非新鲜事物。所以,相关技术在实际应用中会使用 “交叉验证”,比如同时让用户输入密码,或同时进行指纹、声纹验证。
阿里的人脸支付技术入选了《MIT 科技评论》2017 十大突破技术榜单。同一上榜的还有旷视科技和百度。之前,在 2015 年 3 月份德国汉诺威博览会现场,马云使用支付宝的 “刷脸支付” 震撼全场,但当时给支付宝提供此项技术的并非是阿里自身的研发团队,而是旷视科技。然而到今年,阿里巴巴也在 “人脸支付” 也在这一技术上位列榜单,说明阿里在这一领域的技术积累已经相当可观了。
目前在阿里云上,已经提供了人脸识别服务,据介绍,“阿里云人脸服务由阿里巴巴图像算法团队自主研发,其中识别模块在 LFW 上取得了 99.48% 的准确率。我们的目标不仅仅局限于在 LFW 上获得良好的指标,而且致力于应用人脸识别技术去解决社交网络和互联网应用中的实际问题”。目前,阿里云已经有五款相关应用在数据市场上公测,包括:人脸关键点提取、人脸年龄识别、人脸特征提取和人脸性别识别。
另外华先胜博士领导的阿里云视觉计算团队一直致力于将相关技术应用于各种场景。比如,用来城市交通领域监测人流、拍立淘里的 “以图搜图”、虚拟试衣等等。
蚂蚁金服和天猫业务里包含的丰富应用场景,是阿里生物识别技术最好的试验田,将其中的一些应用打造成标杆产品,并将这一技术对外推广和出售,并非不可能。
芯片:提供底层的芯片架构和计算力
结合阿里已有的业务线来看,阿里不太可能要重新造轮子,自己去做芯片硬件。
目前阿里跟芯片比较相关的消息就是在 2016 年底投资了软件定义网络(SDN)芯片公司 Barefoot Networks,同时参投的还有腾讯。Barefoot 开发了世界上第一个 SDN 芯片,这种名为 Tofino 的芯片比现在市场上任何其他芯片都快,以 6.5Tb/s 的速度处理网络数据包。Barefoot 成立于 2013 年,3 年的融资总额达到 1.55 亿美元,曾参投的公司还包括高盛和谷歌。
另一个在芯片方面还存在有所突破的领域,最有可能就是人工智能专用芯片,而阿里想要从事的领域,可能还是结合阿里云已有的优势,在给开发者和企业提供底层的芯片架构和计算能力。
而阿里已经在这方面有所行动。1 月 21 日,阿里云发布异构计算解决方案:弹性 GPU 实例和 FPGA 解决方案。GPU 的解决方案比较擅长做 AI 领域的模型训练,能够达到非常高的计算能力,而 FPGA 的解决方案比较适合做 AI 领域的在线的预测 / 分类,能够达到非常高的吞吐量和非常低的延迟。
在云上提供深度学习计算解决方案并非一件简单的事情,世界范围内能够提供这种服务的厂商屈指可数,可借鉴的经验不多,无论是阿里还是其它云服务厂商,如果想在这一领域有所成就,必须要自己在基础研发上攻克诸多困难。
以上都指向 “NASA” 的终极目标:2B 技术输出
2016 年财年,阿里云的营收为 30.19 亿元,占阿里巴巴总营收的 2%。虽然占比不是很高,但这一业务的增长速度却十分惊人,2016 年营收比 2015 年增加了 75%。
在很多人看来,阿里巴巴与亚马逊有着很多相似之处,同是电商起家,同是云计算服务商的领头羊。亚马逊从 2006 年推出 AWS,从零发展到占集团营业利润的四分之三,去年销售额达到 110 亿美元。凭借云计算亮眼业务,很多人都不再把亚马逊单纯看做为 “电商” 公司了。
而阿里一直就想要摆脱外界对其 “电商” 的定义,在 2016 年 10 月杭州云栖大会上,马云就曾提出淡化阿里 “电子商务” 的属性。这次技术峰会上,阿里巴巴集团首席技术官张建锋强调的 “阿里巴巴的商业做得太成功,掩盖了技术的光芒”,也意图转变阿里电商形象,使其转变为一家更加具有 “技术范儿” 的公司。
阿里重磅推出自己的 “十宗最” 技术,并不仅仅是在公关上秀肌肉而已,我们有理由相信,阿里云所呈现出来的新的增长点,带给了阿里巴巴一些新的思路,那就是走 “技术输出” 这条路。所谓的 “十宗最” 技术上的秀肌肉和集中力量建 “NASA”,就是在为 2B 业务振臂呐喊。
而阿里巴巴目前已经在 2B 这条道路上越走越远,阿里 ET 就是一个典型。2016 年 10 月杭州云栖大会上,阿里就推出了覆盖整个杭州市的 “城市大脑项目”。阿里能够做这么大量级的事情,离不开阿里云的强大算力。在后续 2016 年 12 月深圳的云栖大会上,阿里云人工智能科学家闵万里就详细谈到了 ET 要布局的 9 个城市板块:
治理城市:智能交通、智能物流、智能水利、城市规划
赋能企业:智能制造、智能服务
服务市民:智能旅游、智能医疗、智能停车
闵万里在接受媒体采访时就曾谈到阿里做城市大脑的初衷:“事后诸葛亮的分析大家都可以做,但是在线的实时分析,却需要海量数据的处理能力和计算能力,而在没有云计算的时候这是不可想象的一件事情,但是在今天,这个已经成为现实,因为类似阿里云这样的云计算大头已经起来,所以云计算的出现使得大数据的分析变成实时在线可能,城市大脑也就自然而然地出来了。”
不仅是市政交通,以 9 大板块里的 “智能制造” 为例,阿里似乎对 AI 应用于传统行业兴趣颇丰。在今年年初,阿里与江苏的协鑫光伏(全球最大的光伏切片企业)合作,用 AI 技术,实时在线分析整个生产线的节点和参数,及时发现异常,并实时反馈控制这个生产线。这使得协鑫光伏的良品率提升,节省了几亿的成本。而这不是阿里与传统行业合作的偶然案例,实际上,他们正在追求一种 “行业辐射” 效应。闵万里就曾在采访中表达了一种以信息流来理解传统制造业的观点:
“协鑫的这个案例其实他代表的是一类看上去非常传统的制造业,尤其是流程制造业,包括半导体流片、印染企业、钢铁都是流程制造企业,他们都可以抽象为一种信息流,有不同的节点。从海量的历史数据当中,去发觉在这个信息流当中最关键的节点,以及每一个关键节点里面最优的参数控制,所以协鑫的这个实践其实是具有很强的行业辐射性。”
这是一场 AI 应用的启蒙工作
可以说,阿里正在以一种新的姿态,对传统制造行业进行 AI 应用的启蒙工作,而 NASA 的建立,或许就是为全面的 2B 技术输出做好准备。
AI 市场还远未达到你死我活的境地。相反,这是一块未被开垦的未来市场。我们看到甚至 315 晚会在质疑人脸识别技术的可靠性,可见 AI 公司对于市场的教育之路任重道远。而阿里通过建立 “NASA” 进行全面核心技术的整合,推进 AI 相关技术的应用普及,或许对于其它 AI 初创公司来说并非一件坏事。毕竟,有更加有力的盟友为 AI 应用背书,可以加速传统行业客户和公众对 AI 应用的认可。
阿里要撕掉身上的 “电商” 标签了,你准备好迎接这个卖 “技术” 的阿里了吗?