微软希望通过领先业界的云计算和人工智能服务,普及人工智能全民化,让每个开发者都有机会打造属于自己的人工智能应用。在两年前的Build 2016微软全球开发者大会上,微软首次公布了运行于Azure的
认知服务
,以API的形式为开发者提供触手可及的人工智能。微软在全球推出了覆盖语音、视觉、语言、机器翻译等功能的24项服务,目前已经有超过100万开发者使用认知服务。借助微软认知服务中的微软翻译引擎,小米生态链企业
香蕉出行
推出了
魔芋AI翻译机
,能够提供覆盖全球170多个国家和地区的14种语言的实时语音翻译。
全球最大的电信运营商
中国移动
正在与微软展开合作,将全球排名第一的语音技术应用于全球最大的语音及数据运营环境,实现技术创新到产业应用的落地实践。与中国移动的合作,也证明微软不仅拥有服务全球的人工智能,和最高识别率、准确率、容错率的语音技术,并且已经为服务各行各业的汉语市场做好了完善的工程与商业准备。除了语音识别,中国移动还将在机器翻译等技术上与微软展开更深入的合作,共同打磨产品适配与应用场景。
Azure Batch AI
服务是微软智能云上的一项托管服务,允许数据科学家和人工智能开发者以非常简单的方式利用包括GPU在内的Azure云计算资源对人工智能模型进行训练。数据科学家只需明确任务需求,设定输入、存储、输出等设置,其它所有与基础设施管理、规模缩放、批量工作任务相关的繁杂的后台工作都能由Azure Batch AI自动完成。中国三大电商品牌之一的唯品会,正在积极构建布局全球市场。微软合作伙伴才云科技利用Azure Batch AI服务为唯品会开发了容器化的人工智能解决方案,将其海外业务团队的效率提升了85%,对100万张图片进行分析标签化处理的时间缩短到之前的1%,只需要5分钟,算法模型在深度学习训练上所用的时间也从2个月缩短到了1周,让AI系统迭代的速度获得了极大的提升。
对话式人工智能开启更广阔前景
对话式人工智能正在成为新一代智能应用的核心。现代开发者必须懂得如何打造一个对话机器人,以及如何部署和运行它,因为这是来自客户的呼声——企业迫切需要能够针对销售咨询、人力资源、招聘、客户支持和服务等不同应用场景进行定制、优化和训练的智能业务机器人。
Azure Bot Services
对话机器人服务让开发者和企业能够轻松开发出自己的对话机器人,发布两年来已经有30万开发者采用该服务开发。对话机器人服务能够根据业务需求进行定制,还支持发布到微软小娜(Cortana)上,并能利用简单易用的开发工具为小娜赋予更多业务技能。微软已经与亚马逊合作,将微软小娜结合到Alexa智能音箱中,让用户通过Alexa调用小娜及其背后的人工智能服务。
微软小冰
是面向情商(EQ)维度发展的人工智能系统,已在五个国家落地。今天,微软宣布一项
人工智能内容创造
的全新技能,为每个孩子定制专属于他们的有声童话故事,将于“六一”儿童节正式上线。家长可以设置童话故事的主人公和故事倾向,如更偏教育意义等,然后安排微软小冰完成创作。微软小冰采用专门训练的深度学习模型,能够从故事文本阶段即进行定制化生成,并自动分配声音角色和背景音乐,在短短20秒内即可完成一集约10分钟左右的有声童话故事,语音讲述的质量能达到主流专业人类播音员的水准。该项服务完全免费,微软会持续向订阅家庭每天推送最新作品,让每个家庭的孩子都可以拥有一位专属于自己的故事主播。
目前,微软小冰团队已经进入内容创造领域并开始落地生产,内容涉及歌曲演唱、电台电视台节目、新闻评论、诗歌生成和有声读物等。在有声读物领域,微软已拥有接近4万集有声童话内容。这些有声读物全部由人工智能技术生成,在与人类主播质量相当的前提下,数量足以陪伴一个孩子从2岁到9岁的全部时光。6个月来,这些有声读物已顺利投放到占中国市场90%的儿童早教机、故事机和在线播客平台,播放总时长超过400万小时。
此外,微软还将向合作伙伴和开发者开放“
全双工语音技术(Full Duplex)
”,将“人机交互”进化为能像人类一样自然的“人机交流”,开发者可以使用这项技术打造自己的对话应用。今年四月,微软正式在美国和中国同步宣布了Full Duplex感官,并已完成产品化落地。自2016年8月起,微软(亚洲)互联网工程院通过人类用户主动发起的方式,在明确告知用户小冰并非人类的前提下,已让小冰与人类用户完成了累计超过60万通电话交流。小米生态链企业
亿联客开发的Yeelight语音助手
是全球首个搭载全双工语音交互感官的智能设备,其硬件产品已开始进入千家万户。
开源框架让更多开发者驾驭机器学习
今天人工智能的发展处于一个百家争鸣的发展阶段,开源框架内的人工智能技术发展得尤其活跃。而不断敞开胸怀拥抱开源的微软,也与时俱进地推出了开放人工智能平台(Open AI)战略及开发工具,积极参与和推动技术的创新与快速发展。
在支持诸如TensorFlow、CNTK等业界主流的深度学习平台的同时,微软还发起了
开放神经网络交换(ONNX)
项目,旨在推动人工智能研究的互操作性,让任何深度学习框架在任何芯片与任何设备上都能运行。目前,已经有15家公司支持ONNX,并且还有更多公司正在加入进来。现在已经有PyTorch等六种顶级框架支持ONNX,其它框架则可以通过转换器获得支持。
在Build 2018微软全球开发者大会上,
微软宣布推出跨平台、开源机器学习框架ML.NET开放预览
。ML.NET让任何 .NET开发者都能开发出自己的定制化机器学习模型,并将其融入到自己的应用中去——开发者完全无需具备开发和调试机器学习模型的经验。这一框架最初由微软研究院开发,并且在Windows、Bing、Azure等微软产品上都得到了成功的应用。通过将这一技术框架开源,微软希望能够为每一位开发者赋予驾驭机器学习的能力。
微软
Project Brainwave
能利用Azure上最先进的FPGA基础架构完成实时的人工智能处理。用户只需通过实时的单一批数据,就能得到以往需要多得多的批数据处理才能得到的性能,真正实现人工智能的实时计算。而且,FPGA运算不仅仅只在云端提供——通过合作伙伴,也可以通过Azure Stack混合云在本地提供FPGA。如此强大的实时计算能力不仅存在于云端,同时也适用于边缘计算,这将让更多创新成为可能。
微软研究院,开启人工智能的未来
今天,人工智能已经在潜移默化间给人们生活、工作的方式带来巨大的改变,那么未来的人工智能技术将如何发展?将近20年前,微软在北京成立了微软亚洲研究院,与微软研究院遍布全球各地的科研实验室一起,以全球最顶尖的智慧解决计算机科学中最具挑战性的难题,并为未来5到10年的发展开启更多可能。
作为美国以外规模最大、功能最全的研究机构,微软亚洲研究院在计算机视觉、自然语言理解等方面取得了举世瞩目的突破,甚至已经接近或者达到了人类的水平:在计算机视觉方面,
2015年微软亚洲研究院发布的152层残差网络(ResNet)的图像识别准确率已经达到96%
,胜过人类;2017年8月,
微软在Switchboard语音识别基准测试中的错误率已经降低至5.1%
,达到了媲美人类专业速记员的水平;2018年1月,
微软亚洲研究院自然语言计算组率先在斯坦福大学发起的SQuAD文本理解挑战赛上获得超越人类的分数
;2018年3月,微软亚洲研究院与微软雷德蒙研究院宣布,其研发的
机器翻译系统在通用新闻报道测试集newstest2017的中-英测试集上,第一个达到了可以与人工翻译媲美的水平
。
微软亚洲研究院开发的
OCR
(Optical Character Recognition光学字符识别)技术,将为各种人工智能应用增加图形文字识别功能,目前支持从Office到Skype、Bing、HoloLens的微软应用,能识别打印字体、美术字、手写字体,可以满足从智能云到边缘计算的各种场景。目前手写识别OCR引擎V3.0版本的精度达到了70.5%,已经部署于微软认知服务,可供开发者用于自己开发的智能应用。
人工智能为人们打造更美好的未来
沈向洋博士在即将出版的新书
《未来计算》
中强调:人工智能的发展让我们有机会,以前所未有的方式塑造我们的未来,
我们必须以负责任的态度,确保打造一个所有人都能参与和分享的美好未来,让人工智能为全人类造福
。
在2018微软人工智能大会的现场,沈向洋博士迎来了一位特别来宾——来自南京工业大学的硕士研究生宋昊旻。宋昊旻在一岁时失去了听力,被诊断为终生听力严重损伤。昊旻在妈妈的支持下,经过不懈的艰苦练习学会了发声。他不但和同龄人一起学习生活,还考上了南京工业大学的本科和硕士研究生。在会议现场,昊旻在微软语音服务的帮助下,与沈向洋进行了对话。针对昊旻的声音特点定制的语音识别模型能够以极高的准确度将他努力发出的语音转换成文字,还能同步翻译成英语或其它语种,真正实现无障碍沟通。
2014年,微软便与合作伙伴
七厘米科技
一起,在Azure智能云上为助盲公益机构
红丹丹
打造了云端的“心目图书馆”,让盲人朋友可以通过移动设备随时随地收听和下载有声读物。在这项合作的基础上,微软小冰为红丹丹提供中国最大的公版儿童有声读物全集“
小冰姐姐讲故事
”,囊括上千小时的童话故事、科普百科、名人轶事等有声读物。红丹丹服务的104所盲校的学生和少年儿童都可以通过心目图书馆找到这些内容。
“对话服务&智能客服”分会场
“
对话服务&智能客服
”分会场,主要介绍了微软Bot实现的技术架构、基于微软认知服务实现的数字化助理机器人,企业和开发者可以通过微软语音识别改善电话客服中心的服务质量,通过对话服务和翻译服务提升语音产品和翻译应用场景的体验。
“AI助力现代应用”分会场
“
AI助力现代应用
”分会场,展示了微软新一代OCR引擎的技术背景和成果,以及基于Azure视频人工智能的企业视频门户解决方案、物联网边缘计算和Office 365 中的智能应用与智能安全,为各个行业的现代应用带来创新启示。
“AI平台和工具”分会场
“
AI平台和工具
”分会场,主要分享了基于机器学习和深度学习的计算机视觉在行业中的应用经验,还包括深度学习框架后端优化、新一代开放人工智能平台OpenPAI和以开发者为中心的全平台人工智能开发套件,帮助开发者高效、便捷地开发人工智能应用。