微软在人工智能提供了不同的平台,要把AI带到每个人身边,让不同层次的开发者都能利用微软技术帮助他们的业务。
如图所示,最底层是硬件的创新,有海量的硬件计算能力。有GPU、scale和FPGA。例如FPGA可以把相应的算法编成可编程的阵列写进硬件里,使计算更高速。
上一层提供了海量数据的存储和分析。
第三层是Machine Learning的算法,Cognitive Toolkit。提供了开源算法的工具包,研究人员可以用工具包来写自己的算法并研究相应的人工智能技术。
Azure Machine Learning Studio是Azure的一项机器学习的服务,服务包含了一些现成算法。通过可视化界面,用拖拉拽的方式就可以将算法运行起来,也可以添加Python或者R的脚本。数据科学家只需理解这些算法,但不用自己写太高难度的算法。
CognitiveService供开发者使用,它是一套API,可以直接调用。
微软在不同层次提供了相应的服务。
从另一个维度来看,微软人工智能的四大支柱是Agent、Applications、Services、Infrastructure。
Agent:有Cortana和XiaoIce。
Applications:微软把人工智能技术运用到自家的应用里,比如office、输入法、pix和skype等等。
Services:还有像Bot Framework、Cognitive Services、Cognitive Toolkit等相应的Services。
Infrastructure:基础设施,比如硬件、存储、分析都属于Infrastructure,微软提供了相应的一些基础设施服务用于机器学习。
认知服务是一套REST API,无论是写Web、Andriod还是ios,不管是什么样的开发者,都可以使用这套REST API来帮助业务或应用服务变得更加智能化。
CognitiveServices主要有五个部分,vision、language、speech、search和knowledge。
在之前的推广过程中,我们发现很多开发者喜欢自定义的东西,所以我们推出了自定义服务。
比如自定义的视觉服务、自定义智能语言理解服务、自定义语音服务、自定义搜索和自定义决策。
计算机影像API:上传一张图,它可以识别出图中的内容。
人脸API:做人脸识别、登录等操作。
内容审查器:内容合法性识别。
情感API:把人脸分析成八种表情并识别出来,每种表情给出百分比数据。
Video API:对视频进行防抖处理、动作检测、人脸追踪等。
CustomVision Service:自定义计算机视觉服务。
Video Indexer:识别视频内容、对视频进行分析。
先进的图像处理算法可帮助自动审查内容,通过返回人脸、图像和情绪等智能见解构建更人性化的应用。