计算机视觉可能会影响我们发展人工智能的五种方式

中国人工智能学会 · 公众号 · AI · 2017-06-21 16:25

正文

转自人工智能学家

原作者：KEN WEINER, GUMGUM

译者：李凌

概要：我们将看到计算机视觉系统与人工智能相结合，来创造并实现各种新的可能性。

这对于我们在计算机视觉领域工作的人来说是一个令人激动的时刻——我们将看到计算机视觉系统与人工智能相结合，来创造并实现各种新的可能性。在几星期前纽约举行的LDV Vision Summit上，我总结出了计算机视觉系统将会影响人工智能的五个重要观点：

1.智能小助手在视觉上开战

随着我们的系统越来越接近于“人性化”——就像人工智能，它将更需要视觉数据来进行学习和处理其他数据。在LDV 峰会上，Evan Nisselson说到：“这是所有主要公司都想在激烈的竞争中拥有我们的活动视觉数据的原因之一。”“为了做到这一点，他们需要拥有摄像机。”例如，亚马逊最近为其以Alexa作为语音助手的智能设备—— Echo，添加了一台摄像头，而Google（Lens）和Facebook最近又发布了新的增强现实研究的声明。

2.光学器件足以引导无人驾驶车

我们经常会看到类似于这样的争论——无人驾驶汽车是否需要LiDAR，或者说是仅依赖于光学的解决方案就已经足够。例如，特斯拉首席执行官Elon Musk认为，体积庞大且昂贵的设备LiDAR通过使用激光器实时地对其环境进行映射不是驾驶时所必需的。 Wheras Humatics 的首席技术官Gregory Charvat在发布会上表示，汽车“不仅仅需要光学传感器平台[相机]，他们也需要比差分GPS更精确的LiDAR，雷达和高精度无线电导航。”

LiDAR和雷达通过范围和角度来精确定位周围环境中的实际物体，而基于用相机解决问题的深度学习则需要通过算法运行图像，并且即便这样，最终仍只能取得一个预测的结果。然而，光学解决方案能在实际生活中识别某个地方效果更好，就像一个行人和一串像圣诞树的像素点相比，在Auto X 的创始人兼CEO Jianxiong Xiao的令人印象深刻的演示中，他们的公司可以只使用相机来低成本的解决无人驾驶汽车的问题。

由于技术上的优缺点，汽车公司通常提前五年来进行战略研究，所以现在需要购买一些必备的硬件来确定2021年的最后生产时限。目前，LiDAR和一些更先进的雷达依然很昂贵（对于前者来说即便80,000美元也被认为是便宜的）、笨重。同时，如果要以一种混合的方式运行所有这些光学技术和传感器技术，需要一台足够小的能适应汽车的超级计算机。

3.视觉系统能让机器比通过机器学习学得更好

LDV中的几个演示提醒了我们，机器不仅仅通过神经网络和机器学习来学习。他们还有其他方法来学会识别和分析他们周围的世界。Google研究的科学家Tali Dekel展示了一种技术，使用计算机视觉来进行识别，通过将屋顶上的直线或紫色水果中所存在的偏差放大，然后来判断。例如，确定旧房子的结构是否存在问题，或者是某个西红柿是否比其他的成熟的更好，更饱满。看似很简单，但这是计算机视觉优于人类的地方。

4.机器视觉可以帮助医疗诊断

病理学家平均每天有500张幻灯片要处理，而每张幻灯片又包含数十万个需要分析的单个细胞，如果有癌症的存在，那么医生很容易将其遗漏。“对于人类来说，我们无法像计算机一样高效的工作，只因为我们无法去仔细观察每一个单元格”，PathAI的联合创始人兼首席执行官Andrew Beck表示，“但我们认为电脑每次都能做出完美的诊断。”

根据美国医学协会的一项研究，对于一项正确的诊断，通常只有不到一半的病理学家会表示赞同。引用另一项重点研究乳腺癌淋巴结活检的例子，Beck说明了计算机与人类病理学家所关注的侧重点之间的区别；前者强调了许多会成为癌细胞容器的区域。Beck说：“我们为病理学家提供原始图像，然后他们仍然可以去查看他们所熟悉的数据，和那些由学习系统处理了的图像，基本上这就可以确定癌症的区域，然后医生就能通过专门研究这些区域作出诊断。”乳腺癌研究表明，如果没有人工智能，这种活检只有85％的准确率。而如果使用人工智能作为辅助，错误率将下降到只有5％。

5.计算机视觉领域的门槛变得越来越低

优质相机，传感器和深度学习软件库（如Google TensorFlow）的商品化大大扩展了计算机视觉的使用范围，我们看到许多新的初创公司出现。在Vision Summit举办的两次比赛中，不论是一种能够从Google对街景视图图像进行判断，然后生成人口学分析的技术，还是一个能够对事故发生后汽车的损坏程度进行评估并且计算出维修成本的应用程序，我们可以看到这些判断和分析都仅仅是来源于一张图片。

“现在最紧要的是，计算机在多个方面已经出现了让人难以置信的商业化，并且机器学习常常会要求博士研究团队在基础设施方面进行开发，”康奈尔科技的教授和Summit组织者Serge Belongie说，“但是现在我们可以让独立研究人员或小型创业团队的开发人员将这种功能带入任何类型的产品中。

所以商品化还不能达到100％的即插即用。Union Square Ventures公司的执行合伙人Albert Wenger告诉我：“这是一种前80％容易，但其他剩余部分很难完成的曲线任务。”

所以我们的任务仍然艰巨，但对于任何有兴趣为构建下一个大型视觉科技助力的人来说，无论是为了商业，健康还是娱乐，这都是件好事。

本文系网易新闻&网易号“各有态度”特色内容

原作者：KEN WEINER, GUMGUM

译者：李凌

原文链接：https://venturebeat.com/2017/06/17/5-ways-computer-vision-could-impact-how-we-do-ai/?utm_content=buffer2485b&utm_medium=social&utm_source=twitter.com&utm_campaign=buffer

欢迎加入未来科技学院企业家群，共同提升企业科技竞争力

一日千里的科技进展，层出不穷的新概念，使企业家，投资人和社会大众面临巨大的科技发展压力，前沿科技现状和未来发展方向是什么？现代企业家如何应对新科学技术带来的产业升级挑战？

欢迎加入未来科技学院企业家群，未来科技学院将通过举办企业家与科技专家研讨会，未来科技学习班，企业家与科技专家、投资人的聚会交流，企业科技问题专题研究会等多种形式，帮助现代企业通过前沿科技解决产业升级问题、开展新业务拓展，提高科技竞争力。

未来科技学院由人工智能学家在中国科学院虚拟经济与数据科学研究中心的支持下建立，成立以来，已经邀请国际和国内著名科学家、科技企业家300多人参与学院建设，并建立覆盖2万余人的专业社群；与近60家投资机构合作，建立了近200名投资人的投资社群。开展前沿科技讲座和研讨会20多期。欢迎行业、产业和科技领域的企业家加入未来科技学院

报名加入请扫描下列二维码，点击本文左下角“阅读原文”报名