专栏名称: 数盟

数盟（数据科学家联盟）隶属于北京数盟科技有限公司，数盟致力于成为培养与发现“数据科学家”的黄埔军校。数盟服务包括：线下活动、大数据培训。官网：http://dataunion.org，合作：[email protected]

今天柯洁与阿尔法狗“终极决战”，150万美金创围棋奖金史之最

数盟 · 公众号 · 大数据 · 2017-05-23 21:58

正文

请到「今天看啥」查看全文

钛媒体 TMTPost.com

TMT ｜创新｜创业

关注这个不一样的微信号：钛媒体（ ID：taimeiti ）

胜负，在棋盘之外。

钛媒体作者︳脑极体

钛媒体注： 今天，柯洁将开启与阿尔法狗（ AlphaGo ）的人机围棋大战，昨天晚间柯洁更新长微博，表示 “无论输赢，这都将是我与人工智能最后的三盘对局”。柯洁称，相信未来是属于人工智能的。但它始终都是冷冰冰的机器，与人类相比，感觉不到它对围棋的热情和热爱。不管面对再强大的对手，自己也绝不会后退。关于这场大战，胜负已不重要，人类的未来才是关键。钛媒体作者对此作做了更详尽分析：

今日（5月23号）上午十点开始，两次出手都让吃瓜群众大惊失色的“阿尔法狗（AlphaGo）”又要杀回来了，这次对战的对手将是中国棋手柯洁，其意义对中国观众来说当然非同小可。加之酝酿已久的“终极决战”和高达150万美金的史上最高围棋赛奖金，这场“捍卫人类尊严”的大赛必定万众瞩目。

但相比于棋盘内的胜败，我们却更希望在这时候聊一下AlphaGo的创造者，著名人工智能企业DeepMind。

对于大部分人来说，常识中AlphaGo是由谷歌制造。但事实上，DeepMind虽然在14年就被谷歌收购。但总部和项目始终继续保留在伦敦，人员也对外保持着高度的神秘性。另一方面，即使对DeepMind有了解的人，也更多的是知道它的创始人戴密斯·哈萨比斯(Demis Hassabis)是一位少年天才，4岁下国际象棋16岁进入剑桥等等。但DeepMind作为一家创业企业的规划、产品序列和目标实施情况，好像总是隐藏在一些面纱之后。

从目前消息来看，谷歌AI与DeepMind依旧保持着高度的相互独立属性。虽然有战略和技术上的结合，但谷歌AI的重点推进工程列表中可说是完全不见DeepMind的踪影。

而AlphaGo作为DeepMind的核心创造物之一，绝不仅是为了挑战人类围棋界而生。作为核心领域技术的关键载体，承接着整个公司战略的上下衔接。

因此，通过DeepMind做了什么，来重新认识一下这家被谷歌大脑专家称为“AI实力世界第一”的公司，可以帮助我们更好的理解AlphaGo及其背后的更大野心。

我们通过8件DeepMind所做的关键动作来梳理这家公司的实力与目标，希望在棋盘的决胜以外，提供给你一点新的思考。

一鸣惊人的游戏系统

DeepMind的创始人是棋类和电子游戏高手，而这家公司迈出的第一步就与游戏有关。

2013年，当时名不见经传的在DeepMind发表了一篇论文，内容是他们自己开发的AI游戏系统。论文中描述的计算网络并不是为了游戏而服务，反而是让一个AI系统自己去玩游戏。

神奇的是，DeepMind的游戏系统可以在完全没有接触的前提下，通过对游戏的自我学习，自动的玩一系列初级电视游戏。

这个系统可以通过屏幕上面的图像和游戏中的分数是否上升下降，从而做出选择性的动作。

虽然这个行为对人来来说难度不大，但对于机器学习来说却意义惊人。因为它涉及架设任务、建立人工精神网络、建立深度学习模型和完善学习过程几个关键部分，并且需要大量的图形处理单来辅助。

这款“玩儿出来”的AI程序，最终帮助DeepMind登上了《自然》。随后开始受到各大互联网巨头的关注，并成功在一系列拉锯战后，被谷歌以据说高达6亿美金的代价收购。更可怕的是，这还被称为谷歌有史以来最成功的收购案。

从初出茅庐的这件作品，可以看出DeepMind的几个特点。首先是擅长多种复杂技术的集成，其次对于AI应用有远超于业界水准的解决能力。而其喜欢游戏、热爱人机对决的基因特质，也在一开始就暴露无遗。

给AI上3D游戏课：开源DeepMind Lab

2016年底，DeepMind将其核心深度学习平台之一“DeepMind Lab”进行开源，供研究人员和开发者使用。

区别于以往的深度学习开源平台，DeepMind Lab的特殊之处在于，它其实是一套专门给AI玩的3D游戏。

就像人类玩的第一人称射击游戏一样，这套开源程序可以设计多重复杂的环境架构，专门用来训练人工智能和机器学习系统。用于训练人工智能在大型环境、部分可视环境，以及视觉多样化条件下学会执行复杂任务。

DeepMind Lab据说是在《雷神之锤3》的基础上演变而来的，有比较强的延展性和适用性。可以让适用人员自行设计关卡和环境效果，来针对性训练出AI不同的判别与处理机制。

相比于针对数据样本的机器学习系统，DeepMind开源的体系可以专注于AI在实际环境中进行视觉+感知的交互。这对于AI行业来说可谓是打开了巨大的脑洞，尤其对于无人驾驶、AR、地图导航、机器人记忆等领域的研究与创业者来说，可谓是福音。

从这套灵感依旧来源于游戏的系统中，不难看出DeepMind一个特点是非常重视AI与人类高度贴合的研究。目标指向把人类的感知与精神思维方式移植到机器当中去，而且他们还鼓励其他人一同在这个方向尝试。

人脑模式与经典计算机合体：可微分神经计算机

另一个值得关注的动作，是2016年底DeepMind公布了他们打造的一台“可微分神经计算机”（DNC）。

DNC的特点，是结合了精神网络的运作原理和经典计算机的运算能力和外部储存能力。简单来说，其解决方案就是将神经计算机的本体：以人类大脑为生物网络蓝本设置的精神网络，与可读写的外部存储器相分离，架设双层的处理与运算结构。

这样打造的运算系统，核心特征是解决了神经网络实际运作当中的机器记忆问题。做出了一台又能像人类一样想，又能像计算机一样高速运算、记忆数据的机器。在发布的论文中，这台计算机可以规划相距甚远的地铁站间的最佳路线，弄清楚复杂的亲戚关系——尤其这些都是在没有先验数据的前提下。

整合多元能力，对算法进行创意性的解放，在这台计算机当中展现的淋漓尽致。虽然原理听起来蛮简单，但实际运用到的解决方案却非常复杂，设计多个领域的协同。

开发用于《星际争霸2》的人工智能训练环境

2016年的暴雪嘉年华上，DeepMind宣布将于暴雪合作，打造一个专门玩《星际争霸2》的AI系统。这台系统会像人类一样去思考和决策，并希望复制AlphaGo的奇迹，最终打败所有人类高手。

这里不禁要怀疑，这家公司到底是有多爱玩游戏。

但事实却是如此，《星际争霸2》这种完全动态的游戏环境当中，人类选手对大势、时机、环境的处置始终都是高于电脑系统的。

围棋的问题是运算量巨大，而这类策略游戏的问题是变化性太强，都是人工智能面对的核心问题。

显然通过挑战人类擅长领域来做PR、讲故事、推产品，是DeepMind的拿手好戏。

最精准的语音生成系统WaveNet

在玩游戏之余，DeepMind也做点大家都在做的“正经事”。

比如近两年，DeepMind先后公布了其在图像生成和语音生成领域的成果。比如16年公布的语音生成系统WaveNet，号称将计算机输出音频与人类自然语音差距缩小了50%。至少根据亲身尝试者的说法，这一系统比谷歌和苹果的语音生成系统都听起来自然流畅许多。

在AlphaGo挑战柯洁之前，这8件事帮我们重新认识它的主人DeepMind

波形原理合成声音的WaveNet

WaveNet的优势，是通过原始的波形合成了近似真人的语音，而不是将语音样本进行逐字逐句的拼接。

这让未来机器的声音可能更加接近人来，想想也是细思恐极的一件事。

医疗应用计划DeepMind Health

以上说的，基本都是DeepMind在研发端的动向，核心载体是算法架构和论文。而在产品应用端，DeepMind也有一些动作，比如其推出的DeepMind Health就指向智能医疗系统，根据与英国全国医疗系合作获取的数据，来打造基于人工智能进行诊疗帮助和症状判断帮助的系统。比如说DeepMind打造的智能诊疗系统可以通过学习上百万份眼部监测资料，据此建立模型来识别早期征兆及早发现眼病。此外，DeepMind还架设了一些移动应用类的非人工智能产品。

不过，与英国医疗系统的合作也带来很大麻烦，DeepMind在缺少监督的境况下获得了全英病人数据，让媒体发出了不小的惊恐和反对声音。

帮谷歌省电

去年夏天，很少真正尝试应用领域的DeepMind在东家谷歌的大本营小试牛刀了一把

利用深度学习算法，DeepMind把谷歌数据中心的冷却系统用电给节约了40%。冷却系统是维持数据中心服务器运行的重要系统，但因为设备众多、需求量极高，其中大量的能源其实是被浪费掉了。

DeepMind运用AI系统，优化了整个冷却系统的用电效率，据说一次性帮助谷歌节省了上亿美金的开销。而外界更加关注的，是这类技术可以被用于多种大规模工业系统上，谷歌从自家大楼做案例，显然也是要为未来的大规模发展做广告。

全面进驻谷歌TensorFlow

最后，不得不说的一件事，是DeepMind 虽然在产品和研究上保持了高度的独立性，但还是在2015年将研究全面进驻到了谷歌的TensorFlow开源架构当中。并且官方高度肯定了TensorFlow的高度适用性、延展度和操作体验。2016年，DeepMind 还开发了一个能在 TensorFlow 上快速创建神经网络模块的高级框架Sonnet，并且对其进行了开源处理。

由此可见，对于谷歌AI体系的核心业务和生态基础，DeepMind还是支持的。并且愿意在这个领域帮助谷歌完善生态。

其实谷歌本体所需要的，也是DeepMind作为一个精英企业在生态核心上提供更多支持——面向大众赚钱的事可以谷歌做，但华山论剑的时候DeepMind还是出马一下的好。

总结

通过总结DeepMind在研究方向、应用化和与谷歌关系的几个案例。我们不难发现DeepMind的几个特点，或许我们可以为它做个简单清晰的画像：

在技术探索方面，DeepMind更多指向以高度模拟人脑的方式，在核心领域超过人类已有水平的AI系统。无论是围棋、游戏，还是环境判断、图像与音频生成，都指向这个巨大的野心。

而在技术优势上，DeepMind一方面得力与强大的多领域人员储备，让它拥有了横跨多学科打造算法与产品的优势。另外一方面，DeepMind的技术优势在于高度应用化水准跨越上。虽然他发布的东西不多，但没有一次让我们看到很初级、很简单的应用模型。

在产品的商用价值上，DeepMind或许会主攻医疗健康和垂直领域的机器学习应用上，这个从他们2016年的动向中已现端倪。

综合来看，这家公司是半学术化半商业化的创业团队，技术实力极高，却也不太急于赚钱——有谷歌做后台，他们还忙着玩游戏呢。

当然，这家公司最强的可能还是人工智能的品牌PR上，这不，他又来用围棋PR人类了。

*本文原刊微信号脑极体（ID：unity007）,钛媒体已获作者授权，略经编辑。

贴心的钛媒体编辑还为你准备了几天大战的日程安排：

微信推送太少，下个钛媒体App更及时

了解这个 新奇世界

做你的专业助手，钛媒体Pro（专业版）来了，更丰富的专业信息服务体系，点击 “阅读原文”，注册成为钛媒体专业用户。