专栏名称: DeepTech深科技

“DeepTech深科技”是与麻省理工科技评论官方独家合作的一个新科技内容品牌。我们专注于关注三个方面：1、基于科学的发现；2、真正的科技创新；3、深科技应用的创新。

马斯克的OpenAI：全新方案有望取代强化学习，通用人工智能并非不现实

DeepTech深科技 · 公众号 · 科技媒体 · 2017-03-30 10:46

正文

本文属于本次Emtech Digital人工智能峰会独家精选文章。

2013年，英国一家人工智能创业公司DeepMind就教会了软件如何在经典的Atari游戏中战胜人类顶级玩家，这在计算机科学界引起了不小的轰动。不久之后，DeepMind就被Google收购。这款神秘软件背后的奥秘——强化学习，也逐渐成了人工智能和机器人领域内的研究的热点。

去年，Google再次使用强化学习构建了一款战胜人类顶级围棋玩家的软件。随后，机器学习正式成为时代的“宠儿”。

现在， OpenAI（由埃隆·马斯克等硅谷大亨联合建立的人工智能非营利组织）的研究人员表示，他们已经找到了一种更容易使用的方法，在玩游戏和执行其他任务中可以与强化学习相竞争，甚至可能取代强化学习。

在昨天由《麻省理工科技评论》在旧金山举行的Digital EmTech大会上，OpenAI研究室主任Ilya Sutskever表示，他们的方法可以让研究人员加速推进机器学习领域的进展。

Sutskever表示，在标准基准测试中，这种方法能够与今天的强化学习相竞争。另人惊讶的是，这种方法有时更简单。

Sutskever认为，找到让软件学会玩电脑游戏或引导机器人等任务的新方法对于开发执行更加复杂任务的机器学习软件具有重大意义，人们需要的不仅仅是识别图像和语音翻译。他说：“如果我们能让计算机系统学会处理现实世界中的复杂任务，然后，我认为我们才能把这些系统称为智能系统。”

Sutskever及其同事使用了“进化策略”的新方法构建了人工智能软件，并教会了它玩50多种Atari游戏，包括“Pong” 和“Centipede”这两个经典游戏。因为该新方法容易部署到多个处理器上，因此在一个小时内，他们就能训练好一个顶级的人工智能玩家，而训练由DeepMind去年开发的强化学习系统则需要约一天的时间。研究表明，在一些游戏中，这两种方法都表现出相同的学习能力。