2015年,特斯拉CEO Elon Musk,LinkedIn创始人Reid Hoffman及PayPal创始人Peter Thiel等人共同宣布创立的非盈利的研究公司OpenAI。
OpenAI是地球上最强的人工智能研究团队之一,致力于进行非监督式学习和强化学习的研究。OpenAI的使命和长期目标是以将最大限度地造福全人类的方式发展人工智能。
最近,硅谷密探独家专访了在斯坦福大学和OpenAI的两位研究者施天麟(Tim Shi)和范麟熙(Jim Fan)。施天麟师从于斯坦福计算机教授Percy Liang,范麟熙的博士生导师是斯坦福计算机系教授李飞飞,我们讨论了OpenAI Universe以及基于Universe的World of Bits。
OpenAI Universe是一个能在几乎所有环境中衡量和训练 AI 通用智能水平的开源平台,目标是让 AI 智能体能像人一样使用计算机。目前,Universe 已经有1000种训练环境,由微软、英伟达等公司参与建设。Universe 从李飞飞等人创立的 ImageNet 上获得启发,希望把 ImageNet 在降低图像识别错误率上的成功经验引入到通用人工智能的研究上来,取得实质进展。
其中,World of Bits是基于Universe的训练平台,也是OpenAI Universe项目的前身,范麟熙、施天麟和Andrej Karpathy是World of Bits的主要完成者。
OpenAI Universe:让虚拟世界变成人工智能的游戏场
OpenAI Universe是由 OpenAI 发布的 AI 训练架构,训练 AI 通过虚拟的键盘和鼠标像人类一样使用电脑。在 Universe 中, AI 能够像人一样看视频、浏览网页、玩游戏......
OpenAI 认为现在的 AI 技术虽然已经能做到在围棋中击败人类这样的事情了,但还是只能限定在一个很窄的领域,能在特定领域有着超越人类的表现,但在别的领域基本能力为零。就像 AlphaGo 可以很轻松的在围棋上击败你,但在别的棋类游戏上完全没能力。
Universe 就是为了解决这个问题而生的,OpenAI 的联合创始人 Ilya Sutskever 就说过「一个真正的 AI 应该能解决任何你交给它的问题」。
Universe通过一个通用的接口来链接无限的互联网:AI通过捕捉屏幕的像素生成对键盘和鼠标的命令来操作远程桌面。通过使用标准的VNC 服务器,也让Universe变成一个更通用的AI训练平台。正是这种通用性,让Universe变得超级有想象力。
目前,OpenAI 已经得到了 EA, Microsoft Studios, Valve, Wolfram 等等公司的授权支持,也就是 AI 能够在 Universe 上玩到命令与征服、侠盗飞车等游戏。
World of Bits:人类的通用智能助手
现在互联网已经被建设成一个关于信息的巨大宝藏,成为我们日常生活的一部分。
Universe通过通用的接口,让AI能像人类一样使用网站、显示器、键盘和鼠标,而World of Bits的训练目标则是,让人工智能学会做任何人类在网络上做的事情。
基于Universe,World of Bits里的智能体可以学会与常见的用户交互元素(如按钮,列表和滑块)进行交互,这些智能体只需要提供鼠标和键盘的输入指令。
然而,这只是一个开始。施天麟和范麟熙希望引入更多更有实际意义的任务,比如订机票和订酒店,他们最新发布的FormWoB的训练任务就能够训练AI填写各种表格。
World of Bits目前通过查询(query)来提供任务输入,根据AI给出的相应的鼠标和键盘动作形成的网页请求作为输出来判别任务完成的正确程度。
比如一个任务可以是查询Yelp(美国的大众点评)上旧金山机场附近最好的中餐馆。
未来,World of Bits可以引入更多更复杂的任务,例如在互联网上查找他们不知道的事情,管理电子邮件或日历,完成Khan Academy课程,或者完成亚马逊 Mechanical Turk 和CrowdFlower 等任务。
或许,未来的某一天,人工智能已经能够学会使用浏览器,与虚拟世界甚至是现实世界来交互。
而在那个时候,没有人知道在互联网上的你是人还是狗,或者是一个AI。
World of Bits的学术创举
World of Bits平台是一个极具创举,具有巨大的学术价值。
对比OpenAI Gym, Gym是一个非常好的增强式学习平台,但是上面的训练样本都只是游戏。大量的训练算法都不基于对游戏任务的理解,而基于像素层面的反馈,训练结果也往往没有太多实际应用价值,在某个游戏上的训练后的AI不能用于其他游戏,往往使用无模型(model free)的增强式学习算法。
而完成World of Bits测试需要有对某些任务的理解,更适合于基于模型的机器学习算法,比如基于模型的增强学习。
World of Bits平台提供一个极佳的迁移式学习的训练平台,比如我们训练好的AI学会在西南航空上订机票后,我们也希望AI能够马上就能在维珍航空上订机票。我们也希望即使是网页改版后,训练好的AI能够同样完成任务。
迁移学习正是OpenAI目前研究的重点:在现实世界中应用机器学习模型时,模型要面对的是无数从未遇过的条件,它不知道如何处理;每个客户或者每个用户都有着自己的偏好,具有或会产生与用于训练的数据不同的数据;一个模型会被要求执行许多个任务,这些任务可能和训练任务有关联但不完全一样。
对于目前最好的机器学习模型而言,尽管它们在被训练过的任务上表现出与人类水平持平甚至超过人类的性能,但在上面提到的这些情况下,准确性会急剧下降,甚至完全崩溃。
迁移学习可以帮助我们处理这些新遇到的场景,并且迁移学习是机器学习的工业规模使用所必须的。
World of Bits的想象空间
World of Bits也提供了一个由学术平台转化为实际应用的途径,理论上,World of Bits训练平台的未来赢家是一个强大的通用智能助手,能够完成各种互联网任务,或许是人工智能征服互联网的第一步。
World of Bits也有潜在的商业前景,World of Bits的接口设定在通用性上有很大的优势,虽然网络世界有不少服务提供了API,但API可能会变动,而且不是所有网站都提供API,但World of Bits上训练后的AI能够直接模仿人类行为,摆脱对API的依赖。
施天麟和范麟熙表示,World of Bits和现在的聊天机器人可以很好地结合,想象一下未来我们和智能助手说几句话 ,他们能够帮我们完成任何人类在互联网上做的事情,而且更快更好!
▼▼▼
在我们的邀请下,施天麟将登陆硅谷Live,讲述“如何构建训练人工智能的虚拟世界”
Speaker简介: 施天麟 斯坦福大学计算机系在读博士 OpenAI Member Of Technical Staff (Part-Time)
本次硅谷Live将用中文讲述:从ImageNet到AlphaGo,人工智能的重大突破都依赖于确立明确的标杆(Benchmark)。如何构建一个通用的学习环境,来衡量与增强人工智能处理不同任务的能力?
大纲:
1. 回顾强化学习领域的最新进展
2. OpenAI Universe虚拟环境及其基本架构
3. 在Universe环境下训练人工智能的初步尝试
扫码报名
▼▼▼
如出现跨号支付问题,也可扫描下方二维码,关注「硅谷Live」服务号,回复“报名”,获取Live报名链接:
付费后可无限次反复回听,语音和PPT会永久保存在「硅谷Live」。更多问题,欢迎添加「硅谷Live小助手」(ID:guigulive)咨询。