专栏名称: 脑极体
你的困惑,来自于无路贴近未知。我们在技术、思想、传播的异界,贩来极限脑量下的TMT。
目录
相关文章推荐
小众软件  ·  另外两件事[250226] ·  11 小时前  
APPSO  ·  曝 DeepSeek R2 ... ·  20 小时前  
APPSO  ·  刚刚,DeepSeek ... ·  昨天  
APPSO  ·  OpenAI 和 Grok 都在卷的 ... ·  2 天前  
小众软件  ·  BTR AMP 本地音乐播放器内购终身限免 ·  3 天前  
51好读  ›  专栏  ›  脑极体

深度学习面对物理世界无能为力?包教包会的元学习或是解决方案

脑极体  · 公众号  ·  · 2018-07-12 21:09

正文

我们所面临的这一次人工智能崛起,来自于数据量的增长和深度学习发展,传感器为智能体打造一个完全结构化的数据世界,再从中抽取规律,让智能体可以自主作业。


这样形成的结果是,人工智能进入物理领域要比进入虚拟领域困难的多。我们可以看到处理图像、语音、文字等等数据的AI拍照、语音助手、智能推荐表现都很优秀,可在工业、自动驾驶等等与现实世界相交的领域,却因为需要大量测试训练而进展相对缓慢。至于看护机器人、服务机器人这些灵活性更强的领域,人工智能的表现就更加差劲了。



原因在于物理世界缺乏较好的数据结构化条件,所需解决的问题又有极大的灵活性,就让人工智能的学习和训练变得格外复杂。具体来讲,在极端情况下我们可以教会机器人手臂把水壶里的水倒在水杯里,但一旦水壶或水杯的位置产生了变化,机器人的动作就会一团糟。


但如果我们把水杯和水壶可能出现的每一个位置都作为数据输入,对机器手臂进行深度学习训练,这其中的工作成本是难以想象的。


深度学习“衰落”?元学习崛起


在最近,很多人都在讨论所谓“深度学习”的衰落,其中提到的一个原因就是物理世界中深度学习能解决的问题是有限的,如果只依靠传感器收集数据、再从数据中挖掘规律,成本会高居不下。


所以我们想象中在家中走来走去满足人们需求的小机器人迟迟不能出现,推荐算法对我们的深入了解却让人毛骨悚然。就给人一种“深度学习让人工智能往奇怪的方向发展”的观感。



但深度学习不能做到的,不代表人工智能不能做到。在意识到了深度学习的缺陷之后,很多研究机构和企业开始试图用更少的数据和更简单的训练过程来解决物理世界的人工智能问题。


在理想状态下,人工智能的学习应该和人类学习一样。当我们学习拿筷子、系鞋带这类动作时,通常都是通过别人的示范之后学会,而不是精确计算出每一根鞋带之间的距离要有几厘米。


实现这一目标,采用方式通常被称为“元学习”(Meta Learning),元学习具体指的是让智能体掌握的能力不局限于某一环境下的某一模型,而是真正掌握学习的能力,让智能体可以从容应对种种新任务,节省下复杂的收集数据、训练模型的过程。


看一眼就会的机器人,

距离我有多远?


这样的描述或许有些难以理解,但我们可以从元学习的一种具体解决方案来解释——一眼学习(One Shot learning)。


一眼学习就是我们所说的,和人类一样看一眼示范就能学会动作的能力。以往来说让机器人模仿人类的动作并不是什么新鲜事,但想要让机器人的模仿行为可以应用到现实中,需要至少两百次专业示范的数据,还要将人类的动作逻辑和机器人的部件进行一一的映射。



但在UC Berkeley人工智能实验室的研究中,采取了未知模型学习和模仿学习结合的方法,先用大量操作示范建立数据集,从中提取基础的操作策略参数,再给智能体进行单一的一次示范,智能体就可以从中找到对应的位置模型操作策略,从而可以通过一次示范,就能让机器人操纵从没见过的物体了。同时这一切都是通过计算机视觉进行的,利用摄像头或者视频录入都可以。


目前通过一眼学习,UCBerkeley人工智能实验室已经实现了让机器人一眼学会分辨不同颜色的球体并放入纸杯、移动物体、堆叠物体等等。


除了一眼学习外,元学习还有很多其他解决方案,例如用记忆增强神经网络和顺序生成神经网络帮助智能体从少量数据样本中泛化概念的“少数据学习”,又比如将元学习建立在增强奖励机制之上,以更强的奖励/监督机制让智能体从少量样本中得到高强度的训练等等。


元学习从实验室进入现实还有多远?


目前看来元学习基本都还停留在实验室当中,尚未进入现实应用。不过在产学结合格外紧密的今天,元学习进入我们身边并不遥远。


但目前来看,元学习距离实际应用还有以下这些问题需要解决:







请到「今天看啥」查看全文