MIT的研究团队尝试利用强化学习技术(reinforced learning)教会他们的机器人buddy在人群中导航的本事。在基本层面上,这个方法通过计算机计算模拟一个有一些以不同速度和轨迹运动的物体(模拟真实环境中的人)的场景,将机器人放置在这个模拟的场景中训练学习模拟人的行走规律。
模拟器还能用于教会机器人在导航时遵守环境中的一些社会规范,诸如走路要靠右走,将自身速度控制在1.2米每秒的一般行人步伐速度。当机器人在真实世界中面对一屋子人的时候,它会识别出在训练中遇到的某些特定的场景,然后根据相应的行人规则来应对这些场景。
在计算机领域之外,MIT的研究者们把他们的机器人描述为是一个“膝盖高并有轮子的亭子”。它装备有一系列传感器,包括网络摄像机,深度传感器和一个高分辨率的雷达传感器来帮助机器人感知周围环境,并利用一些开源算法来实现自我定位。
这些传感器每隔0.1秒扫描一次机器人周围的环境,这使得机器人具备了感知动态环境的能力并在前往目的地的时候灵活地调整自己的路径而无需停下来计算规划自己的最优移动方向。
“我们并没有在一开始就计算规划好前往目标的一整条路径——因为这毫无意义,特别是当你假设世界是不断变化的时候,”这项研究的论文合作者之一的研究生Michael Everett说道,”我们只看我们当前看到的,然后选择一个速度前进,每0.1秒再扫描一次周围的环境,计算出另一个速度,再继续以新的速度前进。利用这种方式,我们认为我们的机器人看起来会会更加自然,并且还能预测出人们在做什么。”