专栏名称: 数据派THU
本订阅号是“THU数据派”的姊妹账号,致力于传播大数据价值、培养数据思维。
目录
相关文章推荐
艺恩数据  ·  2024喜剧综艺年度报告 ·  3 天前  
CDA数据分析师  ·  【干货】字节70W年薪数据分析师:数据分析报 ... ·  4 天前  
大数据文摘  ·  强化学习之父 Rich Sutton ... ·  3 天前  
软件定义世界(SDX)  ·  第五次全国经济普查首次增加『数字经济』调查结果 ·  4 天前  
数据派THU  ·  机器学习特征工程,全面指南!(下) ·  4 天前  
51好读  ›  专栏  ›  数据派THU

【CMU博士论文】用于机器人规划与控制的可微凸模型

数据派THU  · 公众号  · 大数据  · 2024-12-26 17:00

正文

来源:专知

本文约3000字,建议阅读5分钟

本论文为机器人多个领域提供了简单且高效的算法,并保证了可预测和安全的性能。


机器人仿真、规划、估计和控制都建立在数值优化的基础上。与此同时,现代凸优化已经发展成为一种强大的技术,能够在多项式时间内提供全局最优解。随着可微优化和定制求解器的进展,这些求解器能够生成平滑的导数,凸建模变得更加快速、可靠,并且完全可微。本论文展示了凸建模在多个领域中的有效性,如火星大气进入引导、纳米卫星空间望远镜指向、碰撞检测、点云的接触动力学、在线模型学习,以及最终一种无需导数的轨迹优化方法,该方法利用并行化仿真。在所有这些领域中,可微凸优化的可靠性和速度使得实时算法变得严格、高效,并且易于理解和修改。
本论文介绍了基于可微凸建模的机器人仿真、规划和控制的新方法。通过在优化优先的框架中制定这些领域的算法,我们通常能够简化算法的复杂性,并将计算复杂度卸载到高度专业化和高效的求解器上。本论文重点扩展了许多现代凸建模的进展,其中求解器能够在保持完全可微的同时,为凸优化问题提供全局最优解。由于这些求解器既快速又稳健,并且是可微的,它们可以像传统的数值线性代数程序(如用来求解线性系统的程序)一样使用。利用凸建模作为新算法开发的构建块,可以实现简单、高效且灵活的算法。
在1939年至1948年期间,Leonid Kantorovic、George Dantzig和John Von Neumann提出了线性规划和对偶性相关的约束优化基本概念[39]。大约在同一时期,Karush-Kuhn-Tucker(KKT)条件被确立,明确了解决约束优化问题时“最优解”的含义[24]。当时,实践者集中于在新引入的计算机上实现数值优化算法,而理论家则将注意力转向约束优化领域的有用分类法。1983年,苏联科学家Nemirovski和Yudin首次正式提出,解决凸优化问题与解决一般非线性优化问题之间存在实质性的复杂度差异[22]。1980年代,稳健的内点方法开始出现,能够在多项式时间内解决一般的凸优化问题[116]。随着数值线性代数、算法发展和更快计算机的进步,到2000年代,凸优化已经成熟并准备好在日常应用中使用。诸如CVX [63]、CVXPY [40]和Convex.jl [179]等建模工具使得凸优化变得易于使用,它们通过将用自然数学语法描述的问题转化为商业和开源求解器可以解决的形式,使凸优化变得更加易于应用。
在2010年代后期,[7]和[5]的研究使得能够对针对通用问题参数的凸优化问题进行求导。如今,凸优化求解器被视为经过充分理解和可靠的可微函数,可广泛应用于各类任务中。
第四章对一个经典的大气进入引导框架(可追溯到阿波罗计划)进行了更新,结合了凸优化,达到了最先进的性能。在4.2中,以一种在文献中不常见但更适合数值优化的形式,讨论了进入飞行器在任意大气中的动力学。在此基础上,详细描述了基于凸优化的创新型“凸预测-修正进入引导”(CPEG)算法,该算法在4.4节中用于大气引导。CPEG的性能在一组现实的初始条件下进行了验证,并在4.5节中验证了收敛性。
第五章在第四章的基础上进行扩展,介绍了CPEG的更新变种,能够在进入过程中直接考虑大气不确定性。CPEG中的引导框架通过引入一个能够进行大气估计的估算器来增强,并对控制器-估算器堆栈进行了调整,以实现对飞行器的鲁棒实时控制。该算法在现实的火星大气条件下进行测试,消融研究验证了大气适应的重要性。
第六章利用基于凸优化的运动规划器,通过加权支杆的驱动实现纳米卫星空间望远镜的精确控制。传统上,航天器指向控制是通过反作用轮来完成的,这些转子通过旋转来转移角动量。由于这些轮子存在缺陷,振动会传递到望远镜,导致图像质量下降。本章介绍了一种基于慢速旋转长支杆的新型驱动策略,这一策略显著不同于常见的快速旋转反作用轮。在已知纳米卫星轨道和地球磁场的情况下,凸优化运动规划器能够直接推理未来的扰动,从而仅通过支杆实现精确的姿态控制。该技术在一个精确的空间望远镜上得到演示,在日全食期间需要进行长时间曝光,而支杆不会超过其驱动极限。
第七章提出了一种新的碰撞检测方法,能够提供统一框架和光滑的可微性。传统上,两个凸形状之间的碰撞检测是通过求解两形状之间的最近点来完成的。这个问题对于许多常见的凸体是定义明确且容易解决的,但对于接触的形状,这个方法是不可微的,因此需要采用不同的算法。我们的方法利用了一个不同的框架:通过凸优化求解两形状之间的最小均匀缩放,从而导致它们的交集。这个问题很小,确保定义良好且没有退化情况。结果凸优化问题的解是平滑且可微的,无论物体的配置如何,且该方法可用于指定代表性运动规划中的碰撞避免约束。
第八章通过利用第七章相同的框架扩展了连续碰撞检测。离散碰撞检测检查两个静态凸形状是否发生碰撞,而连续碰撞检测必须考虑形状在运动时的问题。传统上,离散碰撞检测向连续碰撞检测的过渡需要对算法进行大幅修改,并增加一些限制条件。相反,第七章的框架通过引入时间参数进行了扩展,利用另一个定义良好的凸优化问题来解决连续碰撞信息问题。该方法同样是完全可微的,并且在碰撞-free运动规划示例中得到了验证,证明了离散碰撞检测不足以避免接触。
第九章详细介绍了一种在线学习广义线性模型的简单而高效的框架,涉及到连接器插入问题。在这个应用中,插入公连接器到母插座中由于材料的变形、配合的紧密性以及未知的摩擦性质而成为一个难以模拟的挑战。为了避免学习一个完整的动态仿真器,本研究仅学习控制信号、估计状态和腕部安装的力矩传感器之间的关系。这个关系通过广义线性模型表示,从而使得模型学习问题变得凸且定义明确。为了解决这个问题,提出了线性模型学习(LML)算法,通过仅使用矩阵-向量操作来递归地在线学习全局最优的估计模型。在没有任何矩阵求逆的情况下,该算法在GPU上非常有效,能够快速高效地学习大规模线性模型。
第十章探讨了刚性点云上准动态仿真的性能,并扩展了常见的公式,以包括真实接触的必要扭矩摩擦。当与刚性点云发生接触时,单点接触无法提供真实的扭矩摩擦,这种摩擦源自于现实中存在的接触面补丁。为了解决这一问题,对基于优化的仿真框架进行了修改,自然地引入了与法向力成比例的扭矩摩擦项。结果的仿真步骤通过凸优化计算,因此完全可微。所得到的仿真器用于抓取具有真实接触动力学的高保真点云。
第十一章介绍了一种轨迹束方法,用于使用黑箱仿真器、成本和约束条件进行高精度轨迹优化。现有的基于模型的轨迹优化方法能够访问问题中所有成本、动力学和约束函数的导数。在许多情况下,这是一个合理的假设,但对于许多具有挑战性的机器人任务(如涉及非光滑接触交互的任务),这些导数可能无法获得、计算昂贵或不可靠。为了解决这个问题,轨迹束方法通过对当前迭代点进行插值来近似这些函数。这种插值的近似方法无需导数,并且其线性化不同于标准的一阶泰勒级数。使用这种近似方法,提出了一个凸优化问题,最小化这些插值函数以计算步进方向,直到收敛。
通过将可微凸优化作为一种稳健的技术,本论文为机器人多个领域提供了简单且高效的算法,并保证了可预测和安全的性能。通过将这些问题重构为优化优先的方式,得到的算法通常比传统方法更简单、更高效,同时具有模块化和可配置性。




关于我们

数据派THU作为数据科学类公众号,背靠清华大学大数据研究中心,分享前沿数据科学与大数据技术创新研究动态、持续传播数据科学知识,努力建设数据人才聚集平台、打造中国大数据最强集团军。




新浪微博:@数据派THU

微信视频号:数据派THU

今日头条:数据派THU