讲一个顶会顶刊高频主题:
物理信息强化学习
。近日顶刊IEEE TSE(一区)上还发表了相关成果,提出了一种基于约束强化学习的PIRL方法,计算速度大幅提升。
PIRL属于PIML与强化学习
的交叉领域,结合了物理规律的严谨性与强化学习的灵活性,在数据稀缺领域(如航空航天)、动态复杂系统(如湍流控制)、工业自动化等场景表现相当突出。
所以这方向无论
在理论创新还是工业落地上都很受欢迎
,当下还有很多创新思路可搞,比如
方法论融合(如物理约束的奖励设计)、跨领域应用(如医疗机器人)和算法优化(如并行训练)
...没idea的同学可考虑。
本文整理了物理信息强化学习
12篇
最新前沿成果
,有代码的都贴上了,需要参考的可无偿获取。
扫码添加小享,
回复“
物理强化
”
免费获取
全部论文+开源代码
Physics-informed reinforcement learning for optimal control of nonlinear systems
方法:
论文提出了一种无需模型的物理信息强化学习算法,通过引入Lyapunov稳定性定理和策略迭代算法的收敛条件,利用物理信息神经网络分别逼近值函数和控制策略,旨在解决具有输入约束的非线性系统的最优控制问题。
创新点:
-
提出了一种结合物理信息的强化学习算法,用于解决具有输入约束的非线性系统的最优控制问题。
-
开发了一种不依赖于非线性系统的第一性原理或数据驱动模型的强化学习算法,通过迭代学习过程获取接近最优的控制策略。
-
提出了一种新方法,通过设计初始神经网络结构,自动化推导初始可行控制策略。
A robust integrated multi-strategy bus control system via deep reinforcement learning
方法:
本文提出了一种基于物理信息深度强化学习(DRL)的公交多策略控制系统,通过融合历史数据和实时交通信息,动态调整公交车的停留时间、车速和信号优先权,有效缓解公交串行问题,显著提高公交运行效率和稳定性。
创新点:
-
提出了一种基于分布式深度强化学习(DRL)的多策略融合方法,用于动态公交控制。
-
引入了一种物理信息驱动的DRL状态融合方法,以及一个定制的奖励函数,通过集成先验物理知识来提升多策略控制的效率。
-
开发了一种高效的基于分布式近端策略优化(DPPO)的学习程序,用于训练公交控制模型。
扫码添加小享,
回复“