专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
目录
相关文章推荐
爱可可-爱生活  ·  //@爱可可-爱生活:AI编程正在推动软件开 ... ·  昨天  
爱可可-爱生活  ·  【llama3_interpretabili ... ·  3 天前  
新智元  ·  美国教授痛心:UC伯克利GPA ... ·  3 天前  
爱可可-爱生活  ·  【Grunty:基于Claude的电脑控制A ... ·  4 天前  
51好读  ›  专栏  ›  爱可可-爱生活

本文提出了一种基于状态级安全约束和受控不变集的多智能体强化学习框-20241126054420

爱可可-爱生活  · 微博  · AI  · 2024-11-26 05:44

正文

2024-11-26 05:44

本文提出了一种基于状态级安全约束和受控不变集的多智能体强化学习框架及MADAC算法,该算法保证收敛到广义纳什均衡,并在实验中显著优于现有安全MARL算法,实现了奖励最大化和安全约束的最佳平衡。
[LG]《Safe Multi-Agent Reinforcement Learning with Convergence to Generalized Nash Equilibrium》Z Li, N Azizan [MIT] (2024) 网页链接 #机器学习##人工智能##论文#