专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
目录
相关文章推荐
爱可可-爱生活  ·  通过clustering based ... ·  2 天前  
字节跳动技术团队  ·  从0到1搭建 AI ... ·  4 天前  
字节跳动技术团队  ·  从0到1搭建 AI ... ·  4 天前  
爱可可-爱生活  ·  【Datago:Python友好的高性能数据 ... ·  4 天前  
宝玉xp  ·  挤牙膏了//@明风:大模型界的汪峰 ... ·  6 天前  
51好读  ›  专栏  ›  爱可可-爱生活

通过在actor-critic递归架构中使用卡尔曼滤波层进行序列-20240930051816

爱可可-爱生活  · 微博  · AI  · 2024-09-30 05:18

正文

2024-09-30 05:18

通过在actor-critic递归架构中使用卡尔曼滤波层进行序列建模,改进了部分可观测强化学习任务中的状态表示,尤其适用于需要状态不确定性推理的任务。
[LG]《Uncertainty Representations in State-Space Layers for Deep Reinforcement Learning under Partial Observability》C E. Luis, A G. Bottero, J Vinogradska, F Berkenkamp… [Technical University Darmstadt & Bosch Corporate Research] (2024) 网页链接 #机器学习##人工智能##论文#