[LG] From Multimodal LLMs to Generalist Embodied Agents: Methods and Lessons
网页链接
本文提出了一种基于多模态大型语言模型的通用具身智能体GEA,通过学习型多具身动作标记器和两阶段训练(监督微调和在线强化学习),在多个领域实现了超越专用模型的泛化性能,展现了跨领域学习和在线强化学习的巨大潜力。
网页链接
本文提出了一种基于多模态大型语言模型的通用具身智能体GEA,通过学习型多具身动作标记器和两阶段训练(监督微调和在线强化学习),在多个领域实现了超越专用模型的泛化性能,展现了跨领域学习和在线强化学习的巨大潜力。