专栏名称: 3DCV
关注工业3D视觉、SLAM、自动驾驶技术,更专注3D视觉产业的信息传播和产品价值的创造,深度聚焦于3D视觉传感器、SLAM产品,使行业产品快速连接消费者。
目录
相关文章推荐
销售与市场  ·  2024年度营销案例红黑榜Top30 ·  15 小时前  
中国航务周刊  ·  浙江海港、福建港口与莆田市政府三方签约 ·  3 天前  
中国航务周刊  ·  我国又一大港部署DeepSeek ·  3 天前  
中国航务周刊  ·  外运集运东南亚新航线,2月22日即将起航! ·  3 天前  
廣告狂人  ·  格力改名,市场部天塌了! ·  3 天前  
51好读  ›  专栏  ›  3DCV

Transformer杀入机器人领域,来了解谷歌具身智能开山之作RT1

3DCV  · 公众号  ·  · 2025-02-14 11:00

正文

具身智能的发展已经引起了广泛关注,并有潜力带来革命性的变革,李飞飞的Voxposer、谷歌的RT1和RT2、谷歌的RTX、字节跳动的Robot Flamingo、斯坦福的ACT和卡耐基梅隆的3D_diffuser_act,均在不同任务和场景中展示了强大的能力。其主要包括:
机器人决策能力的提升 :大模型的发展使得机器人在决策能力上接近人类水平。结合深度学习和多模态感知技术,大模型赋予机器人更强的理解和互动能力,能够在动态和复杂的环境中自主完成各种任务。
机器人操作能力的质变 :大模型的引入实现了机器人操作的质变,使得机器人能够更精准地执行复杂任务。通过视觉大模型帮助理解环境,语言大模型负责将任务分解,具身大模型生成可执行的行为轨迹及代码,机器人在环境交互感知、自主规划、决策和行动方面取得了显著进展。
开发效率的提升 :以前,编写驱动机器人操作的代码需要耗费大量人力和时间,而现在得益于大模型的发展,机器人能够自主生成代码并完成操作,极大地降低了人工代价,提高了效率。

为了让想要快速进入该方向的同学快速入门,工坊联合木木老师和宇哥,为大家准备了这套具身智能课程。本课程从 学术研究和实际应用 两方面,带你从零入门具身智能的 原理学习、论文阅读、代码梳理 等内容。课程由具身智能领域的资深专家主讲,他们先后担任研究所、国企、大厂具身智能负责人,拥有丰富的理论知识和实践经验。


课程亮点

  • 本课程从学术研究和实际应用两方面,带你从零入门具身智能的原理学习、论文阅读、代码梳理等内容。

  • 课程由具身智能领域的资深专家主讲,他们先后担任研究所、国企、大厂具身智能负责人,拥有丰富的理论知识和实践经验。

以下是本课程的部份ppt内容:




学后收获

  • 入门具身智能领域:掌握具身智能的基础知识和核心技术。

  • 科研能力提升:从论文阅读、代码复现到发现问题、提出改进的全面科研入门。

  • 代码精通:逐行注释具身智能相关代码,掌握每个实现细节,动手复现并作改进。

  • 顶会研究:通过系列专题分析,发掘顶会idea并作出SOTA工作。

  • 收获高薪offer:进入具身智能风口领域,收获高薪offer。







请到「今天看啥」查看全文