专栏名称: 3D视觉工坊
1、OpenCV的技术传播; 2、3D点云与重建技术; 3、Vslam技术; 4、深度学习; 5、技术干货分享。
目录
相关文章推荐
界面新闻  ·  哪吒系列电影总票房刷新中国影史纪录 ·  昨天  
KnowYourself  ·  这件事情没想清楚,再相爱也不建议结婚 ·  3 天前  
什么值得买  ·  过年胖10斤?这几款养生茶帮你刮油解腻! ·  3 天前  
51好读  ›  专栏  ›  3D视觉工坊

Transformer杀入机器人领域,来了解谷歌具身智能开山之作RT1

3D视觉工坊  · 公众号  ·  · 2024-12-25 07:00

正文

具身智能的发展已经引起了广泛关注,并有潜力带来革命性的变革,李飞飞的Voxposer、谷歌的RT1和RT2、谷歌的RTX、字节跳动的Robot Flamingo、斯坦福的ACT和卡耐基梅隆的3D_diffuser_act,均在不同任务和场景中展示了强大的能力。其主要包括:
机器人决策能力的提升 :大模型的发展使得机器人在决策能力上接近人类水平。结合深度学习和多模态感知技术,大模型赋予机器人更强的理解和互动能力,能够在动态和复杂的环境中自主完成各种任务。
机器人操作能力的质变 :大模型的引入实现了机器人操作的质变,使得机器人能够更精准地执行复杂任务。通过视觉大模型帮助理解环境,语言大模型负责将任务分解,具身大模型生成可执行的行为轨迹及代码,机器人在环境交互感知、自主规划、决策和行动方面取得了显著进展。
开发效率的提升 :以前,编写驱动机器人操作的代码需要耗费大量人力和时间,而现在得益于大模型的发展,机器人能够自主生成代码并完成操作,极大地降低了人工代价,提高了效率。

为了让想要快速进入该方向的同学快速入门,工坊联合木木老师和宇哥,为大家准备了这套具身智能课程。本课程从 学术研究和实际应用 两方面,带你从零入门具身智能的 原理学习、论文阅读、代码梳理 等内容。课程由具身智能领域的资深专家主讲,他们先后担任研究所、国企、大厂具身智能负责人,拥有丰富的理论知识和实践经验。


课程亮点

  • 本课程从学术研究和实际应用两方面,带你从零入门具身智能的原理学习、论文阅读、代码梳理等内容。

  • 课程由具身智能领域的资深专家主讲,他们先后担任研究所、国企、大厂具身智能负责人,拥有丰富的理论知识和实践经验。

以下是本课程的部份ppt内容:




学后收获

  • 入门具身智能领域:掌握具身智能的基础知识和核心技术。

  • 科研能力提升:从论文阅读、代码复现到发现问题、提出改进的全面科研入门。

  • 代码精通:逐行注释具身智能相关代码,掌握每个实现细节,动手复现并作改进。

  • 顶会研究:通过系列专题分析,发掘顶会idea并作出SOTA工作。

  • 收获高薪offer:进入具身智能风口领域,收获高薪offer。

还能收获

  • 优质学习圈子 :学员大多来自985、211及海外院校硕博,互相学习、讨论与研究,未来学习与就业的宝贵资源。







请到「今天看啥」查看全文