专栏名称: AIGC开放社区
专注AIGC(生成式人工智能)领域的专业社区,关注GPT-4、百度文心一言、华为盘古等大语言模型(LLM)的发展应用和落地,以及国内LLM的发展和市场研究,社区秉承共建、共享、开放的理念,提供对社区会员有价值的商业化思路和服务。
目录
相关文章推荐
987私家车广播  ·  恭喜!他们结婚了 ·  13 小时前  
987私家车广播  ·  恭喜!他们结婚了 ·  13 小时前  
译中人  ·  神仙外企! 虚幻引擎招聘社交媒体经理 ·  17 小时前  
阳光海南网  ·  今日开抢!海口又一场演唱会官宣 ·  3 天前  
阳光海南网  ·  今日开抢!海口又一场演唱会官宣 ·  3 天前  
51好读  ›  专栏  ›  AIGC开放社区

能做鬼脸、摇滚、自拍,听懂你说的话!GPT-4驱动的实体机器人

AIGC开放社区  · 公众号  ·  · 2024-01-18 08:07

正文

专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和 应用 落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!

东京大学的研究人员将GPT-4模型,集成在实体机器人Alter3中,可将文本、语言直接转化成机器人动作,例如,做一个自拍动作;装一个“鬼样”;做一个摇滚音乐动作等, 就连微笑、眨眼这样的面部表情动作也没问题

在GPT-4的帮助下,Alter3建立了语言反馈系统,可通过语言指令优化机器人的运动,而无需修改任何代码,在传统机器人领域是很难做不到。

Alter3接到指令后,做了一个摇滚动作

也就是说, Alter3突破了传统的硬件编码限制,可以实现知识存储、 动作 优化和0样本学习等 。在不需要为机器人的每个身体部位进行编程的情况下,可自动生成新的动作序列,完成自我迭代。

简单来说,可以把GPT-4看成是Alter3的“大脑”。大语言模型的海量知识的能力可以使Alter3,完成很多之前需要特定代码才能完成的动作。怎么感觉有点像施瓦辛格的“终结者”呢?

论文地址:https://arxiv.org/abs/2312.06571

Alter3在装一个“鬼样”

Alter3 简单介绍

Alter3是Alter系列的第3代实体机器人,整体结构采用前后分离式设计。主控制部分包含43个微调关节和马达,可实现细腻流畅的各部位动作控制。

Alter3采用了空气驱动技术来控制每个关节来执行指定运动,刷新率为100—150毫秒

相比电动马达,空气驱动能保证动作流畅平稳,响应更快速。 同时也提高了可靠性和维修保养便利性。 例如,当马达出问题时,只需更换单独部件而不影响整体性能。

表情部分对应人脸部位,包括眼睛、眉毛、嘴巴等,也由马达驱动实现丰富的面部表情变化。面部组件可以单独拆装,实现灵活配置。

Alter3视觉系统采用4个高清摄像头,分别安装在头部两侧和眼部内部 。头部摄像头主要用于人体姿态跟踪和面部识别分析等任务。

Alter3在自拍







请到「今天看啥」查看全文