今天分享的是机械设备行业
深度研究报告:《
人形机器人专题:视觉传感器-人形机器人视觉感知交互硬件
》
(报告出品方:中邮
证券
)
报告共计:
18
页
要点
视觉传感器助力人形机器人感知世界。视觉传感器,即机器视觉,旨在利用机器来执行视觉识别和判断任务。人类约80%的信息是通过人眼感知获取的,未来的机器人也将和人类一样,大量信息都将通过视觉感知获取。目前,不少人形机器人选用30视觉方案以保证人形机器人的环境感知及交互能力。未来随着人形机器人的不断发展,其交互功能及应用场景更加丰富之后,现阶段纯摄像头方案的厂商也有可能通过选代更新,在其新产品中引入30视觉传感器。
机器视觉是由计算机或困像处理器以及相关设备来模拟人的视觉行为,完成得到人的视觉系统所得到的信息。其下游应用广泛,主要可发挥定位、识别、测量、检测等功能,目前主要下游为智能制造的工业场景,医学、智能交通等场景也有应用。机器视觉的产业链上游主要有光源、镜头、工业相机、工控机、图像处理软件等机器视觉组件设备的提供商:产业中游包括如检测、测量、定位、识别系统/定位引导系统等以及各类视觉设备:产业链下游主要为各行业的产线综合解决方案供应商终端行业。我国机器视觉市场现阶段正处于快速增长阶段,到 2027年有望突破560亿规模。
机器视觉技术按照成像维度的不同,可以划分为20和3D两大类别。20 成像技术使用到的传统RGB相机,仅能捕捉到物体表面的纹理信息,没有物体到相机的距离信息,30视觉感知技术有效地补充了20视觉技术的不足,使得更加复杂和智能的功能得以实现。3D视觉感知技术主要包括飞行时间(TOF)法、双目立体视觉法、结构光法等。机器视觉产品按照下游应用场景的性能要求,可以大致分为消费级和工业级两类。工业级机器视觉对于技术、精度、稳定性等的要求相对更高,整体成本较高。消费级视觉方案对于精度的要求相对较低,对于成本控制的需求较高。现阶段人形机器人进入规模量产阶段,对视觉方案的需求更关注于产能供应和成本控制两方面,推测消费级3D视觉产品有望成为需求主流。随着未来人形机器人应用场景的复杂化及多元化之后,不排除需求工业级机器视觉产品的可能性。
人形机器人的视觉实现
视觉传感器助力人形机器人感知世界
视觉传感器,即机器视觉,旨在利用机器来执行视觉识别和判断任务。在工业生产中,机器视觉的引入旨在提升效率、减少误差、降低成本,并从繁重或危险的工作环境中解放人力。根据图像数据的维度,机器视觉在工业中的应用可分为二维(2D)和三维(3D)两大类,主要功能包括识别、测量、定位和检测。其中,识别功能的实现相对简单,而检测功能则相对复杂。2D 技术能够获取平面图像,并在二维空间内定位目标,但其无法提供物体的三维信息,如高度和体积,且易受光照变化和物体运动的影响。相比之下,3D 技术能够提供更全面的物体信息,并在三维空间内定位目标,从而实现更为复杂的功能,如人脸识别和 30建模。尽管 3D 技术在数据处理和存储方面仍存在挑战,但它在许多应用场景中展现出独特的优势。
未来的人形机器人将会拥有语音感知交互能力(““嘴巴”和“耳朵”)、视觉感知交互能力(“眼睛”),以及各种 A| 决策分析能力(“大脑”)。人类约 80%的信息是通过人眼感知获取的,未来的机器人也将和人类一样,大量信息都将通过视觉意知获取。现实物理世界是三维的,发展多年的20成像技术难以完整重现各类三维场景,3D 视觉感知技术则可以让终端获取更多精准的三维信息,助力各类终端更好地看懂三维世界。
人形机器人主要视觉方案
目前,国内外已经有众多人形机器人厂商发布了产品样机,领先厂家甚至已经开始规模量产的规划。可以看到,不少人形机器人选用30视觉方案以保证人形机器人的环境感知及交互能力。
Boston Dynamics的Atlas采用RGB 摄像头+ToF 深度相机,优必选采用 RGBD+双目相机,傅利叶的 GR-1 采用深度相机,开善勒的先行者系类采用 3D 视觉+鱼眼环视相机,小米的 CyberOne 配备了自研空间视觉模组+A! 交互相机。大部分案例均使用 3D 视觉传感器,各类型的深度相机被广泛使用,部分厂商的方案同时搭配了激光雷达,如 Agility Robotics 的 Digit、字树的 H1、智元的远征 A1等。也有少部分厂家仅使用摄像头作为视觉传感器的方案,如特斯拉的0ptimus,其视觉感知系统则主要基于特斯拉FSD的计算机模组和方案,面部配备8个汽车同款 Autopilot 摄像头,最远监测距离可达250 米,还有1X Technologies 的前一代产品 EVE 配备全景摄像头,新一代NE0 的具体硬件方案暂未可知。
未来随着人形机器人的不断发展,其交互功能及应用场景更加车害之后,现阶段纯摄像头方案的厂商也有可能通过速代更新,在其新产品中引入30视觉传意器。