情报内容无法这里发布,但每天都有大量精选内容发布在朋友圈,有兴趣的可以加一下,XV:itouzi8888
HW业务定位:
HW明确表示只做“脑赋能”, 提供机器大脑,即通过HW云负责大模型相关业 务。同时,数字能源部门负责机器人续航,车BU 则共享无人驾驶视觉技术用于机器人视觉。而所 有其他硬件技术都转至极目。
极目定位与发展:
极目定位为研发公司卡脖子零 部件,以及掌握在全球领先的关键性技术零部 件。自2024 年11 月HW以云名义召开产业大会 后,极目开始接手硬件相关对接工作,并于12 月 增资,人员逐步到位。
赛力斯角色:
赛力斯并非单纯代工商,最终机器人产品会打赛力斯的牌子 。 HW 为 其 提 供 包 括 云、数字能源、极目等多部门支持,类似一 个“孵化器”。赛力斯自身具备大产线,可进行 调整修改,能进行重资产投资,且通过与HW合 作可引入其他厂家资源供HW观摩学习。
小脑运控:
小脑运控部分准确来说由各主机厂自 己做,HW目前倾向与如雷赛、固高等做运动方 面研究的公司合作,暂时不会直接切入。因小脑 直接控制动作,涉及运动机械学,复杂度高,还 需自编程指令。不过HW未来可能会研究小脑与 运控,先通过与供应商合作推出整体方案,后续 再考虑逆向研究相关技术。
大模型规划:
HW云的模型做法相对简化,分为 中小模型系统S1 和超大模型系统S2,大模型系 统负责解释视频、语言等。而盘古大模型是三个 阶层,涵盖多种场景,采用5+N+X 分类方式, 方便前端机器人接入。HW每年大概会有一次结 合机器人的大模型发布,一般在第三季度左右, 特殊情况可能两次。
数据采集:
HW的数据采集方式与特斯拉不同, 基于大模型和机器人运动控制组合,同步进行现 实与仿真模拟。仿真数据因成本低,在与部分企业合作中占比较高,如与乐聚合作中,大众使用 的仿真数据占比达百分之七八十。而像宇树更注 重现实态模拟。关于是否从第三方公司采买数据 细节暂未透露,但会与合作伙伴联合定制开发数 据以提高场景通用度。
极目卡脖子环节遴选:
极目针对机器人硬件卡脖 子环节进行遴选,虽目前提及众多供应商,但尚 未确定最终通用机器人的零部件供应商,需待第 三季度发布会后确定。HW虽认为机器人领域无 绝对卡脖子环节,但对自身而言,运动学相关技 术尚未完全掌握,需通过极目筛选接触相关供应 商,再决定自主研发或外包。
硬件选用原则:
硬件选用会综合考虑性能与客户 成本,目前处于各供应商送样测试阶段,尚未确 定最终使用哪些硬件。对于如六维力供应商考 察,极目在低调进行相关工作,6 - 7 月赛力斯样机下线时,HW将与赛力斯合作进行脑植入等工 作。
Q:HW云、极目和赛力斯这三家公司大致的合 作关系是怎样的?
A:HW做机器人强调只做脑赋能,即由HW云负 责大模型。数字能源负责车和机器人的续航。车 BU 共享无人驾驶的视觉技术用于机器人视觉。 其他剩下的所有硬件技术都转到了极目。极目刚 开始的定位是研发公司所有卡脖子的零部件(不 一定生产),以及在全球有领先关键性技术的零 部件。从2009 年开始涉足无人驾驶领域(机器 人视觉)时,软件由云慢慢接手,硬件前期由 2012 实验室和中央研究院硬件部门联合做,车 BU 是从2012 实验室和中央研究院孵化出去的, 2024 年11 月以云的名义召开产业大会,很多硬 件对接工作实际由极目后续完成,去年12 月极目增资,人手逐步到位去接手硬件相关事情。
A:小脑运控这一块准确的说在每个主机厂,也 就是他们自己做。因为运动控制的复杂度太高, 要进行切片,大脑分析描述出大场景,再通过小 脑变成小场景,最后通过前端芯片控制变成微动 作,基本采用三级方式进行细化。
Q:HW是否做小脑部分,如果做,在赛力斯、 极目、HW云里放在哪里?
A:HW应该暂时专门只做大脑部分,小脑前端的 运动部分由机器人本体厂商去做。如果要合作, 会找做运动方面研究的公司,如雷赛、固高等, 因为这部分复杂度高,比零部件的复杂度还高。
Q:找第三方运控厂商做,其他主机厂如小米、 奇瑞是否大概率自己做?
A:如果是深度合作,HW会慢慢掌握这些技术。 HW找很多零部件供应商,一方面是合作定制零 部件,另一方面对于有技术难度的部分,HW过 几年有能力慢慢学到手。
Q:市面上运控做得比较好的公司采用的思路是 怎样的?
A:特斯拉的思路是重复模仿人类动作达到要 求,这是通过算法小模型直接进行训练,增加各 种传感器进行负反馈,再将训练方式标准化,是 最简单的运控方式,但人类达不到的动作它也达 不到。波士顿动力的方式是让机器人自己产生指 令并进行精准控制,和后期大脑结合最紧密,但 复杂度太高。
Q:小脑做的好,是要和HW云(大脑)耦合得 好,还是要和硬件耦合得好才算成功?
A:要和硬件耦合得比较好。从大脑到小脑,会 有语音、视觉等产生很多指令集片段输入到小脑,再变成精简指令集转化为动作。动作种类繁 多且细致,动作与小脑结合是复杂问题。HW之 后也会和相关厂家结合,参考学习,迟早会掌握 这项关键技术。
Q:HW云在模型上的规划是怎样的,包括做哪 几类模型以及时间节奏如何?
A:HW云有S1 和S2 两个系统,S2 大模型系统 负责解释视频、语言等,采用多模型穿插形式, 八千多万个参数进行编解码和向量分解、动作规 划等。而盘古大模型是三个阶层,大模型涵盖语 音、图像等,下面分大场景、小场景。其采用5 加N 加X 的分类方式,5 种是多模态系统,涵盖 主流大模型,N 是场景,X 是细节场景,方便前 端机器人接入,这种模型方式适用于各行业和家 庭。
A:结合机器人这一块,从现在看每年会有一次 发布,一般在第三季度左右,5 - 6 月份或者8 - 9 月份发布可能性较大,特殊情况下可能有两次 发布。因为要通过和生态合作伙伴训练来填满N 种 场 景 和 X 种 细 化 场 景 , 这 是 个 耗 时 耗 力 的 过 程。
A:和特斯拉不同,特斯拉是基于动作捕捉和数 据驱动,即跟人学习。我们是基于大模型和机器 人的运动控制组合的方式,既可以在仿真环境里 给机器人产生结合环境的视频让其学习,也有实 际运动对比,现实和仿真系统模拟同步进行以优 化准确性。
A:仿真这一块是近两年新技术,像和乐聚合作 很多用仿真做,主要考虑成本,大众约百分之七八十先用仿真;而宇树更在乎现实态模拟,直接 在现实场景中做,投入高但最准确精确。
Q:是否从第三方公司采买老人数据集,比如从 杭州聚合科技公司?
A:这种细节不方便透露,但合作伙伴的训练数 据在系统上有保留,未来和赛力斯等合作时,为 提高场景通用度,会联合做一些定制或开发。