本文主要讨论了关于人形机器人的意义、应用及其发展的多方面观点,包括人形机器人的优势、挑战以及为何研究人形机器人的原因。同时,文章还介绍了不同领域专家对机器人发展的看法和期待。
文章讨论了为何人形机器人在多功能方面更受欢迎,如既可以扫地又可以擦玻璃、收拾桌子等,从而说明了人形机器人在现实生活中的实用性。
文章提及学术界对于人形机器人技术发展的看法,包括其好处和挑战,以及当前对于人形机器人形态选择的考量。
文章指出国内人形机器人发展受益于国家政策支持,很多高校、研究所都在积极申请相关项目,机器人公司也崭露头角。
文章最后介绍了如何加入3D视觉交流群,并提到了星球上的学习资源。该部分旨在建立一个学习和交流的平台,为从事相关领域研究的人员提供帮助。
点击下方
卡片
,关注
「3DCV」
公众号
选择
星标
,干货第一时间送达
添加小助理:cv3d001,备注:方向+学校/公司+昵称,拉你入群。文末附3D视觉行业细分群。
扫描下方二维码,加入
「3D视觉从入门到精通」知识星球
(
点开有惊喜
)
,星球内凝聚了众多3D视觉实战问题,以及各个模块的学习资料:
近20门独家秘制视频课程
、
最新顶会论文
、计算机视觉书籍
、
优质3D视觉算法源码
等。想要入门3D视觉、做项目、搞科研,欢迎扫码加入!
以下文章来源于知乎,计算机视觉life整理
https://www.zhihu.com/question/438931655
悬臂型,半球型,是不是更便于应用?
回答一:来自zhebaoer
扫地机器人渗透率早就超过所谓阈值了,为什么没有像手机一样啊大爆发?
因为他就没那么有用。
哪怕它最本职的扫地,他干的也只能说马马虎虎。
取代保洁阿姨?想太多了。
保洁阿姨还可以摆放桌子上的物品,可以擦玻璃,可以刷水池刷马桶,主任要求的话还可以叠衣服收到衣柜里。
就上面这些功能点,随便一个做出来都可以去找投资人要一个小目标。
但是!重点来了
,你不可能要求消费者为这些功能,每一个都单独花几千块买一个机器人!
消费者能接受的是一个完成好多功能的机器人,起码不能只会做一样。
那么回到问题,如果要做一个既能扫地,又能擦玻璃,收拾桌子的机器人,该做成什么样式呢?
你会发现,人形是最合适的。
因为我们身边的桌子,椅子,水池。。。都是按照人体尺寸设计的。
机器人必须做成人形 ×
人形机器人有很大前景 √
回答二:来自
分布式星际减熵机
马斯克做人形机器人的最底层原因是
第一性原理
。根据第一性原理,首先,机器人做成人形就能用人的视频数据训练机器的AI,其次,人类的工具都是适应人的。第二点别的回答都讲烂了,我就讲讲第一点。
现代人工智能最需要的方法就是
深度学习
,目前看,基本一切传统基于符号的人工智能方法要么和深度学习结合了,要么被深度学习代替了。
而深度学习的学,基本上可以看成模仿,除了RL。RL是人给定奖励分数的分配方法,让AI从头思考如何获取最多的分数。
但是RL有个很大的问题,就是对于一个白纸一般的AI,他没有任何经验,一切从头开始,只能靠不断试错积累经验。所以一般训练机器人,需要用和机器人形状类似的能动主体的视频来先训练AI出一个大体的样,这里用到的方法就叫模仿学习,是一种监督学习方法。之后再用RL微调。
基于RL的方法,还有一种自带经验的,就是基于世界模型的RL。世界模型就是用视频训练一个在经验上包罗万象的模型,让AI一出生就自带经验。但是这种方法需要有模型,而模型也是来自于类似的视频。所以要想低成本快速训练机器人,不可能逃得开人类视频。
回答三:来自
BinBasher
我先后和十几台工业机器人打过交道。
体会就是,那个四关节悬臂编程真的想呕血,如果能直接让它照着我的动作学就好了。
所以,
人型机器人最强的优势,那就是其实它可以是一个人的“数字孪生”。和现在AI技术结合,简直是天生的双生树
。
陪伴什么的都是次要了。以后可能就是我们的大脑统一保管在一个容器里收集电信号,然后自己的孪生机器人在大街上晃荡
回答四:来自Erik
补充一下,今年(2023)国家拨了很大一笔经费支持人形机器人的全方位发展(包括关键零部件设计制造到大模型),乘着这股东风,国内很多高校、研究所都在积极申请相关项目,很多机器人公司也突然崭露头角,人形机器人突然间就火了。
个人觉得,人形机器人研究的确能推动相关领域的发展,但是人形机器人作为一个产品为社会生产提供助力还遥遥无期。
下面是原回答:
这是一个很有意思的问题。
学术界的一般说法是,人型有
两个好处
:
1,人类社会中的绝大多数建筑、设施、工具等都是为了方便人的使用而设计的。因此,如果要造一台
通用
的机器人,那么
直观
上就应该是人型机器人。
2,普遍认为,人类与人型机器人更容易有
情感
上的交流,人型机器人会让人类感觉到亲近。可以参考
恐怖谷效应
中那个曲线的第一段上升部分。
其实,这个问题的有意思之处不在于上面提到的原因,而在于原因背后的逻辑。
我在叙述上面两点原因时,加粗标注了三个关键词:
通用,直观,情感
。其中情感可以合并到通用里面,通用就是指
多功能
。
我们想让机器人更加通用,而选择人型,但事实上,我们现在并没有一套技术,能够制造一台很通用的机器人。而且当大程度改变一种构型,相关技术要求差别很大。因此我们实际上没有办法去科学严谨地证明人型就是最好的选择,可能三条腿五只胳膊更好也说不定,只能直观上认为人型好。
因此,现实中,我们的确因为上面两点理由选择研究人型机器人,但同时我们也的确没有在逻辑上完全合理的理由选择人型。
那为啥非要研究人型?不研究不行吗
1,我们有研究大型复杂机器人的科研欲望和需求。在这个前提下,我们必须选择一个形态去研究,尽管我们还没有逻辑上完全合理的理由,但相比选择其他构型或者自己设计一个新的构型,人型也的的确确是一个不错的选择,它至少还有上面两点理由可以宣传,而且人型也是一个统一的模板,方便同行之间比较。
2,人是造物主最完美的作品,我们心底一直有着挑战造物主权威的渴望。
下面摘几个我参与人型机器人项目时发生的几个对话:
“为啥相机要装在头部,装在xxx不是更方便吗?”
“因为人的眼睛长在头上”
“为啥要在手上装相机,人手上也没有眼睛啊”
“为了方便”
其实选择人型和研究大型复杂机器人两者之间是一个鸡生蛋蛋生鸡的问题。你得先选好构型才能研究技术,而研究的技术往往会纠正构型的选择。因此当前阶段,选择人型其实不是也不必要是完美的选择。科学家的事未必都是科学的,从无到有的创造,往往有几次拍脑袋做的决定。
本文仅做学术分享,如有侵权,请联系删文。
3D视觉交流群,成立啦!
目前我们已经建立了3D视觉方向多个社群,包括
2D计算机视觉
、
最前沿
、
工业3D视觉
、
SLAM
、
自动驾驶
、
三维重建
、
无人机
等方向,细分群包括:
工业3D视觉
:相机标定、立体匹配、三维点云、结构光、机械臂抓取、缺陷检测、6D位姿估计、相位偏折术、Halcon、摄影测量、阵列相机、光度立体视觉等。
SLAM
:视觉SLAM、激光SLAM、语义SLAM、滤波算法、多传感器融合、多传感器标定、动态SLAM、MOT SLAM、NeRF SLAM、机器人导航等。
自动驾驶
:深度估计、Transformer、毫米波|激光雷达|视觉摄像头传感器、多传感器标定、多传感器融合、3D目标检测、路径规划、轨迹预测、3D点云分割、模型部署、车道线检测、Occupancy、目标跟踪等。
三维重建
:3DGS、NeRF、多视图几何、OpenMVS、MVSNet、colmap、纹理贴图等
无人机
:四旋翼建模、无人机飞控等
2D计算机视觉
:图像分类/分割、目标/检测、医学影像、GAN、OCR、2D缺陷检测、遥感测绘、超分辨率、人脸检测、行为识别、模型量化剪枝、迁移学习、人体姿态估计等
最前沿
:具身智能、大模型、Mamba、扩散模型、图像/视频生成等
除了这些,还有
求职
、
硬件选型
、
视觉产品落地、产品、行业新闻
等交流群
添加小助理: cv3d001,备注:
研究方向+学校/公司+昵称
(如
3D点云+清华+小草莓
), 拉你入群。
▲长按扫码添加助理:cv3d001
3D视觉工坊知识星球
「3D视觉从入门到精通」知识星球
(
点开有惊喜
)
,已沉淀6年,星球内资料包括:
秘制视频课程近20门
(包括
结构光三维重建、相机标定、SLAM、深度估计、3D目标检测、3DGS顶会带读课程、三维点云
等)、
项目对接
、
3D视觉学习路线总结
、
最新顶会论文&代码
、
3D视觉行业最新模组
、
3D视觉优质源码汇总
、
书籍推荐
、
编程基础&学习工具
、
实战项目&作业