专栏名称: 商学院
《商学院》杂志由中国社会科学院主管,中国社会科学院工业经济研究所主办,《中国经营报》社有限公司出版。在这里你可以直通全球22家知名商学院校,这是一座开在你身边的《商学院》。
目录
相关文章推荐
51好读  ›  专栏  ›  商学院

鲶鱼已至,DeepSeek加速具身智能时代的到来

商学院  · 公众号  ·  · 2025-03-27 08:29

正文

请到「今天看啥」查看全文


DeepSeek加速具身智能时代的到来.jpg

提升具身智能的自主性与适应性是DeepSeek带来的重大意义,其先进算法和计算能力使具身智能系统能够在复杂、动态的环境中自主学习和决策,减少对人类干预的依赖,推动其在家庭、医疗、工业等领域的广泛应用,加速智能化进程。





文| 王雅迪

ID | BMR2004

DeepSeek,这家成立不到两年的科技公司,在过去两个月内,因推出的V3及R1大模型具有低成本、高性能以及完全开源的优势,成为风靡全球的大模型产品。这一条“鲶鱼”彻底搅动了国内大模型的“内卷”,推动中国AI产业向前迈出了一大步。


此前以OpenAI为代表的大语言模型催化了具身智能的发展,而DeepSeek的推理能力则为具身智能行业带来了新的解法和思路。算力和数据是具身智能行业面临的普遍难题,尤其对于初创公司来说,DeepSeek打开了顶级模型训练的大门,所有人形机器人都可以沿着 DeepSeek的技术路线重新训练属于具身智能的模型,真正的具身智能时代正加速到来。


01

让具身智能更“聪明”


作为一种基于深度学习和数据挖掘技术的智能搜索与分析系统,与传统搜索引擎不同的是,DeepSeek不仅仅依赖于关键词匹配,而是通过深度学习模型理解数据的上下文语义,从而实现更智能化的搜索与分析。


其他大模型多采用Transformer架构,而DeepSeek在此基础上进行了创新,引入了MLA(多头潜在注意力)机制和混合专家MoE架构来实现高效的推理和成本效益高的训练。其他通用大模型泛化能力具有优势,适合多场景覆盖,但在专业垂直领域往往需要额外微调或知识增强,同时普遍存在API调用成本较高的问题。


工业和信息化部赛迪研究院人工智能与大数据研究中心常务副总经理邹德宝向《商学院》杂志指出, DeepSeek在自然语言处理(NLP)和复杂推理方面的优势可以迁移和应用到具身智能的环境感知、任务理解和决策制定中 ,主要通过几种方式实现:


一是环境感知。DeepSeek的NLP能力可以帮助具身智能系统理解和处理来自不同传感器的多模态数据(如视觉、听觉、触觉等)。通过自然语言描述,系统可以更准确地解析环境信息,例如将视觉数据与语言描述结合,提升对场景的理解。


二是任务理解。DeepSeek的NLP能力可以帮助具身智能系统理解复杂的自然语言指令,并将其分解为可执行的子任务。例如,当接收到“请把桌子上的杯子拿到厨房”的指令时,系统能够解析出“定位杯子”“抓取杯子”“导航到厨房”等步骤。DeepSeek的复杂推理能力使系统能够理解任务背后的上下文和意图。例如,系统可以根据对话历史或环境状态推断出用户的隐含需求,从而更准确地执行任务。


三是决策制定。DeepSeek的复杂推理能力可以帮助具身智能系统在动态环境中进行高效的决策和规划。例如,系统可以通过推理选择最优路径或动作序列,以完成任务并避免障碍。DeepSeek的强化学习和自适应算法使系统能够在执行任务过程中不断优化决策策略。


此前,在具身智能的发展中,受限于硬件、软件、环境复杂性、成本效益等多方面的限制,人形机器人在物理交互、环境感知、运动控制等方面的表现很难接近人类水平,平地摔跤、主动撞击障碍物、突然“起舞”等奇葩行为令人啼笑皆非。


在邹德宝看来,提升具身智能的自主性与适应性是DeepSeek带来的重大意义,其先进算法和计算能力使具身智能系统能够在复杂、动态的环境中自主学习和决策,减少对人类干预的依赖,推动其在家庭、医疗、工业等领域的广泛应用,加速智能化进程。


02

降低厂商自主开发的门槛


大模型好比具身智能的“大脑”,机器人能否理解并顺畅执行复杂的任务,很大程度上取决于“脑子”好不好使。人形机器人厂商在选择“大脑”时,一般有两种选择,要么自主开发模型,要么与大模型厂商合作,而这两种方式都存在一定的制约。


自主开发模型自然会更贴近厂商的要求,选择更适用于自身机器人的大模型,但训练成本,如硬件成本(GPU和TPU等高性能计算资源)、数据成本(数据获取、人工标注等)、人才成本等十分高昂;此外还涉及多个复杂环节,需要综合考虑技术、资源和长期投入。


据国盛证券估算,大型语言模型单次训练成本少则200万美元,多则达到1200万美元。华为AI首席科学家田奇曾公开透露,其中60%是电费,AI是不折不扣的超级“电老虎”。


因此,相比于自主开发,不少机器人厂商会选择与OpenAI、Google、华为等大模型厂商合作的方式。 具身智能的“大脑”如何运转会高度依赖于合作厂商,这种技术依赖一定程度上会限制机器人厂商的开发节奏和效果,同时依旧会受厂商成本制约。 DeepSeek的到来改变了这一局面!


据悉,DeepSeek-R1训练成本仅557万美元,不足OpenAI同类产品的5%,却能在数学竞赛、代码生成等任务中超越GPT-4模型。这意味着DeepSeek-R1以较低的算力成本投入,也能实现高性能产出,即模算效率较高。


模算效率指AI模型的训练和推理过程中用来衡量模型精度与计算资源利用效率的综合指标,它反映了模型在特定硬件平台上,以最小的算力消耗实现最高精度的能力。


更重要的是,DeepSeek通过开源把自己先进的AI技术开放给机器人厂商,相关厂商可基于此进行二次开发,从而构建自主技术闭环,拿回在核心技术上的主动权。


清华大学人工智能国际治理研究院战略与宏观研究项目主任、《技术经济与管理研究》总编辑刘典向《商学院》杂志表示,DeepSeek通过开源策略加速了技术创新,降低了技术门槛,吸引了众多开发者参与,这不仅促进了具身智能技术的发展,还为安全领域提供了丰富的资源。从推动行业整体发展的角度看,降低成本和开源策略的协同作用最为重大,这使更多企业能够进入具身智能领域,加速了技术的普及和应用。


尽管DeepSeek-V3模型现在优惠期结束,价格回调,但仍具性价比,更重要的是由此引发的大模型降价潮还在继续。2月13日,百度宣布文心一言将于4月1日全面免费开放。此前,文心一言采取基础版免费、专业版收费的模式,专业版定价59.9元/月,连续包月优惠价49.9元/月。Meta、OpenAI等国外头部大模型厂商也在变相降价,如OpenAI宣布GPT-4.5/5将很快陆续发布,且免费版ChatGPT将在标准智能设置下无限制使用GPT-5进行对话。


价格战的背后是技术实力的比拼,机器人厂商不仅可以定制自己的大模型,而且可以拥有更多主动权来选择适合自己的大模型厂商进行合作,这会倒逼相关厂商不断优化模型性能和服务质量,以满足用户的需求和期望。


03

垂直行业高质量数据集的获取


目前,大模型在数据获取方面面临多重挑战,例如,通用模型可能过度依赖新闻、百科等公开文本,缺乏专业领域数据(如医学、法律),影响垂直场景应用效果;许多大模型依赖历史数据训练,难以及时获取最新信息,导致模型输出过时。这些都为高质量数据集的建设提出了挑战。


2024年12月30日,智元机器人联合上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,正式开源百万真机数据集AgiBot World。该数据集迅速引发行业广泛关注,其原因正是因为高质量数据集对于人形机器人技术的发展尤为重要,但高质量数据稀缺问题存在已久。


邹德宝表示,在具身智能的发展过程中,数据获取、处理和利用确实是关键挑战,DeepSeek恰恰可以帮助解决这些难题。


在数据获取方面,DeepSeek可以实现多模态数据采集、仿真环境生成以及人机交互数据。例如,DeepSeek可以集成多种传感器(如摄像头、麦克风、触觉传感器等),实现多模态数据的同步采集,通过NLP和计算机视觉技术,系统能够从复杂环境中提取丰富的信息;利用先进的仿真技术生成高质量的虚拟环境,用于训练具身智能系统;通过与人类的自然交互,DeepSeek可以收集大量的实际应用数据。


在数据处理方面,DeepSeek的先进算法可以自动化地进行数据清洗、标注和增强,提高数据质量。例如,通过自动标注工具,系统可以快速生成高质量的标注数据,用于训练感知模型。DeepSeek的多模态数据处理能力也可以将来自不同传感器的数据进行融合,提升环境感知的准确性。同时,DeepSeek的高效计算架构可以实现实时数据处理,使具身智能系统能够快速响应环境变化。例如,自动驾驶场景下,该架构可实时处理传感器数据并做出决策。


在数据利用方面,DeepSeek通过强化学习与自监督学习、迁移学习、知识图谱与推理等方式挖掘数据价值。例如,DeepSeek可以利用强化学习和自监督学习算法,从大量未标注数据中提取有用的信息,如通过自监督学习,系统可以从视频数据中学习物体的运动模式,用于改进导航和抓取任务。同时DeepSeek可以构建知识图谱,将分散的数据整合成结构化的知识,用于复杂推理和决策。

由于在数据获取和处理方面拥有的独特优势, DeepSeek为更多垂直领域提供了获取行业专有数据集的可能,这为机器人厂商研发在细分领域的具身智能产品提供了更大空间。


据不完全统计,截至2月14日,已有包括比亚迪、广汽、长安、吉利、奇瑞在内的约20家车企官宣与DeepSeek深度融合,智能座舱中的人机交互成为DeepSeek上车后聚焦的首个应用场景。邮储银行、北京银行、江苏银行等多家金融机构也率先引入DeepSeek,推动银行的数字化转型和智能化升级。


04

潜在风险的冷思考


DeepSeek的开源模式促进了技术的传播和共享,降低了技术门槛,推动了具身智能领域的创新和发展。然而,随着具身智能拥有更强的自主性与决策性,新的伦理挑战与安全风险需要前置性的关注。


邹德宝认为,在伦理方面,主要风险包括一是责任归属问题。当具身智能系统在自主决策过程中出现错误或造成损害时,责任归属可能变得复杂;二是偏见与歧视也不容忽视,如果训练数据存在偏见,具身智能系统在决策中可能会表现出歧视性行为。在安全方面,具身智能系统可能存在软件或硬件漏洞,容易被恶意攻击者利用;高度自主的具身智能系统在特定情况下可能出现不可预测的行为,导致安全事故。


此外,随着DeepSeek可以获取更加多元和真实的数据,在隐私方面存在风险,如具身智能系统在运行过程中会收集大量用户和环境数据,存在隐私泄露的风险;收集的数据可能被滥用,用于未经授权的监控或商业用途;通过多模态数据融合,具身智能系统可能具备强大的身份识别能力,增加隐私泄露的风险。


据光明网报道,1月27日,DeepSeek宣布因基础设施遭受“大规模恶意攻击”,暂停新用户注册。此次攻击中,疑似出现了数据泄露问题。


刘典表示, 未来5—10年,具身智能治理领域最迫切需要解决的问题包括数据安全与隐私保护、伦理道德规范、技术标准与规范等。 DeepSeek可以通过技术研发,提供更安全、可靠的技术解决方案,如加强数据加密和隐私保护技术。同时,DeepSeek可以与行业内的其他企业和机构合作,共同制定具身智能的技术标准和伦理规范。此外,DeepSeek还可以通过开源社区和培训等方式,提高公众对具身智能的认知和理解,促进具身智能的健康发展。


技术狂飙带来的惊涛骇浪,让DeepSeek展现了突破行业壁垒、重塑产业智能化的巨大潜力。然而,技术突进往往伴随着暗流涌动,如何在开放协作与合规安全之间找到平衡,或将决定其生态扩展的边界。


来源 | 2025年2&3月合刊


图片


图片


图片

图片


版权声明:“商学院”所推送的文章,除非确实无法确认,我们都会注明作者和来源。部分文章推送时未能与原作者取得联系。若涉及版权问题,烦请原作者联系我们,与您共同协商解决。联系方式: 18513373688,商务合作请加微信18513373688。



获取商界新鲜资讯、聆听大佬领导“心经”
揭秘大公司里的“未可知”
直通全球22家知名商学院校


21周年.jpg







请到「今天看啥」查看全文