专栏名称: AI科技大本营

为AI领域从业者提供人工智能领域热点报道和海量重磅访谈；面向技术人员，提供AI技术领域前沿研究进展和技术成长路线；面向垂直企业，实现行业应用与技术创新的对接。全方位触及人工智能时代，连接AI技术的创造者和使用者。

共筑智能应用新生态！OpenCV 之父领衔岳麓对话，2024 1024 程序员节正式开幕

AI科技大本营 · 公众号 · · 2024-10-24 23:16

正文

站在 2024 年的技术浪潮之巅，我们见证着一个前所未有的变革时代：具身智能让机器有了“躯体”，大模型则为软件塑造了真正的“大脑”，开源创新持续释放着技术红利。在这场波澜壮阔的智能革命中，开发者正扮演着关键角色，用代码构筑着人类社会的智能未来。

顺应这一历史机遇，第五届 1024 程序员节于 10 月 24 日在世界计算·长沙智谷盛大启幕。这场由湖南省工业和信息化厅、湖南湘江新区管理委员会、长沙市工业和信息化局、长沙信息产业园管委会和 CSDN 联合打造的年度技术盛会，已然成为观察全球技术创新趋势的重要窗口。作为“IT 技术与产业发展的创新风向标”，本届大会联动北京、上海、深圳、杭州、成都、济南、西安、武汉等八大城市，共同打造一场覆盖全国的技术盛宴。

2024 1024 程序员节以“智能应用新生态”为主题，构建岳麓对话、技术英雄会、十多场主题峰会以及赛事、展览、开发者之夜等版块，盛邀 200+ 位国内外技术翘楚共话创新未来，探寻智能时代的发展密码，协力打造中国研发技术的新范式。

岳麓对话作为每届大会的开幕重头戏，此次选定了两大前沿主题：一场由计算机视觉传奇人物、OpenCV 创始人 Gary Bradski 领衔的机器人领域专家天团，以《十问具身智能与机器人》为题剖析智能交互新格局；另一场则邀请到产学研三界的人工智能技术专家，共同围绕大模型技术能力进化、应用场景及产业未来，展开了一场引人深思的《十问 AI 大模型》对话。

聚焦智能新未来，岳麓对话重磅开启

本届岳麓对话上，长沙市委副书记、湖南湘江新区（长沙高新区）党工委书记、岳麓区委书记谭勇，湖南省工业和信息化厅二级巡视员李红亮，湖南湘江新区（长沙高新区）党工委委员、管委会副主任王先民，湖南湘江新区（长沙高新区）党工委委员、党政综合部部长谭海，湖南湘江新区宣传工作部部长、岳麓区委常委、宣传部部长刘雄辉，长沙信产园（长沙高新区麓谷产业园）党工委书记肖勇军，长沙信产园（长沙高新区麓谷产业园）党工委副书记、管委会主任夏河年以及省工信厅、市工信局、新区党政综合部、科技创新和产业促进局、商务和市场监管局和长沙信产园（长沙高新区麓谷产业园）相关负责同志出席活动。

在大模型如火如荼发展的今天，应用落地成为了推动行业进步的关键命题。长沙作为拥有着丰富的产业集群的城市，更是在科技创新方面走在了时代的前沿。北京的大模型生态，则以其强大的研发能力和创新精神，引领着国内乃至国际的人工智能发展趋势。

顺应这一趋势，来自两地的代表共同完成了一场具有里程碑意义的“长沙产业与北京大模型生态拉手仪式”。北京大模型生态代表为北电数智商业化负责人荆慧，硅基流动联合创始人袁进辉，智谱副总裁吴玮杰；长沙产业代表为拓维信息 AI 事业部总经理倪悝，长沙谱蓝网络科技有限公司董事长蔡立，长沙人工智能中心总经理龚锡铭；企业代表为 CSDN 高级副总裁李炯明受邀共启（企业名称按类别及拼音排序）。长沙与北京在人工智能领域的深度合作将为两地产业发展注入新的活力与动力。仪式完成之际，长沙市委副书记、湖南湘江新区（长沙高新区）党工委书记、岳麓区委书记谭勇宣布本届 1024 程序员节正式开幕。

长沙产业与北京大模型生态拉手仪式

首先，中国工程院外籍院士、德国国家工程院院士张建伟进行了视频连线。紧接着，CSDN 创始人&董事长、开放原子开源基金会理事蒋涛在题为《AGI 时代的软件生态》的演讲中指出，我们正在从确定性计算、人工编码、传统交互转向概率计算、机器生成代码和自然语言交互的大模型时代。蒋涛以现场编程演示的方式，展示了新时代程序员的软件开发范式。通过 InsCode 工具，他完全使用自然语言进行编程，体现了从”写代码“到”描述需求“的开发模式革新，不仅让 80 - 90% 的代码可由 AI 生成，更有望让人人都能开发个性化应用，形成新的”全民应用“生态。

蒋涛 CSDN 创始人、董事长，开放原子开源基金会理事

OpenCV 创始人 Gary Bradski 带来 " OpenCV5 and Spatial Intelligence " （OpenCV5 和空间智能）的前沿分享，揭示空间智能的发展前景，以及他对 AGI 的前瞻见解。他提出，空间智能应对标人脑的"WHAT（识别）"、"WHERE（定位）"和"WHY（因果）"三大系统，这三个系统在人脑中是分开但又相互配合的。例如，看到一个杯子倒下（WHAT），我们能判断它的运动轨迹（WHERE），并预测它会摔碎（WHY）。

Gary 强调，OpenCV 将从简单的3D对象检测和定位开始，逐步构建支持物理和因果推理的完整空间智能框架。他期望先实现 WHAT 和 WHERE 的结合，比如让安防系统既能检测到异常物体，又能定位其在 3D 空间中的位置。而更复杂的 WHY 系统，即对物理规律和因果关系的理解，则留待未来发展。

Gary Bradski OpenCV 创始人

华为首席开源联络官、CNCF 基金会董事任旭东以《共筑开发者生态，共赢智能时代》为题，分享生态发展和开源创新的深度洞察。任旭东认为，AI 的发展将迎来开发者增长的下一个爆发期，同时在开源的推动作用下，AI 的生态发展可能更快到达临界点。在此趋势下，华为积极参与全球开源贡献，深耕智能时代下的核心基础软件，构建 AI 领域关键组件，提供一个强大的技术栈和多项开发者激励计划，以支持开发者实现高效的应用开发。任旭东指出，未来开源社区的代码流动性和人才汇聚效应将形成“新质”生产力，促进万亿产业集群的发展。

任旭东华为首席开源联络官、CNCF 基金会董事

作为长沙新生代程序员的代表，七月在线创始人、七月大模型与机器人技术总负责人周磊登台发声，展现长沙新一代开发者的创新活力。周磊表示，他曾在北京创业八年，2023 年 ChatGPT 大火，令他决定在长沙从零组建大模型项目开发团队，从此开启了他在长沙新的创业故事。在长沙的研究、生活、工作和创业中，他分享了 4 大心得：做研究，不会错失前沿；生活上，不用过于焦虑；工作上，各地办公室整体联动；创业上，见证了公司开拓。

周磊七月在线创始人、七月大模型与机器人技术总负责人

十问具身智能与机器人，共探人机新交互

从艾伦·图灵（Alan Turing）、罗德尼·布鲁克斯（Rodney A. Brooks）到李飞飞，人类始终在探索着一个根本性的命题：如何赋予机器以类人的感知与认知能力。如今，随着计算机视觉、多模态交互等技术的突破性进展，具身智能正从实验室的理论构想逐步走向现实应用，在工业制造、社会服务等广泛领域展现出革命性的应用前景。这不仅是一场技术创新的浪潮，更预示着人机协作范式的根本性转变，开辟了通向通用人工智能的关键路径。

在南京清湛人工智能研究院执行院长、清湛智造总经理杨磊的主持下，本届岳麓对话汇聚了计算机视觉与机器人领域的顶尖专家，以《十问具身智能和机器人》为题，围绕具身智能的本质定义、人形机器人发展路径、多模态感知机制、数据采集与仿真、长期任务规划，以及人机协作的伦理边界展开深度探讨。

作为 2024 年人工智能领域的焦点概念，具身智能的定义在对话开始便引发了与会专家的思想交锋。与过去的机器人进行对比，工信部人形机器人专家组组长、国地共建人形机器人创新中心首席科学家江磊认为具身智能最明显的三个作用是感知、思考与进化：“过去的机器人主要依赖控制理论，通过代码执行固定任务，局限性明显。具身智能则很有想象空间，具备感知、思考和进化的能力，通过学习才实现对这个世界的探索，这正是具身智能带给我们最大的解决方案，也给未来带来了广阔的应用前景和展现空间。”

中科慧灵 CTO 马世奎对具身智能进行了本质的系统性思考： “具身智能重点在于'具身'，强调智能行为和物理实体间的紧密关系。在完成任务目标的导向下，要将感知、理解、记忆、决策、行动形成闭环。机器人应该成为人类的伙伴和助手，能适应复杂环境变化，理解人类意图并实现默契协作，但也要保持在特定领域、可控范围内发展，而不是追求在各方面超越人类。 ”

Roboraction.AI CEO 黄浴指出了具身智能和 ChatGPT 等大语言模型的核心差别： “具身智能的核心在于环境交互能力，它能主动影响环境并从环境获取反馈，通过这种双向互动来理解动态环境并积累智能。这种方式类似于人类婴儿的成长过程，也可能是通向通用人工智能的必由之路。 ”

OpenCV 创始人 Gary Bradski 则从概念本源出发，细致区分了空间智能与具身智能的关系：“空间智能关注定位和三维建模，而具身智能的核心是感知。人类即便在睡眠中也保持着身体感知与思考，清醒时能自然连接外部感知与内存信息，通过持续迭代认知模型来构建理解。” 他还引用了柏拉图的名言：「人类内部精神与外部世界的相对隔离，恰使我们建立了独立认知。」由此，Gary 指出具身智能的关键在于实现类人的模型迭代与持续学习，在内外世界间建立起韧性认知桥梁。

随后，专家们就人形机器人发展前景、多模态学习机制、伦理规范等议题展开了深入探讨。马世奎从技术实现角度指出，“在相应场景里，工业机器人机械臂仍是较好的选择，人形机器人是工业机器人的补充而非替代。”

面对具身智能复杂的数据问题，黄浴强调：“具身智能的数据挑战比视觉要难得多，因为其维度、多样性和演化空间都远超图像或语音。”

江磊从进化和认知的角度，提出了关于人形机器人的系统化思考：“具身智能应该分为三层：视觉的具身智能、手的具身智能和脚的具身智能。就像人类一样，双腿直立行走，大脑思考，双手操作，形成一个能交流对话、创造文明的整体。” 他特别强调，这种分层架构源于对人类智能发展的深入观察，“就像人类婴儿预置了基础行为模型，却需要在与环境互动中实现智能进化。”

然而，Gary Bradski 却对人形机器人的必要性提出了深刻思考。他指出：“在进化过程中，复杂形态是为了解决复杂问题，而现实生活中的大多数问题并未复杂到需要人形机器人的程度。” 他建议从更基础的角度理解具身智能和空间智能——首先要明确 WHAT（识别）以及 WHERE（定位）这两个根本问题。Gary 认为，通过设计适应世界的基础模型并进行仿真训练，也许能创造出形态更简单但依然有效的机器人。

最后，每位专家展望了具身智能在未来 5-10 年的发展愿景，纷纷送出寄语：

黄浴：“借助大模型和视觉语言大模型的突破，期待在未来几年看到护士机器人、家务机器人等真正的产品落地，成为人类工作生活的好助手。”

马世奎：“通过解决通用性和适应性这两个关键问题，让具身智能真正走进生活，在特定领域承担基础性工作，实现人机共融的社会。”

Gary Bradski：“人工智能和机器人是应对人口减少、环境恶化、气候变化等全球挑战的必要工具。它既可能帮助创造美好世界，也可能带来破坏，所以关键在于如何在道德伦理框架下发展。”

江磊：“我们即将推出类似无人驾驶L1到L4的分级分类标准，让具有有限自主能力的人形机器人在人类监督下逐步落地。我相信这是一个充满前景的产业，需要更多厂家共同参与标准制定，推动产业快速发展。”

十问 AI 大模型，共话产业新图景

自 ChatGPT 掀起全球 AI 革命浪潮以来，大模型技术持续快速迭代，从降本提效到应用落地，从算力突破到生态建设，一系列关键议题正考验着行业的智慧。在诺贝尔物理学奖、化学奖相继青睐 AI 研究的标志性时刻，探讨大模型的发展方向显得尤为重要。

在本届程序员节，岳麓对话邀请到产学研各界的顶尖大模型专家，在 CSDN 高级副总裁李建忠的主持下，四位嘉宾将从推理模型（OpenAI o1），智能体（Agent）以及多模态模型（Sora）这些 2024 年的新兴热潮技术作为切入点，展开《十问 AI 大模型》深度讨论。

共筑智能应用新生态！OpenCV 之父领衔岳麓对话，2024 1024 程序员节正式开幕

正文

请到「今天看啥」查看全文