站在 2024 年的技术浪潮之巅,我们见证着一个前所未有的变革时代:具身智能让机器有了“躯体”,大模型则为软件塑造了真正的“大脑”,开源创新持续释放着技术红利。在这场波澜壮阔的智能革命中,开发者正扮演着关键角色,用代码构筑着人类社会的智能未来。
顺应这一历史机遇,第五届 1024 程序员节于 10 月 24 日在世界计算·长沙智谷盛大启幕。这场由湖南省工业和信息化厅、湖南湘江新区管理委员会、长沙市工业和信息化局、长沙信息产业园管委会和 CSDN 联合打造的年度技术盛会,已然成为观察全球技术创新趋势的重要窗口。作为“IT 技术与产业发展的创新风向标”,本届大会联动北京、上海、深圳、杭州、成都、济南、西安、武汉等八大城市,共同打造一场覆盖全国的技术盛宴。
2024 1024 程序员节以“智能应用新生态”为主题,构建岳麓对话、技术英雄会、十多场主题峰会以及赛事、展览、开发者之夜等版块,盛邀 200+ 位国内外技术翘楚共话创新未来,探寻智能时代的发展密码,协力打造中国研发技术的新范式。
岳麓对话作为每届大会的开幕重头戏,此次选定了两大前沿主题:一场由计算机视觉传奇人物、OpenCV 创始人 Gary Bradski 领衔的机器人领域专家天团,以《十问具身智能与机器人》为题剖析智能交互新格局;另一场则邀请到产学研三界的人工智能技术专家,共同围绕大模型技术能力进化、应用场景及产业未来,展开了一场引人深思的《十问 AI 大模型》对话。
聚焦智能新未来,岳麓对话重磅开启
本届岳麓对话上,长沙市委副书记、湖南湘江新区(长沙高新区)党工委书记、岳麓区委书记谭勇,湖南省工业和信息化厅二级巡视员李红亮,湖南湘江新区(长沙高新区)党工委委员、管委会副主任王先民,湖南湘江新区(长沙高新区)党工委委员、党政综合部部长谭海,湖南湘江新区宣传工作部部长、岳麓区委常委、宣传部部长刘雄辉,长沙信产园(长沙高新区麓谷产业园)党工委书记肖勇军,长沙信产园(长沙高新区麓谷产业园)党工委副书记、管委会主任夏河年以及省工信厅、市工信局、新区党政综合部、科技创新和产业促进局、商务和市场监管局和长沙信产园(长沙高新区麓谷产业园)相关负责同志出席活动。
在大模型如火如荼发展的今天,应用落地成为了推动行业进步的关键命题。长沙作为拥有着丰富的产业集群的城市,更是在科技创新方面走在了时代的前沿。北京的大模型生态,则以其强大的研发能力和创新精神,引领着国内乃至国际的人工智能发展趋势。
顺应这一趋势,来自两地的代表共同完成了一场具有里程碑意义的“长沙产业与北京大模型生态拉手仪式”。北京大模型生态代表为北电数智商业化负责人荆慧,硅基流动联合创始人袁进辉,智谱副总裁吴玮杰;长沙产业代表为拓维信息 AI 事业部总经理倪悝,长沙谱蓝网络
科技有限公司董事长蔡立,
长沙人工智能中心总经理
龚锡铭;企业代表为 CSDN 高级副总裁李炯明受邀共启(企业名称按类别及拼音排序)。长沙与北京在人工智能领域的深
度合作将为两地产业发展注入新的活力与动力。仪式完成之际,长沙市委副书记、湖南湘江新区(长沙高新区)党工委书记、岳麓区委书记谭勇宣布本届 1024 程序员节正式开幕。
长沙产业与北京大模型生态拉手仪式
首先,中国工程院外籍院士、德国国家工程院院士张建伟进行了视频连线。紧接着,CSDN 创始人&董事长、开放原子开源基金会理事蒋涛在题为《AGI 时代的软件生态》的演讲中指出,我们正在从确定性计算、人工编码、传统交互转向概率计算、机器生成代码和自然语言交互的大模型时代。蒋涛以现场编程演示的方式,展示了新时代程序员的软件开发范式。通过 InsCode 工具,他完全使用自然语言进行编程,体现了从”写代码“到”描述需求“的开发模式革新,不仅让 80 - 90% 的代码可由 AI 生成,更有望让人人都能开发个性化应用,形成新的”全民应用“生态。
蒋涛 CSDN 创始人、董事长,开放原子开源基金会理事
OpenCV 创始人 Gary Bradski 带来 "
OpenCV5 and Spatial Intelligence
" (OpenCV5 和空间智能)的前沿分享,揭示空间智能的发展前景,以及他对 AGI 的前瞻见解。他提出,空间智能应对标人脑的"WHAT(识别)"、"WHERE(定位)"和"WHY(因果)"三大系统,这三个系统在人脑中是分开但又相互配合的。例如,看到一个杯子倒下(WHAT),我们能判断它的运动轨迹(WHERE),并预测它会摔碎(WHY)。
Gary 强调,OpenCV 将从简单的3D对象检测和定位开始,逐步构建支持物理和因果推理的完整空间智能框架。他期望先实现 WHAT 和 WHERE 的结合,比如让安防系统既能检测到异常物体,又能定位其在 3D 空间中的位置。而更复杂的 WHY 系统,即对物理规律和因果关系的理解,则留待未来发展。
Gary Bradski OpenCV 创始人
华为首席开源联络官、CNCF 基金会董事任旭东以《共筑开发者生态,共赢智能时代》为题,分享生态发展和开源创新的深度洞察。任旭东认为,AI 的发展将迎来开发者增长的下一个爆发期,同时在开源的推动作用下,AI 的生态发展可能更快到达临界点。在此趋势下,华为积极参与全球开源贡献,深耕智能时代下的核心基础软件,构建 AI 领域关键组件,提供一个强大的技术栈和多项开发者激励计划,以支持开发者实现高效的应用开发。任旭东指出,未来开源社区的代码流动性和人才汇聚效应将形成“新质”生产力,促进万亿产业集群的发展。
任旭东 华为首席开源联络官、CNCF 基金会董事
作为长沙新生代程序员的代表,七月在线创始人、七月大模型与机器人技术总负责人周磊登台发声,展现长沙新一代开发者的创新活力。周磊表示,他曾在北京创业八年,2023 年 ChatGPT 大火,令他决定在长沙从零组建大模型项目开发团队,从此开启了他在长沙新的创业故事。在长沙的研究、生活、工作和创业中,他分享了 4 大心得:做研究,不会错失前沿;生活上,不用过于焦虑;工作上,各地办公室整体联动;创业上,见证了公司开拓。
周磊 七月在线创始人、七月大模型与机器人技术总负责人
十问具身智能与机器人,共探人机新交互
从艾伦·图灵(Alan Turing)、罗德尼·布鲁克斯(Rodney A. Brooks)到李飞飞,人类始终在探索着一个根本性的命题:如何赋予机器以类人的感知与认知能力。如今,随着计算机视觉、多模态交互等技术的突破性进展,具身智能正从实验室的理论构想逐步走向现实应用,在工业制造、社会服务等广泛领域展现出革命性的应用前景。这不仅是一场技术创新的浪潮,更预示着人机协作范式的根本性转变,开辟了通向通用人工智能的关键路径。
在南京清湛人工智能研究院执行院长、清湛智造总经理杨磊的主持下,本届岳麓对话汇聚了计算机视觉与机器人领域的顶
尖专家,以《十问具身智能和机器人》为题,围绕具身智能的本质定义、人形机器人发展路径、多模态感知机制、数据采集与仿真、长期任务规划,以及人机协作的伦理边界展开深度探讨。
作为 2024 年人工智能领域的焦点概念,具身智能的定义在对话开始便引发了与会专家的思想交锋。与过去的
机器人进行对比,
工
信部人形机器人专家组组长、国地共建人形机器人创新中心首席科学家
江磊认为具身智能最明显
的三个作用是感知、思考与进化:“过去的机器人主要依赖控制理论,通过代码执行固定任务,局限性明显。具身智能则很有想象空间,具备感知、思考和进化的能力,通过学习才实现对这个世界的探索,这正是具身智能带给我们最大的解决方案,也给未来带来了广阔的应用前景和展现空间。”
中科慧灵 CTO 马世奎对具身智能进行了本质的系统性思考:
“具身智能重点在于'具身',强调智能行为和物理实体间的紧密关系。
在完成任务目标的导向下,要将感知、理解、记忆、决策、行动形成闭环。
机器人应该成为人类的伙伴和助手,能适应复杂环境变化,理解人类意图并实现默契协作,但也要保持在特定领域、可控范围内发展,而不是追求在各方面超越人类。
”
Roboraction.AI CEO 黄浴指出了具身智能和 ChatGPT 等大语言模型的核心差别:
“具身智能的核心在于环境交互能力,它能主动影响环境并从环境获取反馈,通过这种双向互动来理解动态环境并积累智能。
这种方式类似于人类婴儿的成长过程,也可能是通向通用人工智能的必由之路。
”
OpenCV 创始人 Gary Bradski 则从概念本源出发,细致区分了空间智能与具身智能的关系:“空间智能关注定位和三维建模,而具身智能的核心是感知。人类即便在睡眠中也保持着身体感知与思考,清醒时能自然连接外部感知与内存信息,通过持续迭代认知模型来构建理解。” 他还引用了柏拉图的名言:「人类内部精神与外部世界的相对隔离,恰使我们建立了独立认知。」由此,Gary 指出具身智能的关键在于实现类人的模型迭代与持续学习,在内外世界间建立起韧性认知桥梁。
随后,专家们就人形机器人发展前景、多模态学习机制、伦理规范等议题展开了深入探讨。马世奎从技术实现角度指出,“在相应场景里,工业机器人机械臂仍是较好的选择,人形机器人是工业机器人的
补充而非替代。”
面对具身智能复杂的数据问题,黄浴强调:“具身智能的数据挑战比视觉要难得多,因为其维度、多样性和演化空间都远超图像或语音。”
江磊从进化和认知的角度,提出了关于人形机器人的系统化思考:“具身智能应该分为三层:视觉的具身智能、手的具身智能和脚的具身智能。就像人类一样,双腿直立行走,大脑思考,双手操作,形成一个能交流对话、创造文明的整体。” 他特别强调,这种分层架构源于对人类智能发展的深入观察,“就像人类婴儿预置了基础行为模型,却需要在与环境互动中实现智能进化。”
然而,Gary Bradski 却对人形机器人的必要性提出了深刻思考。他指出:“在进化过程中,复杂形态是为了解决复杂问题,而现实生活中的大多数问题并未复杂到需要人形机器人的程度。” 他建议从更基础的角度理解具身智能和空间智能——首先要明确 WHAT(识别)以及 WHERE(定位)这两个根本问题。Gary 认为,通过设计适应世界的基础模型并进行仿真训练,也许能创造出形态更简单但依然有效的机器人。
最后,每位专家展望了具身智能在未来 5-10 年的发展愿景,纷纷送出寄语:
黄浴:“借助大模型和视觉语言大模型的突破,期待在未来几年看到护士机器人、家务机器人等真正的产品落地,成为人类工作生活的好助手。”
马世奎:“通过解决通用性和适应性这两个关键问题,让具身智能真正走进生活,在特定领域承担基础性工作,实现人机共融的社会。”
Gary Bradski:“人工智能和机器人是应对人口减少、环境恶化、气候变化等全球挑战的必要工具。它既可能帮助创造美好世界,也可能带来破坏,所以关键在于如何在道德伦理框架下发展。”
江磊:“我们即将推出类似无人驾驶L1到L4的分级分类标准,让具有有限自主能力的人形机器人在人类监督下逐步落地。我相信这是一个充满前景的产业,需要更多厂家共同参与标准制定,推动产业快速发展。”
十问 AI 大模型,共话产业新图景
自 ChatGPT 掀起全球 AI 革命浪潮以来,大模型技术持续快速迭代,从降本提效到应用落地,从算力突破到生态建设,一系列关键议题正考验着行业的智慧。在诺贝尔物理学奖、化学奖相继青睐 AI 研究的标志性时刻,探讨大模型的发展方向显得尤为重要。
在本届程序员节,岳麓对话邀请到产学研各界的顶尖大模型专家,在 CSDN 高级副总裁李建忠的主持下,四位嘉宾将
从推理模型(OpenAI o1),智能体(Agent)以及多模态模型(Sora)这些 2024 年的新兴热潮技术作为切入点,展开《十问 AI 大模型》深度讨论。