全球化的浪潮中,开源技术不仅成为了连接世界各地开发者的纽带,更成为了推动科技进步的重要力量。从程序员工作不可或缺的编程语言核心组件,到 App 开发的前沿探索,再到 AI 模型与基础设施、具身智能的革新,开源理念正引领着下一代互联网的发展,并深刻影响着未来的媒体形态与终端设备。
在这个背景下,10 月 17 日,由 GOSIM 开源创新汇主办,CSDN 承办的 GOSIM CHINA 2024 在北京·朗丽兹西山花园酒店火爆开场,为全球的技术爱好者们提供了一个无与伦比的交流、学习、实践平台。
大会现场汇聚了来自五湖四海的与会者,不仅有来自华为、Futurewei、智源、上海 AI 实验室、美国东北大学、清华大学、CodeGeeX、Eclipse、OpenCV 、月之暗面等国内外知名企业和组织的 160+ 行业领袖与技术专家,还有超过 1000 名的一线开发者与开源人才齐聚一堂,共同探讨开源生态系统的最新进展与未来趋势,共同见证了这一场技术的盛宴。现场人声鼎沸,气氛热烈,座无虚席,每一位参与者都充满了热情与期待。
AGI 时代,开源进行时!
在 Keynote 上,
GOSIM 发起人、CSDN 创始人&董事长蒋涛
指出,开源技术是推动数字化技术发展的核心引擎。同时,随着技术底座的成熟,应用的发展将经历从企业应用到生产力工具,再到个人乃至全民应用的演进过程。时下新的智能时代将催生第四代应用生态系统,其特点是通过对话而非传统 App 来访问服务,为此,大模型将成为操作系统的底座,手机将成为重要的应用入口,Agent 将成为新一代应用的核心。
蒋涛 GOSIM 发起人、CSDN 创始人&董事长
逐步迈向 AGI 时代之际,蒋涛认为,构建一个强大的开源生态系统至关重要。为此,他提出了三点建议:
-
构建 Open LLM Agent Alliance,旨在推动跨平台、跨应用的统一接口标准。
-
在工具和应用程序的商业模式方面,可以探索订阅制、收入分成以及模板市场等多种形式,以激励开发者创造高质量的工具和应用,同时也让用户能够便捷地获取所需资源。
-
在走向全球化的过程中,可尝试引入 Decentralized Developer IDs、Payment Primitives 技术,简化开发者身份验证流程并方便交易结算。
依托开源理念,行业中诞生了一批非常优秀的开源项目。
华为终端首席技术规划与预研专家周艳
此次分享了备受业界关注的 OpenHarmony 最新进展。截至 2024 年 10 月,OpenHarmony 凭借架构解耦与弹性扩展、异构并行与全栈协同、原生智能场景体验、纯净安全,以及极简开发与多端部署五大关键特征,已吸引超过 8,060 名社区贡献者、70 多家共建单位,累积了 1.1 亿行代码,并支持了 780 款软硬件产品。
周艳 华为终端首席技术规划与预研专家
基于 OpenHarmony,华为构建了成熟的移动解决方案,包括 HarmonyOS 生态系统,并在智能设备上推出了“1+8+N”战略,涵盖智能出行、家居、健康、办公及娱乐等多个领域。同时,通过精简 40% 的冗余代码,华为提升了系统的流畅度和能效比,同时保持了纯净与安全,由此发布了 HarmonyOS Next 版本。周艳透露,被称为“纯血鸿蒙”的 HarmonyOS Next,从 2023 年 8 月的企业开发者测试到 2024 年 10 月 8 日的公测,最终的商用产品计划于今年第四季度正式推出。
OpenCV 创始人、Rust 核心团队负责人领衔,六大技术论坛同步开启
本次大会特别设立了包括 AI 模型与基础设施、具身智能、下一代互联网、下一代媒体与终端、Rust 编程语言、App 开发等热点技术在内的主题论坛,更是邀请到了 60+ 海外技术嘉宾与国内 100 余位顶尖专家,通过思想碰撞与面对面的交流,带来一场国际化的技术饕餮盛宴,推动开源社区的繁荣与发展。
在「
AI 模型与基础设施
」论坛,潞晨科技联合创始人、CTO
卞正达
介绍了 OPEN-SORA,这是一个致力于实现高效且低成本的视频生成模型。来自北京智源人工智能研究院自然语言组算法专家的
王良栋
分享关于 Aquila 开源语言模型的实践经验,涵盖算法设计、预训练及对齐框架和数据集构建等多个方面。上海AI实验室高级工程师
高剑飞
展示了 InternLM 及其相关工具链的最新进展。
面对行业中很多人存在开放并不完全等于开源的困扰,美国东北大学电子与计算机工程系教授
王言治
带领团队在遵循开放科学、开源、开放数据和开放获取的原则上开发了真正的开源 LLM 模型 Moxin 7B。多模态大模型作为迈向通用人工智能的必由之路,清华大学研究员、MiniCPM-V项目作者
余天予
分享 MiniCPM-V 在解决多模态大模型如高昂部署成本、数据质量等问题上的策略。立足程序员日常编码难题,CodeGeeX 团队技术负责人
郑勤锴
介绍了该团队在支持代码自动补全与生成、代码解释等方面的工作。MeetKai Inc. Functionary 机器学习负责人
Musab Gultekin
讲解了如何通过函数调用来实现复杂的代理任务及其解决方案。最后,元象大模型算法负责人
轩文烽
分享了他们在研发过程中,从无到有,从密集模型到混合专家模型的技术探索。
「具身智能」是 AI 的重要分支之一,如今已成为科技界关注的焦点。在本主题论坛上,OpenCV 创始人
Gary Bradski
指出,作为已被广泛应用的图像处理和机器视觉算法的开源库,OpenCV 在“空间智能”领域展现了广阔前景。Eclipse Zenoh-Flow 开发负责人
Julien Loudet
分享了 AI 所需的强大通信骨干网——下一代通信中间件 Eclipse Zenoh。此外,Embodied AI 基金会执行董事
German Ros Sanchez
以 CARLA 开源仿真平台为例,展示了开源与具身智能结合的成果,包括促进社区参与、加速研究及提供适应性工具的经验。
随后,灵心巧手公司视觉 labs 负责人
David Cui
探讨了机器人自我进化的灵巧手如何成为开启具身智能大门的钥匙。深开鸿开源社区开发部总经理
巴延兴
介绍了基于 OpenHarmony 的机器人操作系统开源版的系统架构、技术特点及行业应用。重庆邮电大学自动化与机器人工程系主任
岑明
表示,设计一套通用的任务建模和执行方法对于实现功能型无人车的快速开发和部署具有重要意义。南京清湛人工智能研究院执行院长
杨磊
认为,在工业领域,行业虽然对数据驱动的机器人技术的需求不断增长,但我们也面临着诸如数据安全和系统互操作性等挑战。Roboraction.AI CEO
黄浴
在本次演讲中分析了具身智能行动的学习策略,并总结了必要具身 AI 数据集的要求。紧接着,围绕“是否能够开发一种端到端的机器人代理,不仅具备操作技能,还能有效纠正低级失败动作”这一难题,北京大学博士候选人
Jiaming Liu
分享了他的最新研究成果。
近年来,「Rust 编程语言」迅速成为全球开发者最为青睐的语言之一。在本主题论坛上,Rust 库团队负责人
Amanieu d'Antras
深入揭示了寄存器分配在 Cranelift 中的作用,并重点关注于其正在开发中的 regalloc3 版本。Rust Cargo 团队开发者
Ed Page
从维护者的视角出发,分享了如何有效地为 Rust 项目做出贡献的经验。不仅如此,Rust 编译器团队负责人
Nicholas Nethercote
也从外观、工作原理、内部结构及开发过程等角度,带来了他对 Rust 编译器全方位的理解。
接着,Rustdoc 团队负责人
Guillaume Gomez
展示了如何利用 rustc_tools crate 来编写自定义的 Rust 代码检查工具,并解释了编译器 API 的工作原理,还通过实例演示了其实用性。立足于社区贡献的重要性,Rust 错误处理项目组负责人
Jane Losare-Lusby
回顾了她作为 Rust 项目贡献者的经历,并分享了她在应对冒名顶替综合症、冲突解决、职业倦怠和孤独感等挑战方面的个人见解。随后,为了给与会者带来轻松愉快的交流体验,Rust-Lang 项目负责人
Josh Triplett
展开了一场炉边谈话式的采访和问答环节。波特兰州立大学计算机科学副教授
Bart Massey
则着眼于 Rust 教育领域,回顾了当前的教学资源状况,并探讨了 Rust-Edu 等组织如何进一步推动低级别编程教学,以满足不断增长的学习需求。最后,非凸科技首席架构师
乔丹
深入解析 Rust 程序不同链接方式在交易系统中的典型应用,并探讨了工作区、目标和箱子类型的基本概念。
在 AI、大数据等技术的影响下,App 开发正在面临着怎样的挑战与机遇?在「App 开发」主题论坛中,Dioxus Labs 创始人
Jonathan Kelley
介绍了 Dioxus 这一 Rust 框架,并强调了其原生移动支持、实时热重载以及自定义人工智能模型等特性。随着跨平台开发的需求日益增长,Dart 与 Flutter 产品经理
Kevin Moore
阐述了 Flutter 作为谷歌推出的开源 UI 工具包,是如何帮助开发者从单一代码库构建美观且原生编译的多平台应用程序。为了进一步模糊 Web 与原生应用之间的界限,Taffy 与 Blitz 核心贡献者
Nico Burns
随后带来了 Blitz 这一新型跨平台应用程序运行时,它不仅实现了“一次编写、随处运行”的理念,还能在部署至非 Web 平台时提供较小的占用空间和强大的系统集成能力。
从跨平台开发所面临的挑战出发,uni-app 跨端框架负责人、DCloud CTO
崔红保
分享了 uni-app 团队对原生、H5 和小程序性能优化的见解与实践。针对开发者普遍反映的编辑-构建-运行周期缓慢的问题,Wild Linker 项目负责人
David Lattimore
展示了 Wild 项目的进展,该项目专注于为 Rust 开发增量链接器和热代码重载功能,以大幅提升开发效率。接着,华为德累斯顿研究中心软件工程师、Corrosion 项目维护者
Jonathan Schwender
讲述了将用 Rust 编写的网络渲染引擎 Servo 移植到 OpenHarmony 的最新成果。最后,GenUI 框架作者、Makepad 框架贡献者的
盛逸飞
介绍了基于 Makepad 的声明式 Rust 跨平台框架 GenUI,它可以帮助开发者更高效地利用 Rust 语言进行前端项目开发。
在各种技术的快速演进下,互联网正迈向一个全新的时代。在「下一代互联网」主题论坛中,Good Robot 创始人
Alan Majer
探讨了去中心化技术如何为重建更加开放的平台提供新机遇。为了让互联网更好地服务于用户,牛津大学计算机科学系博士研究员
赵睿
认为以用户为中心的去中心化架构至关重要,由此分享了其团队对于扩展 Solid 边界所做的探索及未来展望。考虑到社交互动是互联网体验的核心部分之一,Salvo 与 Palpo 开源项目维护者
杨学成
带来了关于 Palpo 社交服务器的介绍,这是一个用 Rust 实现、支持 Matrix 协议的自托管社交解决方案。
紧接着,中山大学副教授
黄华威
阐述了从区块链到 Web3 的转变过程,并分享了其研究团队基于分片区块链构建的新 DeFi 协议 BrokerFi。面对去中心化网络中的实际应用问题,Futurewei 首席架构师
Kevin Boos
展示了 Robrix 这一多平台 Matrix 客户端及其功能。针对 Web3 领域面临的挑战,Flomesh 联合创始人
蔡书
提出了一个新的开发范式 Moxin,即通过去中心化的分发模型文件的方式专注于模型文件的高效、安全传输。同时,数据压缩也是提高网络加载速度的一项关键技术,基于此 Trifecta Tech 基金会系统软件工程师
Folkert de Vries
深入讲解了在 Rust 中实现即插即用式压缩算法的重要性。
在「下一代媒体与终端」主题论坛中,《编程 Rust》作者
Jim Blandy
从当前 GPU 编程的痛点问题出发,分享了他在 Rust 中利用 WGPU 进行现代 GPU 编程的独到见解。随后,华为图形标准高级研究员
蔡康颖
分享了 Khronos Vulkan 标准的最新进展,特别是一些新功能的演进和应用。Dimforge 创始人
Sébastien Crozet
则讲述了 WGMath 项目,该项目通过提供可重复使用的 WGSL 着色器,可将 GPU 科学计算引入所有跨平台环境。
聚焦于文字转视频领域,智谱 AI 算法工程师、CogVideoX 开源工作贡献者
张昱轩
重点介绍了 CogVideoX,一个专门为此而设计的大型扩散变换器模型。随着视觉内容创作需求的增长,Open-Sora-Plan 项目核心成员
程鑫华
分享了基于国产算力的视频生成大模型开源计划 Open-Sora Plan,并详述了项目的进展、细节及未来规划。面对数字人技术日益普及的趋势,FaceChain 创始人
孙佰贵
全方位解析了 FaceChain 的技术特点、社区建设、商业应用前景以及其在数字人领域的演进路径。另外基于三维渲染技术的发展,Pointrix 项目主要作者
陈林卓
介绍了一个可微分、基于点的渲染库 Pointrix,可为相关领域的研究和应用提供强有力的支持。
除此之外,围绕《可穿戴 AI:创新可用性、隐私性和交互方式》这一主题,OYMotion 工程副总裁
He Bin
,Gyges Labs 联合创始人兼首席人工智能科学家
綦思源
和 ADAPS 市场副总裁
侯昌韬
进行了一场精彩的圆桌讨论。
Triton&vLLM、仓颉编程语言、软件定义汽车等 9 场特色 WorkShop,动手实操
互动,解锁技术新乐趣
与传统的讲座不同,本次大会首日重磅同步开启 WorkShop 活动,让与会者可以亲身参与到研发、创新技术的讨论、实践与互动交流等环节中。通过这种方式,参与者能够在学习过程中提出问题、进行练习,甚至共同解决某个实际问题。
在 Triton&vLLM WorkShop 上,北京智源人工智能研究院副院长兼总工程师
林咏华
致开场词时表示,Triton 和 vLLM 正在引领 AI 推理技术的新篇章。北京智源人工智能研究院研发工程师
陈飞宇
指出,Triton 语言在对硬件的细粒度控制和编程复杂性之间找到了平衡,使得非 GPU 专家也能快速编写高性能内核。清华大学/加州大学伯克利分校博士生/访问学生
游凯超
概述了 vLLM 项目的起源、发展、支持的模型、硬件及功能,并展望了社区建设和近期计划。北京智源人工智能研究院研发工程师赵英利与吕梦思分享了 FlagScale 在基于 vLLM 框架进行多模态大模型压缩与推理的实际经验,重点讨论了 CFG Sampling 特性及多模态模型的极致压缩方法。北京智源人工智能研究院开源社区运营
田国伟
介绍了 Triton 中国社区开发者贡献计划。月之暗面工程副总裁
许欣然
讲述了 vLLM 在 Moonshot 项目中的大规模应用情况。摩尔线程 GPU 计算软件开发总监
吴庆
分享了摩尔线程全功能 GPU 架构,并概览了 MUSA 软件生态系统,同时介绍了摩尔线程 Triton 编译器的实现与 FlagGems 的适配。来自阿里巴巴通义实验室技术专家
何涛
展示了通义实验室在 vLLM 上为 Qwen 模型提供高效服务所做的优化工作,包括模型量化、框架性能增强和算法改进。
今年,华为首次公开了仓颉编程语言开发者预览版本,受到了众多开发者的关注。在本次仓颉编程语言 WorkShop 现场,华为中央软件院项目群总监
董鑫
首先分享了仓颉作为一种新一代编程语言旨在支持全场景应用的最新进展。华为编程语言实验室架构师
徐潇
介绍了仓颉在鸿蒙应用开发中涉及的关键技术。华为编程语言实验室主任工程师
谈家梁、
赛可出行高级技术经理
赵刚
、中国工商银行互联网金融研究团队研究员
李可
、领扣网络 iOS 开发工程师
鄂宇鑫
、科蓝软件金融科技事业部产品经理
曲正平
、泛微信创及政务事业群售前咨询总监
韩泽宇
、亨宝科技 CEO
张云波
结合团队的实践,分享了基于仓颉语言开发应用的实践经验,并为开发者提供
参考。
在软件定义汽车峰会上,Synkrotron 创始人、中国科学技术大学教授
杨子江
介绍了仿真、测试、验证和确认 (STV2) 流程覆盖自动驾驶系统整个生命周期的范围、架构与关键组件。来自中国电动汽车百人会车百智库智能汽车研究院副院长
张强
表示,中国电动汽车百人会(ChinaEV100)作为跨学科、跨行业的非官方、非营利性平台,是汽车领域的第三方智库。Synkrotron CTO
潘余曦
阐述了自动驾驶模拟中场景表示的标准化工作,并以绿洲模拟系统为例进行说明。iSOFT 基础设施软件有限公司创新研究所所长
梁浩
强调,在技术革新浪潮中,采用开源开发路径是应对汽车操作系统开发挑战的合理选择。CARLA 项目
German Ros Sanchez
与杨子江共同展示了 CARLA 新版本及其功能,这款开源模拟器专为支持自动驾驶系统开发、培训与验证而设计。