专栏名称: 量子位
վ'ᴗ' ի 追踪AI行业和技术动态,这里更快一步!关注我们,回复“今天”,更多大新闻等你来发现
目录
相关文章推荐
黄建同学  ·  最近比较火🔥的Thinking ... ·  15 小时前  
爱可可-爱生活  ·  Andrej Karpathy 对 ... ·  2 天前  
51好读  ›  专栏  ›  量子位

全球空间智能第一股!浙大清华“三剑客”,英伟达基因,填补两大技术空白

量子位  · 公众号  · AI  · 2025-02-17 11:54

正文

白交 发自 凹非寺
量子位 | 公众号 QbitAI

全球空间智能第一股来了 !来自中国,来自杭州。

2月14日,空间智能独角兽 群核科技 正式向港交所递交招股说明书,启动IPO进程,冲击“全球空间智能第一股”,摩根大通、建银国际为联席保荐人。

群核科技于2011年由浙大清华校友创办,始终专注于空间认知相关技术的研发与落地。在李飞飞、英伟达包括众多具身智能企业争相竞逐空间智能的当下,它凭借着过去14年间的深厚沉淀,率先迎来了 「交 卷时刻」 ——

数据显示,按2023年的平均月活跃用户(MAU)数目计量,它是全球最大的空间设计平台。2024年,群核科技的平均月活跃访客数更是达到了8630万名。

而按照2023年收入计量,群核也是中国目前最大的空间设计行业参与者,约占22.2%的市场份额。

此前,大众感知的是,它拥有英伟达背景,起步于高性能计算,聚焦空间场景模拟。值得一提的是,近期群核科技与DeepSeek、宇树科技、游戏科学等杭州企业一起,被外界称为 “杭州六小龙”

而在今天之后,他们或许将增加一个新身份: 全球空间智能第一股

群核科技是谁?为什么第一股会是它?招股书上揭示了一切。

群核科技是谁?

首先来看一下关键财务数据。

营收方面,2022年和2023年,群核科技的营收分别为6.01亿元和6.64亿元,同比增长10.5%;2024年前三季度的营收则从2023年前三季度的4.86亿元增加13.8%至5.53亿元, 这一增速高于2023年全年的同比增幅

过去三年间,群核营收一直保持着两位数增长,这对于一家技术公司来说其实并不多见。而且得益于大家对于空间智能的关注以及需求的不断攀升, 2024年增长得尤为飞速 。其毛利率也呈逐年提升趋势,2022年、2023年以及2024年前三季度,群核科技的毛利率分别为72.7%、76.8%以及80.4%。

用户数据上,截至2024年9月30日,群核科技累计服务近41.4万名个人客户、合作超4.55万家企业,大客户净收益留存率为114.1%,个人客户的净收益留存率为96.0%。

高水平的用户留存率,不仅代表着 客户价值创造 上的可持续,同时也意味着 企业技术发展 的可持续。

招股书中显示,作为空间智能企业,群核科技持续积淀了三项核心技术能力,即专门构建的GPU基础设施、AI技术以及合成数据生成技术。

放在今日来看,这一技术选择也十分具有前瞻性。也正因此,他们拿下了 「两个第一」 ,打响了群核在行业中的影响力。

首先,群核科技构建了 全球最大的室内场景认知深度学习数据集 ,拥有超过3.62亿个3D模型。

它沉淀的数据不仅规模上全球屈指可数,更填补了具备物理正确属性这一稀缺空白,为整个行业迭代与应用提供了坚实的数据底座。

其次,群核科技是 全球最大的空间设计平台 。目前,群核科技旗下拥有空间设计软件 「酷家乐」 、酷家乐海外版 「Coohom」 、以及面向室内环境AI开发的下一代空间智能解决方案群核空间智能平台 「SpatialVerse」 ,可提供涵盖设计、视觉化、实施及价值链协作等全面的端到端体验。

在空间智能领域的蓬勃发展浪潮中,群核毫无疑问地已经迈向 行业前列 。而在更早之前,群核的创业故事,其实始于对算力的 “解锁”。

2000年代初,GPU作为「通用计算设备」这一角色才刚刚开始不久。不同领域的研究者意识到了GPU的计算优势,像机器学习、图像处理、线性代数、3D重建等等。

当时正在求学的黄晓煌,就是第一波受益者之一——他在浙大攻读计算机图形学方向,在UIUC (伊利诺伊大学厄巴纳-香槟分校) 正是聚焦于用GPGPU来模拟物理世界这一研究。

2009年,他加入英伟达,参与到了CUDA开发。

CUDA允许程序员忽略GPU底层的图形概念,而直接进行 高性能计算 。当时在老黄看来,这是英伟达既游戏领域之后第二增长点,因此有着重要的战略意义。后面的故事我们也都了解,CUDA的价值完全得到印证。

说回到黄晓煌,他同样也看到了高性能计算的广泛发展前景。再结合之前在物理渲染、计算图形方面的积累,他萌生了用计算来做物理模拟仿真的想法,随后,他就联合UIUC的同学陈航、朱皓踏上了创业之路。

其中陈航还是他浙大本科的同学,朱皓则是本科毕业于清华。

当时行业面临着一个技术难题: 无法同时提升渲染速度而又降低算力成本 。团队想到了端云协同的方式,基于云端用低价显卡集成了一个GPU集群,并通过优化算力资源的调度策略,大幅度提升GPU利用率。

“解锁”算力后,他们构建了一套物理正确的世界模拟器,并将之广泛运用在室内空间场景下的实时渲染、工业生产制造,以及虚拟物理世界训练等场景中,这种显而易见的技术价值,也让他们收到来自各方市场的认可。

创业至今,群核已获得包括纪源资本、顺为资本、IDG资本、高瓴创投、经纬创投等一众知名投资机构的投资,是一个受明星资本青睐的硬科技创业样本。

那么,从物理仿真渲染到全球空间智能第一股,为什么是群核?为什么是此时?

得从空间智能本身开始说起。

空间智能正在跨越的两座大山是什么?

空间智能是什么?简单来说,就是让机器突破传统二维视觉的限制,能够像人类一样感知、理解并作用于三维空间。

李飞飞曾用三句话来概括空间智能的核心: 视觉化为洞察,看见成为理解,理解导致行动

类比于人脑,一张猫猫爪子将玻璃杯推向桌子边缘的照片,人类看见第一反应就能评估玻璃杯的位置、它的几何形状、与猫猫、桌子等东西的关系,然后预测会发生的事件,并采取行动加以阻止。

可以看到,空间智能是实现AGI的关键一步。它的最终目标是实现世界模型,即通过数字化的方式模拟和预测物理世界的运行规律。

进一步,空间智能实际上分为两个层面: 物理的三维世界和数字的三维世界 。所以其实现目标是让机器能感知与理解两个世界,并在物理与数字世界之间产生链接。

在数字世界里,空间智能的代表应用是3D生成,以李飞飞首秀、谷歌Genie 2为代表,而像Sora这种视频生成模型,本质上也可以算上。

他们的出发点在于能让计算机生成海量的3D空间场景。其挑战也藏在题眼里,即便生成内容视觉上越来越逼近现实世界, 但真正要落地到物理世界,依然会存在不符合物理规律的情况

很多模型都是根据互联网上的语料信息、图片或视频训练出来的,但这些内容只是物理世界的一种特定记录形式,并不能充分描述物理世界的属性与规律。因此,真正能满足物理正确性的大模型并不多见,又或者还只是停留在Demo演示之中。

另一层面, 在物理世界里 ,空间智能的应用主要体现在自动驾驶、具身智能领域,广义上讲,自动驾驶也属于具身智能的一部分。

这与虚拟世界有个根本的区别,他们在感知、理解的基础上,有更为明确明显的行动。「可交互」这个特点也就更加凸显出来了。

李飞飞曾这样形容:

让机器人能够有望像人类一样交流协作,成为人类可靠的伙伴。

比如让机器人打开这个抽屉或拔掉电话线,或者制作三明治,使用面包、生菜、西红柿,甚至为用户放一张餐巾纸。

围观背后的四要素:算法、算力、数据、具身硬件。

算法百花齐放;算力的发展,按照奥特曼的说法,现在的水平已经足以支撑AGI的奇点,而具身硬件这块,中国也有地利人和、产业链完整的绝对优势。

最后,就剩下数据了。

没错,这就是当前具身智能所面临的难题: 如何给机器人提供高质量、可交互的训练数据?

综上所述,无论是虚拟世界中的3D内容生成,还是物理世界中的具身智能,空间智能的兴起,标志着人工智能从二维感知向三维理解的跨越。这一领域的快速发展也伴随着几座技术大山的跨越:物理正确性的实现、和高质量可交互数据的获取,都是亟待突破的瓶颈。

而要论群核科技之所以能成为全球空间智能第一股,还得从填补这两大技术空白谈起。

为什么空间智能第一股是群核?

连接物理世界与数字世界的桥梁,这是群核科技从创业之初就一以贯之的角色和定位。在这之后,群核持续的技术投入到行业know-how积累,解决技术难题也变成自然而然的事情。

为什么这么说?

先从3D内容生成的物理正确性开始看起。群核科技平台是少有的具备丰富物理属性的世界模拟器。平台生成的3D空间场景,包含了描述物理世界所需要的参数信息,这件事它已经积累了十几年。

我们知道,李飞飞项目首秀是「3D原生生成AI未来的一个缩影」。而群核科技推出的百亿参数多模态CAD大模型也在让这一切在这个平台发生。

群核科技2024酷+科技峰会上,展示的多模态CAD大模型能力

群核多模态CAD大模型基于平台的数据训练而成,具备空间认知和推理能力,可自动识别各类设计数据 (如图像、CAD图纸、平面设计等) ,并生成物理正确的参数化模型。

这种正确性和精确度什么概念? 是可直接纳入工业制造的水平

机器可自动识别各类设计数据生成结构化数据及空间内容,再由此生成自动化标注数据,对接到生产、施工环节推动智能化升级。比如在制造环节,把每一件商品拆解成一个个零件,通过流水线机器人以及传送带实现柔性生产。

如今他们还将生成式AI结合3D渲染引擎,能够实现逼真且实时的空间可视化呈现。在AI能力加持下,群核可以对物理世界的有机物和无机物实现快速模拟,并可渲染真实物理世界99%的材质。

放眼业内,能实现物理正确的3D内容生成,并且直接用在生产线的, 并不多见,甚至可以说群核是独一份

也是基于这份独特性,在过去十多年沉淀中,群核积累了海量的3D数据,这些数据都经历过实际生产环节的考验。在今天,它们拥有了非常广阔的应用场景。

比如解决具身智能的世界难题: 海量室内场景的可交互三维数据

真实物理世界里,数据的采集是一条路径,但易受限于成本、时空、可泛化性等难点,且存在比较大的数据安全问题。最高效且可行的一种方式是给到机器人足够多最接近真实环境的仿真训练场景,进行训练。

像李飞飞提出数字表亲,就能捕获与现实世界相似的几何和语义功能,从而提高从模拟到真实迁移的鲁棒性;英伟达cosmos生成视频数据供客户训练模型;

而群核推出的群核空间智能平台「SpatialVerse」在其中占据了非常独特的生态位,因为它们有物理正确,且全球最大的室内场景可交互三维数据。它就像一个3D版的ImageNet,增强机器人、AIGC、XR系统对三维世界的认知能力。

如果说解决3D生成的物理正确难题,是源于过去积累,那么群核在具身智能「数据」难题的解决上,则是属于还有点意外的收获。

那是在2018年,AI 1.0兴起不久,机器人还只是机器人,自动驾驶才开始商业化尝试。







请到「今天看啥」查看全文