专栏名称: 芯东西
芯东西专注报道芯片、半导体产业创新,尤其是以芯片设计创新引领的计算新革命和国产替代浪潮;我们是一群追“芯”人,带你一起遨游“芯”辰大海。
51好读  ›  专栏  ›  芯东西

国内光子计算新突破!全球首度支持商用AI算法,能跑大模型,灵活可编程,集成数暴增

芯东西  · 公众号  ·  · 2025-03-25 18:59

正文

全球首个支持商用AI算法的光电混合计算产品,下一代光子矩阵规模提升4倍。
作者 | ZeR0
编辑 | 漠影
飙涨的算力需求,正拉开数据中心基础设施升级的大幕。硅光技术的优越性日益凸显,从远距离的光通讯到芯片里的光计算掀起技术革新。
芯东西3月25日报道,今日,全球光子计算赛道融资规模最高的公司曦智科技,发布全新可编程光电混合计算卡—— 天枢
这是 全球首个支持商用AI算法的光电混合计算产品 ,在支持科学计算(如伊辛算法)的基础上,加强了对ResNet-50等算法应用的支持,并可支持运行Llama算法,DeepSeek最近也正在调试。
天枢采用 3D先进封装 技术,其核心由 光学处理单元(OPU) 专用集成电路(ASIC) 组成,单芯片面积、器件集成数均大幅提升。

相比日渐逼近物理极限的传统电子芯片,光电混合计算芯片具备 高通量、高能效比、超低延迟 等优势。
上一代光子计算处理器PACE包含64x64光学矩阵,而天枢将矩阵规模扩大 4倍 128x128 ,单芯片面积扩大到 600mm² ,主频1GHz,可应用于深度学习、图像处理、科学计算等场景。
其一大亮点在于 可编程性 。用户可通过API灵活配置光子计算矩阵的系数,从而运行更多定制化算法,满足多样化的计算需求。
天枢还凭借 PCIe Gen4 x 16高速接口 ,实现了与现有计算机系统的无缝集成和高效扩展,以便光子计算技术能够更加便捷地融入各类高性能计算环境。
这些特性使得天枢成为光子计算在复杂多变场景下新应用探索的可靠平台。
在曦智科技上海办公室,芯东西与曦智科技创始人兼CEO沈亦晨博士、曦智科技联合创始人兼CTO孟怀宇博士、曦智科技COO王泷进行深入交流。
此前光计算常被描述为比电计算快10000倍,但在落地中要实现精度与速度的平衡,真实数据远达不到这么夸张。
据沈亦晨透露,曦智科技的目标是让光计算尽快在商业场景中可用,实现比电计算 3-5倍 性价比提升,其光电混合计算芯片已处于可量产状态,接近直接可插拔到现有服务器中。
目前,曦智科技产品在供应链上已实现 国产自主可控
曦智科技计划 到2027年,将下一代超大规模高频光电混合芯片升级到256x256光学矩阵 ,预计2026年年底出样片、2027年发布。

沈亦晨坦言现有光电混合计算卡运行大模型的速度还不是很快,下一代将提供更大的存储带宽和容量。曦智科技另一条光子网络产品线的最大优势便是提升带宽,计划将片上互连和片间互连技术应用到下一代产品中。
下一代预计很多颗光计算芯片和存储芯片将通过光互连方式连接,在大模型推理上发挥优势。

01 .
瞄准低延迟场景,发挥光计算优势,
往后发展大模型推理


2017年6月,沈亦晨博士作为第一作者和通讯作者的论文发表于国际学术顶级期刊《自然·光子》封面。这一研究开创性地提出了光子AI计算新路径,吸引了十几家初创公司相继成立。
曦智科技是沈亦晨在2017年博士毕业后成立的第一家公司,核心成员由来自麻省理工学院的顶尖科学家和拥有丰富半导体行业经验的业界知名人士组成,如今已发展成全球光电混合赛道的产品进展、技术研发领跑者,在上海、杭州、南京、北京、新加坡等地均设有办公室及实验室。
当前曦智科技拥有 近250人 的团队,估值约 70亿人民币
孟怀宇告诉芯东西,光电混合计算的技术原理决定它在通用性上与CPU、GPU等传统通用芯片存在差距,光器件不能做得比波长小太多。沈亦晨补充说,考虑到能继续缩减的空间有限,提升器件密度,可能更多利用主频和光分复用的方法去优化的空间更大。
沈亦晨解释说,光电混合芯片的市场定位与GPU不同,瞄准的是 对低延迟有高需求 的应用场景,可以跑出电芯片跑不出的效果,还有一些早期客户偏向产教研实验研究,往后发展可能会更聚焦大模型推理方向。
在大模型适配方面,曦智科技将在体现光计算优势的情况下,尽可能扩大通用性,押注于以矩阵乘法为核心的主流Transformer架构,继续沿用高带宽,用光做矩阵乘法,电芯片通过引入RISC-V等方式,引入更通用的算子。
目前其行业应用案例包括 EDA、量化交易、银行安全 等,比如用于优化光电混合芯片EDA流程中的应用、在风险价值计量中的应用、在银行账户欺诈识别中的应用。
未来曦智科技光计算产品将落地于 药物发现、基因工程、金融工程、图像识别、医疗影像分析、工业设计 等应用场景。

02 .
光电混合计算通用性令人惊喜,
优化重点是提升精度


大数据越来越大的比例是在做线性运算,曦智科技则发明了一种 用光高效做线性计算 的方式。
光在非均匀介质中传播和散射时,其形态类似于某种形式的数学线性运算。曦智科技利用光执行向量矩阵算法,当光进入系统时,它会被一组光学调制器编码以形成输入光向量,然后进入可编程光学散射介质的区域,输入光向量经过矩阵后,输出光向量自然就代表了矩阵乘法的结果。
由于矩阵乘法本身是被动的,这个过程中不会消耗能量,且延迟很低,最后高能效和低时延性能与输入光信号的频率无关,这就意味着光矩阵可以支持高通量。

2019年4月,曦智科技推出 全球首款光子芯片原型板卡 ,运行神经网络模型来识别手写数字图像,用时只有当时最先进电子芯片的不到1%。
但这远未发挥出硅光技术的潜力,要将其理论优势变为现实,一个关键的步骤是将大量的光子和电子器件集成在一起。2021年12月,曦智科技推出 光子计算处理器PACE ,将单芯片集成的光子器件数量提高到超过10000个,运行1GHz系统时钟,在解决伊辛问题(Ising)和最大割/最小割问题(Max-cut/Min-cut)时,PACE的运算速度可达当时高端GPU的 数百倍
北京大学研究员常林分享了对曦智科技第一代产品的感受,觉得对其能处理问题的通用性感到惊喜,远超他们的预期。
自动驾驶需要借助光技术来实现精密探测,其团队将曦智光电加速卡应用于雷达成像,能够处理规模为 5000 x 5000 左右的复数矩阵,精度达到 8bit 70% 以上的运算在曦智科技光子计算评估板Gazelle上实现。
他期待 更大规模的光学计算硬件 ,进一步 提升精度和纠错软硬优化算法 ,并提供 更好的软件支持 ,包括封装好的conv、linear等常见API接口。

03 .
天枢三大关键技术提升:引入3D先进封装工艺,提升光电集成度和可编程性


今天,天枢在处理器上进一步升级,采用了将OPU与ASIC优势组合的光电混合处理器,引入Flip-chip + TSV先进封装工艺,将矩阵规模增至128x128,深度融合光与电、硬件与软件优势,实现了光电集成度、光学矩阵规模、精度、可编程性等方面的提升。
天枢的关键技术提升总体分三个方面: 光计算精度、硬件、软件
1、光计算精度提升
相比上一代光子计算处理器PACE,天枢采用的光电混合处理器优化了向量调制解调器的设计,主频为 1GHz ,向量提升到uint4,权重精度支持int4,输出精度提升到8bit。
这带来的好处是,增强了天枢处理复杂数据和大规模运算的能力,并显著提高了计算结果的准确性和可靠性,减少了量化误差, 能够满足当前主流AI模型的推理需求






请到「今天看啥」查看全文


推荐文章
南开大学  ·  【组图】我们戴上博士帽
7 年前
葫芦世界平台  ·  【温情奇幻向】拆迁拆出鬼?!
7 年前