专栏名称: 芯东西
芯东西专注报道芯片、半导体产业创新,尤其是以芯片设计创新引领的计算新革命和国产替代浪潮;我们是一群追“芯”人,带你一起遨游“芯”辰大海。
目录
相关文章推荐
北京厚朴中医  ·  筑基十一期招生开启——学习中医、厚朴筑基 ·  昨天  
北京厚朴中医  ·  筑基十一期招生开启——学习中医、厚朴筑基 ·  3 天前  
北京厚朴中医  ·  厚朴粉丝福利回馈,来领奖喽 ·  3 天前  
中国中医  ·  浙江:推广试点中药全链条追溯体系应用 ·  昨天  
山西省人民政府  ·  海报|亚冬会上的“山西能量包”,Buff叠满! ·  3 天前  
51好读  ›  专栏  ›  芯东西

英伟达AMD英特尔联手,投出一家AI芯片独角兽

芯东西  · 公众号  ·  · 2024-12-12 12:56

正文

利用光学I/O推动AI革命。
作者 | ZeR0
编辑 | 漠影
什么样的初创公司,能同时拿到英伟达、AMD、英特尔三大芯片巨头的投资?
答案是 Ayar Labs
芯东西12月12日报道,硅谷光互连芯片设计公司Ayar Labs昨日宣布完成 英伟达 AMD 英特尔 格芯 等参投的1.55亿美元融资。
台积电 有战略合作关系的VentureTech Alliance、美国机器制造巨头 3M 也参与了此轮融资。

目前其累计融资达3.7亿美元,估值已超过 10亿美元 ,成为新晋芯片独角兽。
Ayar Labs联合创始人兼CEO马克·韦德(Mark Wade)说:“领先的GPU提供商AMD和英伟达以及半导体代工厂格芯、英特尔代工、台积电,再加上Advent、Light Street和我们其他投资者的支持,凸显了我们的光学I/O技术重新定义AI基础设施未来的潜力。”
获得如此多芯片巨头的青睐,Ayar Labs凭什么?

01 .
AI的下一个百万倍加速,
需要光互连等先进技术


Ayar Labs成立于2015年,总部位于加州圣何塞,专门为大规模AI工作负载提供光互连解决方案。其瞄准的赛道,如今正是下一代AI基础设施建设的关键技术之一。
高盛近日发布的一份报告预测,未来十年,AI基础设施支出预计将超过1万亿美元。这凸显了对消除传统铜互连、可插拔光学器件造成的瓶颈的解决方案的迫切需求。
当前大多数数据中心的运营依赖于传统的电互连,铜线是数据中心短距离信息传输的标准。AI服务器系统在持续传输数据过程中会消耗大量电力,打破现有AI基础设施瓶颈的有效解法之一,便是采用光互连技术来加速通信。

采用传统互连时,随着AI模型复杂性增加,系统效率会降低。据Ayar Labs官网分享,一颗GPU的运行效率为80%,64颗GPU的运行效率可能是50%,256颗GPU的运行效率可能只有30%了。光学I/O则能够针对提高AI基础设施的性能和能效。
英伟达数据中心产品首席平台架构师罗伯·奥伯(Rob Ober)认为,过去十年,英伟达加速计算已经为AI带来百万倍的加速,而下一个百万倍的加速将需要光学I/O等全新技术,来支持未来AI/ML工作负载和系统架构的带宽、功率和规模要求。
OpenAI计算主管克里斯托弗·伯纳(Christopher Berner)也强调道,横向扩展期间的互连带宽对于防止加速器在等待网络传输或梯度时停转至关重要。

02 .
突破数据移动瓶颈,
用光互连加快AI系统通信速度


此前光一直被用于数据传输,只不过主要用于电信网络的长距离通信中。
Ayar Labs则将这项技术塞进了芯片封装里。

该公司开发了业界首款针对大规模AI工作负载优化的封装内光学I/O解决方案。相比采用可插拔光学器件+电气SerDes的传统互连,Ayar Labs的方案可实现 5~10倍 的更高带宽、 4~8倍 的能效,并将延迟降低至 1/10
其方案结合了两项行业首创技术—— TeraPHY光学I/O Chiplet SuperNova多波长光源
TeraPHY可集成到客户的SoC封装中,利用其SuperNova远程光技术实现更快的芯片间通信,从而帮助客户最大限度地提高AI基础设施的计算效率和性能,还能提高“AI应用的盈利能力指标”。

TeraPHY光学I/O Chiplet 是一款体积小、功耗低、吞吐量高的铜背板和可插拔光学通信替代方案,其模块化多端口设计科承载8个光通道(相当于x8 PCIe Gen5链路)。

它将硅光子学与标准CMOS制造工艺结合,使专用集成电路(ASIC)能跨越从毫米到千米的距离进行通信,相当于形成一个巨型GPU。每个端口有256Gbps,每个Chiplet有2Tbps。

万亿参数AI模型和高性能计算(HPC)设计需要不断增加的带宽。Ayar Labs光学I/O提供 4Tbps 的总双向带宽,为生成式AI架构开辟了新的可能性。
高性能计算(HPC)和AI的分布式计算系统无法容忍传统电气I/O前向纠错带来的数十纳秒额外延迟。而Ayar Labs光学I/O的延迟为每Chiplet + TOF 5纳秒 ,无需前向纠错。
为了使电气I/O和可插拔光学器件能够穿越系统、机架和数据中心,112 Gbps长距离电气I/O会消耗6-10pJ/b的能量。Ayar Labs光学I/O消耗的能量则不到 5pJ/b(10W)

SuperNova 是首款符合CW-WDM MSA标准的多波长、多端口光源,最多支持将16种波长的光传输至16根光纤。

与CWDM4多波长可插拔光学器件相比,其波长增加了 64倍 。该光源可驱动256个光学载波,实现 16Tbps 的双向带宽。

Ayar Labs基于开放标准(UCIe、CXL、CW-WDM MSA),使其能顺利大规模集成到AI系统中。
这些芯片由格芯生产。Ayar Labs还与英特尔合作,将其技术集成到英特尔的制造产品中。该公司也在与台积电洽谈。
HPE、英特尔、洛克希德·马丁、英伟达都是Ayar Labs的技术合作伙伴。其供应链合作伙伴包括格芯、MACOM、Sivers Semiconductors等。

03 .
瞄准AI数据中心挑战的
硅光子学竞争者们


几个月前,Ayar Labs开始向部分客户出货了约 15000台 设备。马克·韦德希望到2026年中期,其芯片能实现大批量生产;到2028年及以后,每年出货量可达到 1亿台 以上。
Advent Global Opportunities和Light Street Capital是Ayar Labs最新融资的领投方。
Advent Global Opportunities合伙人乔丹·卡茨(Jordan Katz)将加入Ayar Labs董事会。他相信光互连技术将彻底改变AI基础设施的未来,而他认为Ayar Labs是引领这场革命的最佳初创公司。






请到「今天看啥」查看全文


推荐文章
北京厚朴中医  ·  厚朴粉丝福利回馈,来领奖喽
3 天前
毒舌电影  ·  有一种演员,能改变国家
8 年前
古墨社  ·  2016最火的两张图片
8 年前
零售老板高参  ·  入 | 餐饮老板交流群
7 年前