专栏名称: 人工智能学派
人工智能学派专注于分享:GPT、AIGC、AI大模型、AI算力、机器人、虚拟人、元宇宙等AI+160个细分行业!
目录
相关文章推荐
药安食美诚信河北  ·  安全用药 | 这些药品不良反应小常识,一定要知道! ·  22 小时前  
药安食美诚信河北  ·  安全用药 | 这些药品不良反应小常识,一定要知道! ·  22 小时前  
药渡  ·  Summit“滞销” ·  2 天前  
51好读  ›  专栏  ›  人工智能学派

AIGC专题:AIGC时代智算中心网络协议演进与思考(附下载)

人工智能学派  · 公众号  ·  · 2024-06-15 15:33

正文

今天分享的是 AIGC大模型专题系列 深度研究报告:《AIGC专题:AIGC时代智算中心网络协议演进与思考》

(报告出品方:中国移动)

报告共计: 18

AI需求激增推动建设计算和网络基础设施:

  • ChatGPT引爆AI,智算算力需求激增,参数量呈指数级迭代增长:推动计算与网络基础设施建设不断布局。

  • 智能计算需求持续激增:ChatGPT驱动AI大模型训练进入爆发期,参数量指数级增长,AI智能算力增速远超摩尔定律。

  • AI基础设施:算网基础设施不断布局,算为核心,网为根基,GPU市场规模提升,对网络设备需求激增,网络发展前景极为明朗。

传统DC与智算中心流量模型区别:

  • 单个流量:数量多、带宽小、异步。

  • 累积流量:抖动幅度较小,具有随机性。

  • 单个流量:数量少、带宽大、同步。

  • 累积流量:波峰、波谷效应明显,具有周期性。

IB与RoCE是目前业界主流高性能网络协议:

  • Infiniband:1999年IBTA提出,第一代RDMA技术,交换机、网卡、光模块、光纤都是专用产品,专用无损网络,全球独家,和以太网不能互通,采购及维护成本高。

  • RoCE:2010年IBTA提出,本质为网卡侧封装技术,不涉及网络侧技术,网络无损能力依赖网络设备与网卡实现,产业开放,组网规模和转发性能较差。

  • RDMA软件栈:IB传输层,IB传输层,IB传输层,UDP,IB网络层,IB网络层,网络层,IB链路层,以太链路层,以太链路层,Infiniband RoCE v1 RoCE v2。

  • 管控机制不同,路由算法存在差异:转发机制不同,网络性能存在差异。

  • IB:vs。

  • 个体算路相互独立:只看最短路径,易出现端口拥塞,故障触发倒换。

  • RoCE:集中算路统一下发,结合端口拥塞+SPF,选择最优路径。

  • 查表转发:IB。

  • 缓存:校验。

  • 查表:RoCE。

  • 存储转发,缓存时延大:需借助PFC、DCQCN协议实现。

  • 直通转发,静态时延低:协议本身支持端到端流控。

  • 端到端流控:IB。

  • vs:RoCE。







请到「今天看啥」查看全文