专栏名称: 芯东西
芯东西专注报道芯片、半导体产业创新,尤其是以芯片设计创新引领的计算新革命和国产替代浪潮;我们是一群追“芯”人,带你一起遨游“芯”辰大海。
目录
相关文章推荐
51好读  ›  专栏  ›  芯东西

国产GPU如何系统性的解决大模型算力难题 | 演讲预告

芯东西  · 公众号  ·  · 2024-08-12 12:00

正文

请到「今天看啥」查看全文





生成式AI时代,大模型及 AIGC 的快速发展推动着计算需求的高速增长。

从服务器到边缘,再到AI手机、AI PC、AIoT、智能汽车,各个领域的AI芯片玩家都面临着新的机遇和挑战。

AI大模型与各个赛道的结合,带来了新的体验革新,这些新体验的落地则离不开各类AI芯片的支撑。放眼全球,产业格局的激烈变动,也让更多中国AI芯片企业看到了新的发展机会。

与此同时,芯片设计的复杂度不断提升、产品快速量产上市的要求不断增加、新兴应用市场不断涌现,投资和成本的压力也水涨船高。

AI芯片作为AI产业发展的“基石”,是实现AI产业化落地的核心力量,对AI技术的进步和行业应用都起着决定性作用。

如今各路AI芯片创企可谓是百家争鸣,群雄逐鹿成为国内AI芯片产业的主基调。在这样的产业背景下,我们将全球顶级AI芯片产学研用及投融资领域专家们聚集起来,为他们提供思想交锋、观点碰撞的平台。

9月6-7日,由芯东西与智猩猩共同发起主办的 2024全球AI芯片峰会(GACS 2024) 将于北京举办。今年的峰会将以「智算纪元 共筑芯路」为主题,日程为期两天,由一场开幕式、3个主会场专场会议,以及3个分会场论坛组成。3个主会场会议分别是数据中心AI芯片专场、AI芯片架构创新专场、边缘/端侧AI芯片专场;3个分会场分别是Chiplet关键技术论坛、智算集群技术论坛和中国RISC-V计算芯片创新论坛。

峰会同期还将布设展区,展示AI芯片产业链优秀企业的最新技术、产品与方案。同时,峰会期间,还将重磅揭晓两大AIIP AI生产力创新先锋企业榜单,分别是2024年度中国智算集群解决方案企业TOP 20、2024年度中国AI芯片新锐企业TOP 10。

目前, 壁仞科技 副总裁兼AI软件首席架构师 丁云帆 已确定出席,将在 数据中心AI芯片专场 带来演讲,主题为 《国产GPU如何系统性的解决大模型算力难题》

嘉宾介绍

丁云帆,现任壁仞科技副总裁兼AI软件首席架构师,主要负责AI软件架构和大模型千卡集群等相关工作。代表壁仞担任全国信息技术标准化技术委员会人工智能分委会智能计算工作组联合组长和 中国人工智能产业发展联盟 芯片工作组副组长。曾担任百度主任系统架构师,获得过百度技术最高奖和中国国家专利优秀奖。参与主导AI加速基础架构国际标准OAI & OAM。业界首创利用GPU架构解决广告推荐场景10TB级稀疏参数大模型训练挑战,相关成果发表在机器学习与系统领域顶会MLSys上,该工作引领了互联网广告推荐领域训练框架技术发展趋势。

演讲概要

ChatGPT 为代表的大模型技术引发了新一轮的科技革命,国内外呈现了百模争艳的状态,并且已经开始了广泛的应用落地。大模型的训练和落地带来了巨大的算力需求,以LLaMA3 千亿参数为例,Meta建设了18000个H100的集群来满足训练需求。目前国内存在着较大的算力供应瓶颈,这也给国产AI芯片带来了巨大机遇,国产千卡集群在逐步落地应用。大模型训练是一个系统工程,需要软硬件协同,算法与工程协同,对计算机体系结构如计算、存储、通信都带来了巨大挑战,另外千卡集群对并行扩展、稳定可靠、弹性伸缩提出了更高的要求,同时不同异构GPU集群形成了算力孤岛,如何实现异构GPU协同训练通过算力聚合共同训练大模型非常关键。针对上述挑战,壁仞科技基于其高性能国产GPU打造了软硬一体、全栈优化、异构协同、开源开放的大模型整体解决方案。

本次演讲将从硬件集群算力、软件有效算力、异构聚合算力三个维度分享壁仞科技如何系统性的解决大模型算力难题。

峰会日程及嘉宾



报名方式


峰会设有四类电子门票,分别为免费票、免审票、通票和贵宾票。其中,免费票,申请后需经主办方审核通过方可参会,免审票、通票和贵宾票均需购买。大家可以扫描下方二维码,添加小助手“雪梨”即可进行免费票申请,或购买电子门票。已添加过“雪梨”的老朋友,给“雪梨”私信,发送“GACS24”即可。







请到「今天看啥」查看全文