专栏名称: OSC开源社区
OSChina 开源中国 官方微信账号
目录
相关文章推荐
OSC开源社区  ·  在读计算机女博士退学转战OnlyFans—— ... ·  2 天前  
程序猿  ·  资深程序员带一群菜鸟 ·  5 天前  
51好读  ›  专栏  ›  OSC开源社区

地平线/智源/字节/凌川科技齐聚上海,共探编译器优化新进展

OSC开源社区  · 公众号  · 程序员  · 2024-12-26 15:35

正文

2024 Meet AI Compiler 第 6 期技术沙龙将于 12 月 28 日在上海五角场创新创业学院举办。


2023 年,HyperAI超神经在北京、上海、深圳举办了 4 场 Meet TVM 线下聚会,聚集了超 1 千位资深从业者及爱好者,逐步建立了丰富的社区生态。2024 年,HyperAI超神经聚焦 AI 编译器领域,继续为业内人士提供开放的交流平台,在今年 7 月举办了 Meet AI Compiler 技术沙龙的第 5 期。如今,2024 年接近尾声,大模型赛道激战未停,AI 编译器有哪些新突破、新应用?


12 月 28 日,HyperAI超神经将在上海五角场举办第 6 期 Meet AI Compiler 技术沙龙,本次活动分为技术分享和圆桌讨论 2 个环节。


首先,我们有幸邀请到了来自地平线、北京智源人工智能研究院、字节跳动、凌川科技的 4 位资深专家,为大家分享他们的应用案例与行业观察。此外,上海交通大学博士、Apache TVM PMC 冯思远将担任圆桌环节的主持,从专业的技术角度,和嘉宾们进行思维的碰撞。


我们还为大家准备了精美礼品与茶歇,报名活动并关注「HyperAI超神经」公众号,后台回复「1228上海」即可参与抽奖,奖品需在 12 月 28 日当天活动现场线下领取哦,快来参与吧~




活动详情


⏰ 时间:12 月 28 日(周六)13:30-17:45


📍 地点:上海五角场创新创业学院 2F 报告厅(杨浦区大学路 322 号)



👬 人数:200(现场座位有限,请尽早报名) 


🙌🏻 报名:点击下方小程序报名



扫码备注「AI 编译器」加入活动群:



📝 议程:



嘉宾及议程


环节 1


分享嘉宾


13:40-14:20

李建军

地平线 

编译器研发负责人


分享主题:Transformer 模型的编译 & 部署优化实践


内容简介:Transformer 模型近年来不仅在 LLM 领域取得了显著的成果,也在计算机视觉领域得到了广泛的应用。在自动驾驶场景中,Transformer 模型的编译和部署优化是一个复杂的过程,端到端模型、VLM 都对端侧的编译优化和部署提出了非常大的挑战。本次分享主要介绍地平线在这方面的一些实践和经验。


观看本场分享,你将了解:

1. 视觉 Transformer 模型编译优化和部署面临的挑战
2. 地平线在 Transformer 模型编译优化上的探索和实践


14:20-15:00

李之昕

北京智源人工智能研究院

AI 编译器研发工程师


分享主题:FlagGems:研发进展与生态应用探索

内容简介:自 2.0 版本发布以来,在智源团队、合作厂商及 Triton 中国社区的紧密协作下,FlagGems 在算子支持数量、计算性能、代码生成以及运行时机制等方面取得了显著的研发突破。同时,FlagGems 贯通领域上下游,在大模型训练与推理适配、多后端芯片集成等方面展开了创新探索,进一步拓展了算子库在多元生态中的应用场景。

观看本场分享,你将了解:

1. FlagGems 的最新研发成果和技术提升
2. 算子库与大模型适配的创新实践与经验
3. 多后端芯片集成的技术方案与应用效果
4. Triton 中国社区与多元生态建设进展


15:15-15:55

郑思泽 

字节跳动 TopSeed

Research Scientist


分享主题:从计算-访存-通信优化看 AI 编译器设计


内容简介:面向 AI 芯片的编译优化需面临 3 个角度的优化挑战:计算、访存、通信。本报告将分享 3 个方面的 AI 编译器设计与优化经验。计算角度,分享针对定制化加速单元的优化;访存角度,分享针对 AI 芯片的访存建模和优化;通信角度,分享计算通信融合的经验和进展。


观众观看本场分享,你将了解:


1. AI 编译器优化的全局视角

2. 了解充分发挥 AI 芯片算力的经验技巧

3. 了解未来分布式 AI 编译器发展方向


15:55-16:35

汤旭涛

凌川科技

AI Compiler 架构师


分享主题:基于多核架构 NPU 的大模型编译优化与推理加速实践


内容简介本次分享聚焦于多核架构 NPU 在大模型编译优化与推理加速中的实践探索。通过分析 Transformer 等大模型的计算特性,提出基于 tiling 策略的矩阵优化、数据并行与模型并行的调度机制,以及融合算子与流水线化设计的高效推理方法。结合多核架构的并行特性,优化了算子分解、内存管理,大幅提升推理吞吐量与资源利用率。


观看本场分享,你将了解:


1. 云端大模型推理芯片的架构

2. Transformer 架构下 Attention 超级算子的优化策略


环节 2


圆桌讨论


圆桌主题:芯片-网络-软件-算法-生态的协同发展



主办方及合作伙伴







HyperAI超神经是国内领先的人工智能及高性能计算社区,旨在通过提供数据集加速下载、在线教程演示、论文深度解读、顶会日历集成等多种基础设施,助力中国的数据科学与⼈⼯智能⾏业的开发者、爱好者学习、理解、实践,与社区⼀起构建⼈⼯智能的未来。目前超神经官网已经上线数千个经典及优质公开数据集和教程,并运营国内最活跃的 AI 编译器社区。


访问官网:https://hyper.ai/



OpenBayes贝式计算是国内领先的高性能计算服务提供商,通过为新一代异构芯片嫁接经典软件生态及机器学习模型,进而为工业企业及高校科研提供更加快速、易用的数据科学计算产品,其产品已被数十家大型工业场景或头部科研院所所采用。


访问官网:https://openbayes.com/



MLC.AI 社区成立于 2022 年 6 月,并由 Apache TVM 主要发明者、机器学习领域著名的青年学者陈天奇,带领团队上线了 MLC 线上课程,系统介绍了机器学习编译的关键元素以及核心概念。


2022 年 11 月,在 MLC.AI 社区志愿者的共同努力下,首个完整的 TVM 中文文档上线,并成功托管至 HyperAI超神经官网,进一步为对机器学习编译感兴趣的国内开发者,提供了接触并学习一门新技术的基础设置——文档。


MLC 线上课程:https://mlc.ai/
TVM 中文文档:https://tvm.hyper.ai/



上海五角场创新创业学院是杨浦区政府联合著名高校及行业龙头企业、创服机构共同发起设立的非营利性教育及服务组织。以「创造深度连接,让创新创业更容易成功」为使命,连接创业者和赋能方、提高双创要素资源的配置效率,促进创造发生。


五角场创院 2022 年 11 月,正式启用学院公共空间,将 800 平米的空间开放共享给双创人群,并联合港中大上海中心、瑞安集团等伙伴共同发起双创公益品牌「学院咖啡」,并邀请对双创公益服务有共识的 KOL、企业和社会组织,成为「公益合伙人」,共同设计不同形式的创业者聚集方式,截止目前「学院咖啡」共举办 140+ 场不同形式的双创主题活动,汇聚 3000+ 位参与者。


活动支持



活动行:扫码跳转至活动行报名



扫码备注「AI 编译器」加入活动群



考虑到本场活动的场地空间情况,我们仅开放了 200 个到场名额,建议大家尽早报名锁定席位。
12 月 28 日 13:30-17:45,期待与大家在上海相聚!