正文
点击参与:一揽子半导体专业会议,苏州举办!MEMS\柔性\压印\显示器件\分析测试\三代半\光电…不容错过,附参展企业名录
一、TPU的发展背景与竞争格局
在AI芯片领域,英伟达凭借GPU取得辉煌业绩,但也面临竞争。谷歌的TPU是专门为机器学习矩阵运算设计的定制化芯片,已发展到第六代,成为对标英伟达AI芯片的有力替代方案。中昊芯英创始人杨龚轶凡凭借谷歌TPU研发经验回国创业,专注于TPU芯片研发。
随着AIGC时代到来,算力需求爆炸式增长,中国对自研芯片需求迫切。中昊芯英历经五年研发,成功量产基于全自研GPTPU架构的高性能TPU芯片。在国内,TPU架构AI芯片发展势头强劲,多家企业积极投入研发,因为其以高效、低功耗的特点,在AI大模型训练、智能推理等领域潜力巨大。
二、TPU的技术优势与研发挑战
TPU是一种全新架构,其复杂性主要体现在非线性优化计算方式以提升模型运算效率方面。研发过程需通过模拟器模拟芯片运行来验证优化算法效果,充满迭代和试错。
与传统GPU架构相比,在相同制造工艺、芯片尺寸和能耗条件下,TPU专为AI深度学习定制,舍弃部分灵活性如光线追踪等复杂计算,专注于优化深度学习非线性计算,性能可提升3 - 5倍,性价比显著。它在处理深度学习模型时,单线程和集群性能都很出色,网络架构专为深度学习数据流量特征设计,无向前兼容负担,性价比更高。
中昊芯英团队凭借在谷歌TPU及Oracle - Sun高性能服务器级GPU的经验构建模拟器与创意框架,经过多轮优化验证架构才推进到芯片实现阶段,第一代产品从设计到量产历经近5年,研发过程缺乏参照,风险很高,但促使团队采用尖端工具等最终实现产品诞生。
三、TPU在智算基建中的作用
在算力领域,智能算力和绿色算力是两大支柱。智能算力基于GPU等芯片支撑算法训练与运行,提升科学计算效能;绿色算力关注计算能效与环保。在智能算力落地应用中,芯片与系统集成面临挑战,如芯片数量激增时通信效率问题。TPU独特的片间互联能力可轻松实现千片以上互连,具有强大可拓展性,谷歌第6代TPU内部可连接16000个芯片,为大规模集群部署奠定基础。
同时,软件栈与系统集群的复杂性、光通信可靠性、物理层面能耗和机房限制等也是挑战。而中昊芯英AI高性能智算中心运营方案日益成熟,成为产业升级转型的强劲引擎。杨龚轶凡对未来充满信心,认为深度学习将稳固在AI领域的主导地位,TPU以其深度优化特性会持续增强在AI赛道的竞争力,推动技术发展。
四、中昊芯英创始人杨龚轶凡
中昊芯英创始人杨龚轶凡毕业于斯坦福大学。
他有着多元的工作履历,曾深度参与甲骨文服务器CPU设计生产应用全过程。在谷歌TPU核心研发团队期间,参与TPU多个版本的设计研发,见证了基于TPU芯片的Transformer框架训练成果。
2018年回国组建中昊芯英创始团队,2023年带领公司成功量产基于全自研GPTPU架构的高性能TPU芯片“刹那”。他的创业成果使中昊芯英成为国内掌握TPU架构AI芯片核心技术的领军企业,其芯片在处理大规模AI模型训练和推理任务时表现卓越。2024年,中昊芯英获杭州市准独角兽企业称号,这离不开杨龚轶凡的卓越领导。
点击参与:9月27日,第三届GMIF2024创新峰会邀您相约深圳!