专栏名称: 将门创投
将门是一家专注于发掘及加速技术创新激活商业价值的创业公司的创投机构。将门旗下设有将门创新服务、将门技术社群以及将门投资基金。关注领域包括机器智能、物联网、自然人机交互、企业计算。
目录
相关文章推荐
上海科创汇  ·  公示|2024年金山区实体经济高质量发展专项 ... ·  昨天  
商学院  ·  新刊热卖 | ... ·  2 天前  
商学院  ·  新刊热卖 | ... ·  2 天前  
51好读  ›  专栏  ›  将门创投

Talk预告|杜克大学郭聪:面向高效大模型的软硬件协同设计

将门创投  · 公众号  · 科技创业  · 2025-03-11 08:22

正文

本期为 TechBeat人工智能社区 667 线上Talk。

北京时间 3 月12日 (周三)20:00, 杜克大学博士后 郭聪 的Talk将准时在TechBeat人工智能社区开播!

他与大家分享的主题是: “面向高效大模型的软硬件协同设计” ,届时他将分享对大语言模型特有特性与约束条件而设计的软硬件协同优化方法。

Talk·信息
主题:面向高效大模型的软硬件协同设计
嘉宾:杜克大学 · 博士后 - 郭聪
时间:北京时间 3 月12日(周三)20:00
地点:TechBeat人工智能社区
http://www.techbeat.net/

长按识别二维码,一键预约TALK!


Talk·介绍
随着大语言模型(LLMs)的快速发展,人工智能领域正经历深刻变革。这些模型在自然语言处理方面展现出卓越能力,并正逐步向多模态功能扩展,越来越多地融入各类应用,影响着科研与产业。然而,其发展与部署也带来了巨大的挑战,包括对海量计算资源的需求、高能耗以及复杂的软件优化问题。与传统深度学习系统不同,大语言模型在训练和推理过程中需要采用独特的优化策略,强调系统层面的高效性。
本次Talk关注对大语言模型特有特性与约束条件而设计的软硬件协同优化方法。分析了大语言模型对硬件和算法研究带来的挑战与影响,从算法优化、硬件设计到系统层面创新等多个角度探讨了关键问题,旨在为大语言模型计算系统中提综合的解决方案。
Talk大纲
1. 硬件友好的结构化稀疏设计

2. 新型量化架构设计

3. 稀疏-量化协同优化设计

4. 面向大模型的缓存压缩架构设计


Talk·预习资料

论文链接:

https://arxiv.org/abs/2410.07265v1


Talk·提问交流

在Talk界面下的 【交流区】 参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!

Talk·嘉宾介绍

郭聪 ‍‍‍‍‍‍‍‍‍‍‍

杜克大学 · 博士后 ‍‍‍
郭聪,杜克大学博士后,合作导师为陈怡然教授。2023年在上海交通大学获得计算机科学博士学位,并荣获2023 年上海交通大学优秀博士论文奖。他的研究兴趣集中在计算机体系结构和高性能计算领域,重点在于软件与硬件协同优化,以加速高效的人工智能应用。包括为神经网络设计基于稀疏和量化的体系结构和系统。在过去的五年中,他在 ISCA、MICRO、HPCA 和 ASPLOS 等顶级会议上发表了 10 余篇论文,其工作在 2022 年 IEEE Micro Top Picks 中获得了荣誉提名。

个人主页:

https://www.techbeat.net/grzytrkj?id=43978 ‍‍‍‍



长按识别二维码,一键预约TALK!


-The End-







请到「今天看啥」查看全文