专栏名称: 机器学习算法与自然语言处理
一个有情怀的公众号。机器学习、自然语言处理、算法等知识集中营、期待与你相遇~
目录
相关文章推荐
田俊国讲坛  ·  【3月20日】第7期“10天激活课堂训练营” ... ·  21 小时前  
田俊国讲坛  ·  收你们来了!AI时代的"土拨鼠"们,小心别被 ... ·  21 小时前  
田俊国讲坛  ·  田俊国:课堂要的不是牺牲,而是彼此的滋养 ·  2 天前  
51好读  ›  专栏  ›  机器学习算法与自然语言处理

肖朝军@清华大学:高效稀疏注意力机制研究

机器学习算法与自然语言处理  · 公众号  ·  · 2025-03-01 00:00

正文

MLNLP 社区是国内外知名的机器学习与自然语言处理社区,受众覆盖国内外NLP硕博生、高校老师以及企业研究人员。
社区的愿景 是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进步,特别是初学者同学们的进步。

MLNLP学术Talk MLNLP社区 举办的学术交流活动,旨在邀请一线青年学者分享最前沿的技术,期待最精彩的思想火花碰撞。

本期MLNLP学术Talk邀请了清华大学 肖朝军 在2025年3月1日10:00-11:00为我们带来 高效稀疏注意力机制研究 的主题报告。详细信息 如下:




1

讲者简介


个人介绍:

朝军,清华大学计算机系博士生,导师为刘知远老师。研究方向为大语言模型、高效大模型架构,在人工智能国际顶级会议及期刊发表论文十余篇,曾获钱伟长中文信息处理科学技术奖一等奖(排名第4),腾讯犀牛鸟精英人才计划一等奖学金,CIKM最佳资源论文提名奖,全国社会媒体处理大会最佳论文奖等荣誉。


2

报告摘要


随着以大模型长文本理解与生成为核心的实际应用蓬勃发展,如何降低自注意力机制的高昂计算开销、提升大模型处理长文本序列的能力,已成为当前研究的热点问题。 本报告旨在系统介绍以稀疏注意力机制为核心的长文本处理相关研究,包括稀疏注意力规则设计、缓存压缩技术、分布式计算优化等内容,探索为长文本计算提供高效解决方案的方法与路径。


3






请到「今天看啥」查看全文