专栏名称: 北航研究生
这里是北航唯一代表全体研究生的官方交流平台。每天为你献上校园热点资讯,学术、活动、就业信息玩转掌中。研途有你,共仰望星空。我是北航研会,期待你的关注。
目录
相关文章推荐
黑马程序员  ·  喜报!应届生均薪破万,最高薪资24000元! ·  昨天  
黑马程序员  ·  喜报!应届生均薪破万,最高薪资24000元! ·  昨天  
软件定义世界(SDX)  ·  指标数据体系建设分享 ·  2 天前  
大数据与机器学习文摘  ·  OpenAI ... ·  3 天前  
91运营网  ·  91运营网vip会员早鸟票抢座ing!! ·  3 天前  
艺恩数据  ·  艺恩数据祝您开工大吉! ·  1 周前  
51好读  ›  专栏  ›  北航研究生

【博引航标】优博微展2024 — 计算机学院孙庆骁《面向GPU的性能调优与多任务资源共享研究》

北航研究生  · 公众号  ·  · 2024-05-24 10:51

正文


【博引航标】

北航优秀博士学位论文微展


博士学位论文是博士生知识水平、科研能力的集中体现,是评价博士生培养质量的核心指标。为进一步提升我校研究生学位论文质量,北航研究生院特开辟【博引航标】优秀博士学位论文微展,邀请我校北京市及校级优秀博士学位论文获得者分享学位论文、科研历程和学习感悟,以榜样的力量激励研究生追求卓越!

根据《北京航空航天大学研究生优秀学位论文评选及奖励办法》,共评选出2024年校级优秀博士学位论文43篇。【博引航标】优秀博士学位论文微展今日推送的是 孙庆骁 及其获奖论文 面向GPU的性能调优与多任务资源共享研究 》。

孙庆骁

论文题目:

面向GPU的性能调优与多任务资源共享研究

指导老师:

刘轶、杨海龙

获奖类别:

2024年北京航空航天大学优秀博士学位论文


作者简介

孙庆骁,北京航空航天大学计算机学院2023届博士毕业生,师从刘轶教授和杨海龙教授。攻读博士学位期间,研究方向为高性能计算和计算机体系结构,以第一作者身份在SC、TC、TPDS、IPDPS、CLUSTER、PARCO等国际会议和期刊发表论文8篇,获得CLUSTER ’21最佳论文提名奖和IEEE Computer亮点论文奖。入选“CCF体系结构优博”和“ACM SIGHPC China优博”,曾获北京市优秀毕业生、博士研究生国家奖学金、校级年度优秀研究生等荣誉。目前在中国石油大学(北京)信息科学与工程学院/人工智能学院担任特任岗位副教授。


论 文 主 要 内 容 及 贡 献

异构架构在超算系统构建层面被广泛接受,而加速器成为超级计算机性能和能耗的主体,如何充分利用昂贵的加速器资源成为超算领域的热点问题。本文提出的系统性优化方法和技术能够为未来架构的设计方向提供指导,对于保证资源充分利用和应用服务质量具有重要意义。

具体来说,本文面向具有CPU和GPU的混合异构环境开展了性能调优与多任务资源共享研究,以科学计算和深度学习负载为对象,首先针对独占模式下的典型算法设计自动调优策略,再基于时空共享实现并发模式下的高效处理机制。本文从硬件和软件两个角度实现内核层次和应用层次(图神经网络)的资源共享。本文还考虑优化策略和参数设置两个级别,实现典型科学算子(stencil计算和张量计算)的性能调优。

图 研究内容关系图



论 文 主 要 创 新 点

本文的创新性技术已被推广到科技创新重大项目和国家自然科学基金重点项目。创新点如下:

1、针对高维卷积不能有效处理稀疏张量输入的问题,本文实现了基于监督学习和无监督学习并结合张量转换和特征提取的自动张量格式选择框架。

2、针对stencil优化空间参数搜索代价大的问题,本文实现了基于统计和机器学习的参数调优框架以及抽象计算模式且支持跨架构预测的优化选择框架。

3、针对服务质量保障不足且内核共置利用率低的问题,本文实现了支持动态资源分配并考虑任务计算特征的GPU扩展架构和真机运行时调度机制。

4、针对并发机制不适用于特异图算子以及不规则图输入的问题,本文实现了结合时空共享和内存消耗估计机制以及调度策略的图神经网络并发框架。


代 表 性 创 新 成 果


(1) Qingxiao Sun , Yi Liu, Hailong Yang, Ruizhe Zhang, Ming Dun, Mingzhen Li, Xiaoyan Liu, Wencong Xiao, Yong Li, Zhongzhi Luan and Depei Qian. CoGNN: Efficient Scheduling for Concurrent GNN Training on GPUs[C]. International Conference for High Performance Computing, Networking, Storage and Analysis (SC ’22), 2022. CCF-A

(2) Qingxiao Sun , Yi Liu, Ming Dun, Hailong Yang, Zhongzhi Luan, Lin Gan, Guangwen Yang, and Depei Qian. SpTFS: Sparse Tensor Format Selection for MTTKRP via Deep Learning[C]. International Conference for High Performance Computing, Networking, Storage and Analysis (SC ’20), 2020. CCF-A

(3) Qingxiao Sun , Yi Liu, Ming Dun, Hailong Yang, Zhongzhi Luan, Lin Gan, Guangwen Yang, and Depei Qian. Input-aware Sparse Tensor Storage Format Selection for Optimizing MTTKRP[J]. IEEE Transactions on Computers (TC), 2022. CCF-A IEEE Computer Spotlight Column

(4) Qingxiao Sun , Yi Liu, Hailong Yang, Zhonghui Jiang, Zhongzhi Luan, and Depei Qian. Adaptive Auto-Tuning Framework for Global Exploration of Stencil Optimization on GPUs[J]. IEEE Transactions on Parallel and Distributed Systems (TPDS), 2024. CCF-A

(5) Qingxiao Sun , Yi Liu, Hailong Yang, Zhonghui Jiang, Xiaoyan Liu, Ming Dun, Zhongzhi Luan, and Depei Qian. csTuner: Scalable Auto-tuning Framework for Complex Stencil Computation on GPUs[C]. IEEE International Conference on Cluster Computing (CLUSTER ’21), 2021. CCF-B 最佳论文提名


经 验 分 享


我希望从个人经历出发,分享一下在读博期间的感悟。在寻找创新点方面,首先要明确一个大方向,然后进行充分的文献调研。在这个过程中,多动手实践是必不可少的,只有这样才能发现先前工作的问题所在。

在心理调适方面,每位博士生,除非是天资超群,都会或多或少地经历怀疑自己的阶段。有时候,不能过于钻牛角尖,需要跳出来以不同的视角审视问题。此外,与人交流和适度运动也是至关重要的,这样做不仅能促进头脑的转换,还可以很大程度上缓解自身压力,形成积极乐观的心态。




对学弟学妹的寄语








请到「今天看啥」查看全文