专栏名称: 中国计算机学会
中国计算机学会官方订阅号,为CCF会员及计算领域的专业人士服务。
目录
相关文章推荐
PChouse家居APP  ·  被crush一万遍的绝美中古风,这电影感我真 ... ·  昨天  
厦门市消保委  ·  划重点!@想买家具的你,这项强制性国家标准即 ... ·  23 小时前  
PChouse家居APP  ·  白墙+原木,法式自热风美到我不敢认! ·  3 天前  
清单  ·  可以不用,但必须要有的人生物品 ·  4 天前  
51好读  ›  专栏  ›  中国计算机学会

CCF Computility 2024 | 张广艳教授、华宇教授和张一鸣教授邀你共话算力网络存储创新技术

中国计算机学会  · 公众号  ·  · 2024-06-29 17:00

正文



由CCF主办,CCF分布式计算与系统专委会与吉林大学承办的CCF分布式计算大会(CCF Computility 2024) 暨全国开放式分布与并行计算学术年会(DPCS 2024) 将于2024年7月26日至28日在中国吉林省长春市举行,会议规模预计1000余人。本次会议主题为“算力网:新质生产力背景下的分布式系统”,旨在为分布式系统和算力网相关的从业者提供最专业的学术研讨、技术交流和成果展示的平台。CCF Computility 2024为大家准备了9场由院士等顶级专家带来的主旨报告,15场技术论坛(80位特邀报告),绝对不容错过!

CCF Computility 2024 | 学术盛宴,大咖云集,不容错过!



大会主旨报告嘉宾



论坛背景


本论坛专注于探讨算力网络存储领域最新技术创新。本论坛将聚集来自学术界和工业界的专家学者、研究人员和从业者,深入探讨算力网络新范式,展示云网边资源动态分配的最新成果。通过案例分析,突显高效能计算与存储的协同优化,以解决数据密集挑战。同时,关注绿色可持续性,讨论节能减排策略,引领算力网络向环境友好型转变。本论坛旨在搭建开放交流平台,促进产学研各界的密切合作,共同探索算力网络存储技术的新边界,推动数字经济高质量发展。


算力网络存储创新技术论坛报告安排
论坛主席 张广艳教授、蒋德钧副研究员
特邀 报告1 张广艳 CCF信息存储技术专业委员会副主任、CCF计算机历史工作委员会副主任、清华大学长聘副教授 编码存储系统:架构、理论与方法
特邀 报告2 华宇 华中科技大学教授 大内存系统的分布式事务机理
特邀 报告3 张一鸣 厦门市智能存储与计算重点实验室教授 面向算力网络的可靠存储关键技术
特邀 报告4 吴忠杰 阿里云资深技术专家 新型高效能分布式存储系统助力算力网建设
特邀 报告5 顾荣 南京大学特聘研究员 面向云原生算力的弹性缓存研究及其开源应用
特邀 报告6 单一舟 华为云架设部架构师 构建面向大规模推理的分离式数据中心
特邀 报告7 张杰 北京大学助理教授 近数据计算的进展与展望
特邀 报告8 蒋德钧 中科院计算所副研究员 面向差异化需求的分布式存储系统QoS保证
时间:2024年7月27日  下午
地点:吉林省长春市安华假日宴会中心宴会厅A


论坛主席及介绍


张广艳

清华大学

张广艳,CCF信息存储技术专业委员会副主任、CCF计算机历史工作委员会副主任,清华大学计算机系长聘副教授,国家杰出青年科学基金获得者。主要从事大规模数据存储与分析的理论和方法研究,包括存储系统、数据压缩、大数据计算、AI计算系统等方面。研究得到包括国家杰出青年科学基金、国家重点研发计划、中国工程院战略研究与咨询项目、973和863等国家科研项目的支持。发表学术论文60余篇,其中包括FAST、SOSP、USENIX ATC、EuroSys、ACM TOS、IEEE TC、IEEE TPDS等计算机系统领域顶级国际会议和期刊论文20余篇。以第一发明人获得美国发明专利授权、中国发明专利授权10余项。研究成果应用到多家国内骨干企业的存储产品中,效果良好。指导的研究生获得“清华大学优秀硕士学位论文”奖、“钟士模奖学金”、“西贝尔学者”等荣誉。







蒋德钧

中国科学院计算技术研究所

蒋德钧,博士,中科院计算所副研究员,博士生导师,中科院计算所先进计算机系统研究中心数据系统实验室主任。主要研究兴趣包括存储系统软件与体系结构,操作系统,分布式系统等,在ATC, TACO, MSST, ICDCS等国际会议与期刊上发表论文三十余篇。承担或参与多项国家重点研发计划项目,国家青年科学基金项目,人社部留学人员科技活动优秀项目,北京市自然科学基金项目等。曾获中国科学院青年创新促进会项目资助,北京市科学技术进步奖二等奖,CCF科技进步奖三等奖。








嘉宾及报告介绍


张广艳

清华大学

张广艳,CCF信息存储技术专业委员会副主任、CCF计算机历史工作委员会副主任,清华大学计算机系长聘副教授,国家杰出青年科学基金获得者。主要从事大规模数据存储与分析的理论和方法研究,包括存储系统、数据压缩、大数据计算、AI计算系统等方面。研究得到包括国家杰出青年科学基金、国家重点研发计划、中国工程院战略研究与咨询项目、973和863等国家科研项目的支持。发表学术论文60余篇,其中包括FAST、SOSP、USENIX ATC、EuroSys、ACM TOS、IEEE TC、IEEE TPDS等计算机系统领域顶级国际会议和期刊论文20余篇。以第一发明人获得美国发明专利授权、中国发明专利授权10余项。研究成果应用到多家国内骨干企业的存储产品中,效果良好。指导的研究生获得“清华大学优秀硕士学位论文”奖、“钟士模奖学金”、“西贝尔学者”等荣誉 。


报告题目:编码存储系统:架构、理论与方法


报告摘要:相对于多副本存储,编码存储显著降低了数据冗余开销。然而,编码存储仍然面临一些主要问题,包括但不限于:数据恢复速度慢、部分条带写性能低以及快速设备上性能不稳定。为了解决这些问题,我们提出了一种资源全局共享的存储架构,旨在提高数据恢复和数据读写过程中的内部数据读取、传输、计算和写入速度。然而,在实施上述架构时,我们还需要应对一些理论和方法层面的挑战,包括细粒度数据布局管理、大规模恢复任务调度以及兼顾中位延迟的长尾延迟优化。在本报告中,我们将共同探讨这些问题、挑战以及初步的解决方案。







华宇

华中科技大学

华宇,华中科技大学教授,国家杰出青年科学基金获得者,CCF杰出会员和杰出演讲者。主要研究新型存储器件、高性能存储系统和安全架构。 在OSDI、ASPLOS、MICRO、FAST、HPCA等会议上发表多篇学术论文。在ICDCS 2021、ACM APSys 2019等国际会议上担任程序主席/副主席,在OSDI、SIGCOMM、FAST、NSDI、MICRO、ASPLOS、EuroSys等国际会议上担任程序委员,是ACM Transactions on Storage期刊 的编委。研究成果获得教育部自然科学一等奖等3项省部级科技奖励,以及FAST 2023等4项国际会议和期刊的最佳论文奖。


报告题目:大内存系统的分布式事务机理


报告摘要:具有大容量、高性能、非易失等特点的大内存系统是算力网络的重要组成部分,其体系结构包括一体化内存、互联内存、池化内存等多种形式,而其分布式事务处理机制是影响算力网络整体性能的关键所在。报告将全面系统地阐述支持算力网络的大内存系统的分布式事务机理,并在数据模式、更新机制、网络协议、版本管理等方面介绍相关的工作进展,为未来大内存系统的进一步发展提供思路。







张一鸣

厦门市智能存储与计算重点实验室

张一鸣教授目前主要从事云计算和AI计算系统研究,成果在天河超算、华为云等关键业务系统中得到应用。担任中国计算机系统大会(ChinaSys)主席、IEEE Transactions on Computers编委、欧洲计算机系统优秀博士论文评奖委员会委员、IEEE JointCloud国际会议主席。获国家科技进步二等奖、湖南省自然科学一等奖、CCF优博论文奖、CCF科技进步卓越奖等。


报告题目:面向算力网络的可靠存储关键技术


报告摘要:高效可靠的数据存储是算力网络的关键。本报告分别针对算力网络的两个重要场景,AI计算和虚拟化计算,介绍我们的最新研究成果。首先,高带宽内存(HBM)的可靠性是AI计算面临的重要问题之一。我们对生产环境中的海量HBM故障日志进行分析,总结其特点,进而提出有效的预测方法。第二,KVM(基于内核的虚拟机)是Linux上主要的VM管理程序,它遵循标准virtio框架来对客户VM的I/O设备进行半虚拟化。传统上,KVM依赖QEMU来实现virtio设备族的后端,比如virtio-blk/-net,其中KVM(内核空间)和QEMU(用户空间)之间的协作是实现安全灵活存储管理(如迁移)的关键。我们对高效协同的虚拟化存储技术进行研究,显著提高了半虚拟化的效能。







吴忠杰

阿里云

吴忠杰,花名储道,阿里云资深技术专家,中国计算机学会存储专业委员会执行委员。长期从事数据存储技术研究与开发,近年来参与ZNS国际标准提案,在闪存存储,软硬协同分布式存储系统方面做了一些工作。


报告题目:新型高效能分布式存储系统助力算力网建设


报告摘要:数据存储是算力网建设过程中的重要环节,算力网对存储系统的容量、性能和效能都提出了重要的技术挑战。需要采用软件定义存储的思想,通过软硬协同设计的方法提升分布式存储系统的效能,满足算力网对数据存储的需求。本报告将从问题分析切入,提出针对算力网建设的高效能分布式存储系统设计的一些方法,展示新型存储系统给业务带来的价值。







顾荣

南京大学

顾荣,南京大学特聘研究员/博导,国家高层次青年人才计划入选者,达摩院青橙奖获奖者(2023),主要研究方向为云计算与大数据系统、分布式存储管理系统,发表领域研究论文60余篇,包括USENIX ATC, EuroSys, VLDB, KDD, ICDE, WWW, VLDBJ, IEEE TPDS, TKDE, TON等。主持国家自然科学基金面上/青年项目、国家重点研发计划子课题、中国博士后科学基金特别资助项目,以及中国石化、中国中车、中国移动、华为、阿里、中兴、腾讯、字节跳动等企业创新基金项目等10余项,获江苏省科学技术一等奖、IEEE TCSC Award for Excellence (Early Career Researcher)、IEEE HPCC会议最佳论文奖、CCF分布式计算与系统专委会青年创新先锋、阿里优秀学术合作项目奖、华为公司火花奖、中兴产学研优秀合作项目奖、腾讯云最具价值专家奖、中国开源创新大赛一等奖,担任云原生计算基金会Fluid开源社区主席。


报告题目:面向云原生算力的弹性缓存研究及其开源应用


报告摘要:随着以大模型为代表的AI技术的兴起,越来越多数据密集型应用(AI模型训练、大数据查询等)运行于成本经济节约、算力编排灵活、系统运维便利的云原生平台。然而,云原生存算分离与资源弹性的架构特点对传统缓存技术提出了巨大挑战。本报告将介绍一种智能弹性缓存技术,包括轻量精准缓存容量调整,缓存算力协同调度,以及缓存副本高效传输等核心方法。进一步,我们将分享基于上述技术研制的Fluid开源项目(已入选云原生计算基金会)及其行业领军型企业的应用成效。







单一舟

华为

单一舟,华为云架设部架构师, 博士毕业于加州大学圣地亚哥分校。研究方向围绕提升数据中心基础设施性价比,包括大模型推理系统,分离式内存,大规模分布式存储系统等。在华为云主导云存储硬件加速和Serverless大模型推理项目。在顶级学术会议发表论文20+,研究曾获得OSDI 2018, SYSTOR 2019,FPAG 2024 Runner Up最佳论文。


报告题目:构建面向大规模推理的分离式数据中心


报告摘要:基于LLM的大模型推理正成为数据中心最重要的负载之一。大模型推理呈现出多变多样的特征,对数据中心底层基础设施提出了非常高的新需求。本次报告主要讨论如何提升大模型推理在大规模部署时的性价比。报告先阐述目前数据中心推理部署架构,并从模型结构出发分析模型与硬件之间的不匹配,总结为Model Serving的三堵墙,即内存墙, 调度墙,以及弹性墙,进而阐述业界解决这些瓶颈的方法。报告也会讨论Agent Serving的部署形态和挑战。







张杰

北京大学

张杰,博士,北京大学计算机学院助理教授、博士生导师、特聘研究员,入选国家高层次人才计划海外青年项目,获得英特尔中国学术英才计划荣誉学者、ACM SIGCSE新星奖。长期从事存储系统和专用处理器的研究和设计,致力于从计算机体系结构层面出发,解决大数据和人工智能时代对于高性能存储系统的需求,突破冯诺依曼体系结构下数据迁移的瓶颈以及内存墙的限制。在国际会议及期刊上发表了50余篇论文, 包括计算机体系结构与系统顶级会议ISCA(CCF-A,三篇)、OSDI(CCF-A)、 HPCA(CCF-A,七篇)、 MICRO(CCF-A,两篇)、ASPLOS(CCF-A)、FAST(CCF-A)、ATC(CCF-A,两篇)、Eurosys(CCF-A)。


报告题目:近数据计算的进展与展望


报告摘要:随着大数据时代的到来,人工智能、图计算、大数据等新型应用对服务器集群的算力和存储能力提出了更高的要求。然而,传统的冯诺依曼体系结构及配套的系统软件存在数据迁移开销大的天然劣势,无法满足新型应用的实际需求。当今的内存和存储系统正经历了重大的技术转变。基于这种技术的提升,研究人员需要重新思考和设计现有的系统组织和硬件架构。本次报告主要分享我们在近数据计算领域的研究进展,我们提出的解决方案能够有效减少大量软件栈的开销并且优化计算机体系结构消除传统硬件的物理限制。












请到「今天看啥」查看全文