专栏名称: 专知
专知,为人工智能从业者服务,提供专业可信的人工智能知识与技术服务,让认知协作更快更好!
目录
相关文章推荐
求是网  ·  两会观察 | 这门课,总书记非常关心 ·  2 天前  
CHINADAILY  ·  World丨Strike hits ... ·  2 天前  
CHINADAILY  ·  Business丨Private ... ·  3 天前  
51好读  ›  专栏  ›  专知

【博士论文】边缘分布式深度神经网络推理

专知  · 公众号  ·  · 2025-02-27 11:00

正文

随着深度神经网络(DNN)的日益复杂化,其计算需求常常超出了边缘设备的承载能力,而边缘设备通常资源有限。本论文探讨了在资源受限的边缘环境中高效且稳健地部署大型DNN的策略,其中“边缘”指的是位于数据源与云端之间的设备。在边缘部署DNN具有增强隐私性、效率和可靠性的优势,但也因边缘设备的资源受限而面临挑战。
论文分为两部分。第一部分解决了在多个资源受限的边缘设备上优化分区和部署DNN的挑战。AutoDiCE框架自动化了模型分区、代码生成和设备间的通信优化,同时通过设计空间探索(DSE)技术确定了最佳分布策略,以最小化能耗和内存使用,并最大化系统推理吞吐量。
第二部分着重于增强系统对设备故障或连接问题的鲁棒性。RobustDiCE通过优先处理关键神经元并在设备间部分复制它们,确保分布式推理的准确性,即使在故障情况下也能保持功能。此外,EASTER是一种针对大语言模型的类似分区方法,平衡了资源利用和鲁棒性。
总体而言,本论文提出了在边缘高效且容错的DNN部署创新解决方案,优化了资源利用并确保了可靠运行。所提出的方法推动了分布式边缘AI在资源受限环境中的应用。

专知便捷查看,访问下面网址或 点击最底端“阅读原文”







请到「今天看啥」查看全文