1.面向同态加密的应用优化
项目背景描述
基于同态加密的密文计算被认为是一种大数据时代保护数据隐私、打破数据孤岛的关键技术。然而,现有密文计算应用(如:密文神经网络、PIR隐私搜索等)往往针对于明文数据设计,与同态加密进行融合时在兼容性、精度、性能、开销等方面面临着一系列挑战:首先,同态加密基于格密码构建,适用于线性计算,而对于非线性函数往往需要近似拟合,造成精度降低和计算量显著增大;其次,模型线性层计算量大、计算深度高,造成密文计算过程中的噪声累积问题,而频繁的降噪操作会导致计算量和计算延迟的增大;第三,由于同态加密会造成密文数据膨胀,因此密文应用的内存空间需求显著上升(例如:基于CKKS的ResNet-20需要几十至上百GB内存空间)。因此,如何针对同态加密的特性进行应用优化成为了提升密文计算可用性的关键。本项目针对上述问题,重点关注面向同态加密的密文计算应用优化研究。
预计的产出
(1)面向全同态加密(如:BFV/BGV、CKKS、TFHE等)的密文应用优化方案,目标应用包括但不限于密文神经网络、隐私搜索等;
(2)论文:发表CCF-A类或蚂蚁认可的领域内顶级会议、期刊论文一篇
(3)技术指标:和业内相关方案比较,在计算延迟、内存需求、精度等方面具有显著优势。
2.基于多种同态加密方案协同的密文计算应用
项目背景描述
现有大数据应用包含大量线性和非线性函数,而现有同态加密方案往往只能为其中一种类型函数提供高效支持。因此,为了高精度和低延迟的需求,密文计算应用需要同时使用多种不同同态加密计算方案。目前,已经出现了不同同态加密方案之间的转换方法,但是这类转换往往伴随着精度的损失。此外,频繁的同态加密方案转换也会带来计算开销的上升。因此,需要开展基于多种同态加密方案的应用研究,以平衡应用的计算量、性能、精度和内存开销。
预计的产出
(1)针对典型大数据应用(神经网络、数据挖掘等),提出基于混合同态加密方案的密文计算应用原型并提供可演示的源代码,对性能、精度和内存开销进行量化评估;
(2)论文:发表CCF-A类或蚂蚁认可的领域内顶级会议、期刊论文一篇;
(3)技术指标:性能和精度优于基于单一同态加密方案的同类应用。
3.全同态加密高效高精度密文转换技术研究
项目背景描述
全同态加密(FHE)是隐私保护计算领域的核心技术之一,可以实现数据的“可用不可见”。目前的主流FHE方案主要包括第二代的BFV/CKKS方案和第三代的FHEW/TFHE方案。然而,这两代方案都存在明显的优缺点。例如,第二代方案可以支持高效的加法、乘法和批处理运算,但在处理非线性运算和自举时效率较低;第三代方案提供了高效的自举和对非线性运算的支持,但其精度有限,且缺乏有效的批处理机制,使得其在处理大规模数据时效率较低。因为这两代方案均存在的“偏科”现象,全同态加密在复杂计算场景下的应用受到了限制。为了充分挖掘FHE的潜力,亟需研究针对现有FHE密文的高效转换技术。当前,针对不同FHE方案间密文转换的研究还在初级阶段,现有的转换方案存在速度慢和精度低的问题。我们需要研究高效且高精度的FHE密文转换技术,寻求不同计算任务的最优密文形式策略,实现全同态加密对通用计算的高效支持,推动FHE技术的全面发展。
预计的产出
(1)密文转换算法,附带算法实现的时间和精度实验结果;
(2)论文:发表CCF-A类或蚂蚁认可的领域内顶级会议、期刊论文一篇;
(3)技术指标:跟业内方案比较,方案有更高的精度和更快的速度。
4.多模态同态加密硬件加速器
项目背景描述
同态加密计算根据负载特性可分为算数同态(如CKKS, BFV, BGV)和逻辑同态(如TFHE和FHEW)。其中算数同态计算要求支持大批量整数或实数的密文运算,主要以线性函数为主;而逻辑同态计算要求同态加密方案支持位操作,并对非线性函数提供支持。目前,同态加密计算需要依靠硬件加速器满足实际应用场景对性能的需求,而真实应用中往往存在不同类型的同态计算需求。此外,在同一应用中使用多种不同的同态加密方案,还涉及到不同方案之间的数据转换。因此,如何基于统一的硬件架构为多种不同同态加密方案及其相互转换算法提供加速支持,就成为了一个重要的问题。我们需要研究不同同态加密方案及其转换算法的底层原理,设计统一的加速器架构,在保证性能的同时控制硬件开销。
预计的产出
(1)多模态同态加密加速器设计方案并完成实验验证,支持两种以上同态加密方案及其转换算法的加速;
(2)技术指标:性能高于相同同态加密方案的单模加速器,硬件开销(电路面积、功耗)小于等于支持相同同态加密方案的加速器总和。
(3)论文:发表CCF-A类或蚂蚁认可的领域内顶级会议/期刊论文1篇。
5.基于查表法的取模电路
项目背景描述
取模计算是同态加密等密码学应用中广泛使用的非线性算子之一,主要用于避免计算过程中的溢出。现有取模计算电路主要基于Barrett算法或Montgomery算法,强依赖于高效的乘法实现,计算复杂度和电路开销较大,容易成为同态加密硬件加速器中的性能和吞吐率瓶颈。查表法做为一种常见的“存储空间换性能”方法,能有效减少计算量。但是,基于查表法的取模电路面临着硬件开销过大、难以复用等问题。随着位宽的增加,这些问题变得越来越严峻。针对上述问题,我们需要研究取模算法的优化技术,并基于优化后的算法设计查表电路,实现吞吐率高、开销合理的取模电路,使其可以满足同态加密加速器设计的需求。
预计的产出
(1)基于查表法的取模电路设计方案,并基于仿真器和FPGA对其性能、开销、功耗进行量化评估;
(2)技术指标:可支持大范围位宽的模数取值。在模数取值范围相同的情况下,取模电路的面积/吞吐率低于相同参数条件下基于Barrett和Montgomery算法的取模电路。
(3)论文:发表CCF-A类或蚂蚁认可的领域内顶级会议/期刊论文1篇。
6.噪声管理
项目背景描述
同态加密计算过程中使用Keyswitch和Bootstrap操作实现减少噪声并支持无限乘法深度。但是,Keyswitch和Bootstrap属于同态加密引入的额外计算,使用过多会导致计算量大幅上升,影响密文计算性能;而使用过少会影响计算结果的正确性。因此,对密文计算的噪声和乘法深度进行细致管理和合理规划,使其在满足正确性需求的同时不过度增加计算量,是构建高可用性同态加密应用的关键。现有同态加密应用需要开发者手动添加Keyswitch和Bootstrap操作,难以实现对上述操作使用量的精确控制。本项目拟通过对密文计算负载进行自动化扫描和分析,研究Keyswitch和Bootstrap的自动化植入和参数选择方法,并与编译器进行整合。
预计的产出
(1)实现基于噪声预测和乘法深度规划的自动化Keyswitch和 Bootstrap操作配置算法,并与现有编译工具链进行整合;
(2)技术指标:支持适用于不同目标应用的Keyswitch & Bootstrap自动化植入和配置,性能优于现有基于手工植入的密文计算应用。
(3)论文:发表CCF-A类或蚂蚁认可的领域内顶级会议/期刊论文1篇。
7.密文数据布局优化
项目背景描述
CKKS全同态加密方案中,单条密文的长度取决于加密参数的设置,更长的密文可以带来更高的吞吐率,但同时会增加单次同态操作的开销。本课题将研究在确保安全性的前提下,如何平衡吞吐率和单次操作开销(如将单一明文拆分到多条密文,或将多条明文加密到单一密文),从而得到更优的整体执行效率。同时研究在内存受限的情况下,如何得到执行时间最优的数据布局方案。
预计的产出
(1)在蚂蚁现有开源编译工具链上实现密文数据布局优化算法;
(2)针对不同的典型应用(ResNet,LLM),算法能给出不低于手工优化性能的布局方案;
(3)发表CCF-A或蚂蚁认可的领域内顶级会议或期刊论文一篇。
8.基于多加速器协同的同态加密加速系统
项目背景描述
全同态加密的应用同时面临多种复杂的挑战,例如:计算复杂度较高、数据规模膨胀、通信带宽需求较大等。因此,需要合理设计基于硬件加速器的系统以满足实际应用场景的需求。近年来,计算系统已由传统的仅包含CPU的同构系统发展为包含CPU、GPU、DPU、PIM/NDP/CSD、DSA等多种计算设备的异构系统,本项目旨在通过对同态加密应用的性能瓶颈进行系统性梳理,探索基于多种不同计算设备的加速方法,研究如何有效利用多种异构加速器(如DPU,CSD等),结合软硬件协同等方法设计高效同态加密加速系统,同时解决计算、存储、带宽等多项性能挑战,提升云端同态加密应用性能,并进行原型验证。
预计的产出
(1)原型系统:设计基于异构多加速器的同态加密加速方案,完成原型验证;
(2)论文:发表CCF-A或蚂蚁认可的领域内顶级会议或期刊论文一篇。
(3)技术指标:对同态加密应用的加速比高于基于GPU的加速方案。
9.全同态计算的GPU代码生成
项目背景描述
目前流行的全同态工具链大多以CPU作为目标运行平台,在全同态硬件加速器实用前,如何利用已有的更为高效的GPU算力是一个值得探索的议题。本课题将实现CKKS全同态计算到GPU的发射,研究CPU+GPU的计算任务的优化分配,利用GPU架构特性优化耗时运算(bootstrapping,relu和convolution),优化运算密钥(evaluation key)及运算数据(密文、明文)的存储访问,提升多核NV GPU的CKKS全同态计算性能。同时建立cost model检验实现的速度提升与理论的最优值之间的差异,以进一步分析提升空间。
预计的产出
(1)在蚂蚁现有开源编译工具链上实现CKKS全同态计算的GPU代码生成,全同态计算任务CPU+GPU的优化分配;
(2)发表CCF-A或蚂蚁认可的领域内顶级会议或期刊论文一篇;
(3)实现ResNet-20 CiFAR-10的推理程序比纯CPU执行速度提升100倍(指导值,以论文接收为准)。
10.自动化加密参数选择
项目背景描述
CKKS全同态加密方案中,加密参数不仅影响计算的安全性还影响计算的性能和精度。本课题将研究自动化CKKS方案的参数选择(输出精度,最大乘法深度,多项式次数等),在确保安全性的前提下,根据计算需求选择适当的计算输出精度并最优化计算的效率。同时研究自动化选择推理模型中不同层次的ReLU多项式拟合在不影响最终输出精度的情况下的最优拟合深度,降低ReLU拟合的开销。
预计的产出
(1)在蚂蚁现有开源编译工具链上实现自动化参数选择功能;
(2)支持不同深度ResNet的自动化参数选择,性能达到或超越手工选择;
(3)发表CCF-A或蚂蚁认可的领域内顶级会议或期