华夏银行提出了解决小样本学习问题的“6M”框架方法论,并在《银行家》期刊上发表相关文章。
一是基于专家经验的小样本学习
(Man-based few-shot learning),即依托业务专家经验形成规则来构建模型,常见的技术方法包括规则模型、评分卡模型、层次分析法模型、社交网络与知识图谱模型等。
二是基于数据算料的小样本学习
(Material-based few-shot learning),即通过增加数据量将样本扩充为大样本,常见的技术方法有两类:一类是基于数据本身,通过样本增强的方法(如SMOTE、GAN等)扩充样本量进行建模;另一类是在“数据可用不可见”的思想下,利用联邦学习技术来实现扩充样本进行建模。
三是基于模型泛化的小样本学习
(Model-based few-shot learning),即从模型的角度入手,利用某类数据集学会一种学习的机制(如每个类别分类器参数的产生机制等),然后迁移到目标小样本数据集中,通过参数微调使得模型具有更强的泛化性,能够快速进行新类的学习,常见的技术方法包括迁移学习、元学习等。
四是基于计算方法的小样本学习
(Method-based few-shot learning),即聚焦算法创新,选择合适的嵌入方法将数据的原始特征嵌入一个可分的空间,在新空间构造特征后进行建模,常见的技术方法包括支持向量机中的核函数法、分类关联规则挖掘中的频繁项集法和利用网络进行特征嵌入法等。
五是基于仿真环境的小样本学习
(Environment-based few-shot learning),即在极少样本甚至无样本的条件下,通过梳理业务传导逻辑,构建端到端的数字孪生仿真模拟环境,并通过强化学习相关技术进行建模。
六是基于计算机发展的小样本学习
(Machine-based few-shot learning),即基于量子科技发展将经典计算机升级为量子计算机,从而对小样本数据集直接构建量子算法模型。实证表明,该类技术方案在解决小样本学习问题上较经典机器学习方案有着明显的优势。