[LG] Surveying the Effects of Quality, Diversity, and Complexity in Synthetic Data From Large Language Models
网页链接
本文综述了大型语言模型合成数据的质量、多样性和复杂性及其对下游模型泛化能力的影响,揭示了质量与多样性之间的权衡,并指出了未来研究中需要关注模型输出多样性和复杂性以及QDC平衡的必要性。
网页链接
本文综述了大型语言模型合成数据的质量、多样性和复杂性及其对下游模型泛化能力的影响,揭示了质量与多样性之间的权衡,并指出了未来研究中需要关注模型输出多样性和复杂性以及QDC平衡的必要性。