[CL] Preference Tuning with Human Feedback on Language, Speech, and Vision Tasks: A Survey
网页链接
全面综述了针对语言、语音和视觉模态下的生成模型偏好微调方法,包括在线和离线算法在内的各类偏好微调技术,旨在促进该研究方向的进一步发展。
网页链接
全面综述了针对语言、语音和视觉模态下的生成模型偏好微调方法,包括在线和离线算法在内的各类偏好微调技术,旨在促进该研究方向的进一步发展。