今日推介(第1704期):通过递归问题分解实现自我改进的LLM、强化学习在微调中的价值、针对富接触操纵的慢-快视觉-触觉策略学习、在数据点少于几百的LLM评估中不要用中心极限、利用 QK 几何结构实现高效 KV 缓存压缩 公·众·号:爱可可爱生活
网页链接
#机器学习#
#人工智能#
#论文#