专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
目录
相关文章推荐
宝玉xp  ·  看到一位博主说大语言模型生成 Swift ... ·  4 天前  
爱可可-爱生活  ·  [LG]《How GPT learns ... ·  4 天前  
爱可可-爱生活  ·  本文通过分析OthelloGPT的层级特征, ... ·  4 天前  
机器之心  ·  OpenAI ... ·  1 周前  
黄建同学  ·  斯坦福大学关于 Hugging Face ... ·  1 周前  
51好读  ›  专栏  ›  爱可可-爱生活

本文提出了 Transformer²,一个基于奇异值微调(SVF-20250115063734

爱可可-爱生活  · 微博  · AI  · 2025-01-15 06:37

正文

2025-01-15 06:37

本文提出了 Transformer²,一个基于奇异值微调(SVF)和强化学习训练的专家向量的自适应 LLM 框架,通过动态选择和组合专家向量实现模型在推理时对未知任务的实时自适应,其核心思想是通过 SVF 更高效的利用了 LLM 预训练的知识,并通过强化学习直接对任务进行优化,使得模型能够针对不同任务动态调整。这种方法比传统的微调更高效,更具通用性。
[LG]《Transformer²: Self-adaptive LLMs》Q Sun, E Cetin, Y Tang [Sakana AI] (2025) 网页链接 #机器学习##人工智能##论文##AI创造营#