本文提出了 Transformer²,一个基于奇异值微调(SVF)和强化学习训练的专家向量的自适应 LLM 框架,通过动态选择和组合专家向量实现模型在推理时对未知任务的实时自适应,其核心思想是通过 SVF 更高效的利用了 LLM 预训练的知识,并通过强化学习直接对任务进行优化,使得模型能够针对不同任务动态调整。这种方法比传统的微调更高效,更具通用性。
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师 |
宝玉xp · 看到一位博主说大语言模型生成 Swift ... · 4 天前 |
爱可可-爱生活 · [LG]《How GPT learns ... · 4 天前 |
爱可可-爱生活 · 本文通过分析OthelloGPT的层级特征, ... · 4 天前 |
机器之心 · OpenAI ... · 1 周前 |
黄建同学 · 斯坦福大学关于 Hugging Face ... · 1 周前 |
宝玉xp · 看到一位博主说大语言模型生成 Swift 的代码效果不好,所以他-20250115041033 4 天前 |
爱可可-爱生活 · [LG]《How GPT learns layer by lay-20250115062554 4 天前 |
爱可可-爱生活 · 本文通过分析OthelloGPT的层级特征,揭示了模型内部如何构-20250115062558 4 天前 |
机器之心 · OpenAI 不装了?左手赚钱,右手就一定有「神奇药水」吗? 1 周前 |
黄建同学 · 斯坦福大学关于 Hugging Face Transformer-20250111101544 1 周前 |
美美耶 · 2017男生眼中好女友的标准 8 年前 |
深圳22度社区 · 深圳人小心!这些不合格充电宝,用了可能起火爆炸,有你在用的吗? 7 年前 |
雷峰网 · 那些年,我们在“咸鱼”掉过的坑 7 年前 |
博科园 · 研究类星体和黑洞活动的新方法 7 年前 |
RMB交易与研究 · 【中国平安期权论坛】平安银行副行长:提升投研与交易能力,成为具国际竞争力的机构 7 年前 |