本文提出了高效树搜索算法 ETS,通过线性规划成本模型和语义覆盖项,在保证搜索轨迹多样性的前提下,显著优化了 LLM 树搜索过程中的 KV 缓存共享,实现了推理效率的显著提升,并揭示了 KV 缓存大小在内存受限的 LLM 推理中比 FLOPs 更为关键的效率瓶颈。
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师 |
|
新智元 · 14岁出道编程天才:新一代码农不会写代码了, ... · 16 小时前 |
|
文商资讯 · 北京大学AI智能高级研修班4月25-27日开学 · 昨天 |
|
文商资讯 · 北京大学AI智能高级研修班4月25-27日开学 · 昨天 |
![]() |
爱可可-爱生活 · 改善自编码器的可扩散性 ... · 昨天 |
|
人工智能那点事 · “80后已死5.2%”?这么离谱的假消息! ... · 2 天前 |
|
机器之心 · 出人意料!DeepSeek-R1用的GRPO ... · 2 天前 |
|
新智元 · 14岁出道编程天才:新一代码农不会写代码了,AI正培养「文盲程序员」! 16 小时前 |
|
文商资讯 · 北京大学AI智能高级研修班4月25-27日开学 昨天 |
|
文商资讯 · 北京大学AI智能高级研修班4月25-27日开学 昨天 |
![]() |
爱可可-爱生活 · 改善自编码器的可扩散性 查看图片-20250222074101 昨天 |
|
人工智能那点事 · “80后已死5.2%”?这么离谱的假消息! AI的锅? 2 天前 |
|
机器之心 · 出人意料!DeepSeek-R1用的GRPO其实没必要?规模化强化学习训练用PPO就够了 2 天前 |
|
催眠大师JY · 你还在这么点ADC天赋?这个点法胜率翻倍 8 年前 |
|
医药代表 · 诺华制药一季度盈利下降 7 年前 |
|
一个人Alone · 为什么我们对第一个爱的人念念不忘? 7 年前 |
|
深圳特区报 · 进入7月,这7种疾病高发!尤其小心第三种,今年深圳多了6成病例 7 年前 |
|
生物通 · 《Immunity》:以一己之力对抗慢性病毒感染 7 年前 |