专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
目录
相关文章推荐
爱可可-爱生活  ·  【DeepSeek-R1图解:深度解析Dee ... ·  2 天前  
爱可可-爱生活  ·  【[22星]AttentionEngine: ... ·  3 天前  
爱可可-爱生活  ·  【[112星]mini_qwen:从零开始打 ... ·  3 天前  
爱可可-爱生活  ·  这篇论文创新性地提出了 ... ·  3 天前  
爱可可-爱生活  ·  【[43星]ComplexFuncBench ... ·  4 天前  
51好读  ›  专栏  ›  爱可可-爱生活

通过将大型语言模型等效为马尔可夫链,推导了其预训练和上下文学习的-20241013053121

爱可可-爱生活  · 微博  · AI  · 2024-10-13 05:31

正文

2024-10-13 05:31

通过将大型语言模型等效为马尔可夫链,推导了其预训练和上下文学习的泛化界,通过实验验证了模型优越的马尔可夫链学习能力以及与模型参数和数据之间的关系,揭示了LLM令人意想不到的马尔可夫链学习能力。
[LG]《Large Language Models as Markov Chains》O Zekri, A Odonnat, A Benechehab, L Bleistein... [ENS Paris-Saclay & Huawei Noah’s Ark Lab] (2024) 网页链接 #机器学习##人工智能##论文#