专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
目录
相关文章推荐
AI范儿  ·  DeepSeek 日活破 2570 ... ·  昨天  
AI范儿  ·  DeepSeek 日活破 2570 ... ·  昨天  
爱可可-爱生活  ·  【《深入大语言模型》随书代码】 ... ·  3 天前  
爱可可-爱生活  ·  【[52星]N8loom:基于树结构的前缀缓 ... ·  3 天前  
爱可可-爱生活  ·  【Stanford CS236 Deep ... ·  3 天前  
51好读  ›  专栏  ›  爱可可-爱生活

【[29星]Episodic Memory Benchmark:-20250208141604

爱可可-爱生活  · 微博  · AI  · 2025-02-08 14:16

正文

2025-02-08 14:16

【[29星]Episodic Memory Benchmark:为大语言模型的“记忆能力”打造专属测试场!核心价值在于精准评估LLM对事件的编码、存储和回忆能力。亮点:1. 提供11种不同风格和规模的合成数据集,涵盖20-2000章节;2. 采用独特评分体系,涵盖“简单回忆”与“时间感知”两大维度;3. 详细记录21次提交,数据透明可追溯】
'Episodic Memories Generation and Evaluation Benchmark for Large Language Models'
GitHub: github.com/ahstat/episodic-memory-benchmark
#大语言模型# #记忆评估# #合成数据集# #AI创造营#






请到「今天看啥」查看全文