【[29星]Episodic Memory Benchmark:为大语言模型的“记忆能力”打造专属测试场!核心价值在于精准评估LLM对事件的编码、存储和回忆能力。亮点:1. 提供11种不同风格和规模的合成数据集,涵盖20-2000章节;2. 采用独特评分体系,涵盖“简单回忆”与“时间感知”两大维度;3. 详细记录21次提交,数据透明可追溯】
'Episodic Memories Generation and Evaluation Benchmark for Large Language Models'
GitHub: github.com/ahstat/episodic-memory-benchmark
#大语言模型# #记忆评估# #合成数据集# #AI创造营#
'Episodic Memories Generation and Evaluation Benchmark for Large Language Models'
GitHub: github.com/ahstat/episodic-memory-benchmark
#大语言模型# #记忆评估# #合成数据集# #AI创造营#