专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
目录
相关文章推荐
新智元  ·  微软Muse秒生游戏登Nature,10亿级 ... ·  17 小时前  
爱可可-爱生活  ·  【[15星]OctoTools:一个无需训练 ... ·  19 小时前  
黄建同学  ·  Andrej Karpathy ... ·  昨天  
AI前线  ·  20万卡吞金兽 Grok 3 ... ·  2 天前  
量子位  ·  马斯克“地表最强”Grok ... ·  2 天前  
量子位  ·  马斯克“地表最强”Grok ... ·  2 天前  
51好读  ›  专栏  ›  爱可可-爱生活

【MME-CoT:为多模态大模型的推理能力提供全面评估的基准测试-20250216133710

爱可可-爱生活  · 微博  · AI  · 2025-02-16 13:37

正文

2025-02-16 13:37

【MME-CoT:为多模态大模型的推理能力提供全面评估的基准测试。亮点:1. 覆盖6大领域,包括数学、科学、OCR等,全面评估模型能力;2. 提出3项新指标,深度剖析推理质量、鲁棒性和效率;3. 揭示模型在视觉推理任务中的表现,助力多模态模型发展】
'MME-CoT: Benchmarking Chain-of-Thought in LMMs for Reasoning Quality, Robustness, and Efficiency'
GitHub: github.com/CaraJ7/MME-CoT
#多模态大模型# #推理评估# #AI基准测试# #AI创造营#






请到「今天看啥」查看全文