专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
目录
相关文章推荐
黄建同学  ·  2025年会不会跳票,出来后易用不易用不敢说 ... ·  5 小时前  
爱可可-爱生活  ·  通过统一稀疏注意力机制实现高效的长序列大语言 ... ·  8 小时前  
爱可可-爱生活  ·  【[122星]funtrace:一款为C/C ... ·  2 天前  
爱可可-爱生活  ·  【[370星]simple_GRPO:一个简 ... ·  2 天前  
量子位  ·  DeepSeek满血微调秘籍开源!站在巨人肩 ... ·  3 天前  
51好读  ›  专栏  ›  爱可可-爱生活

【[445星]EvalScope:一站式大模型评估与性能基准测试-20250221141932

爱可可-爱生活  · 微博  · AI  · 2025-02-21 14:19

正文

2025-02-21 14:19

【[445星]EvalScope:一站式大模型评估与性能基准测试框架,让模型评估变得高效且个性化。亮点:1. 支持多种模型类型,涵盖大语言模型、多模态、嵌入模型等;2. 提供多种评估场景,包括端到端RAG评估、竞技场模式和推理性能测试;3. 内置丰富基准测试和指标,如MMLU、CMMLU和GSM8K】
'EvalScope is a streamlined and customizable framework for efficient large model evaluation and performance benchmarking'
GitHub: github.com/modelscope/evalscope
#模型评估# #性能基准# #多模态# #AI创造营#






请到「今天看啥」查看全文