专栏名称: 爱可可-爱生活

知名互联网资讯博主北邮PRIS模式识别实验室陈老师

目录

相关文章推荐

黄建同学 · 2025年会不会跳票，出来后易用不易用不敢说 ... · 5 小时前

爱可可-爱生活 · 通过统一稀疏注意力机制实现高效的长序列大语言 ... · 8 小时前

爱可可-爱生活 · 【[122星]funtrace：一款为C/C ... · 2 天前

爱可可-爱生活 · 【[370星]simple_GRPO：一个简 ... · 2 天前

量子位 · DeepSeek满血微调秘籍开源！站在巨人肩 ... · 3 天前

51好读 › 专栏 › 爱可可-爱生活

【[445星]EvalScope：一站式大模型评估与性能基准测试-20250221141932

爱可可-爱生活 · 微博 · AI · 2025-02-21 14:19

正文

2025-02-21 14:19
本条微博链接

【[445星]EvalScope：一站式大模型评估与性能基准测试框架，让模型评估变得高效且个性化。亮点：1. 支持多种模型类型，涵盖大语言模型、多模态、嵌入模型等；2. 提供多种评估场景，包括端到端RAG评估、竞技场模式和推理性能测试；3. 内置丰富基准测试和指标，如MMLU、CMMLU和GSM8K】
'EvalScope is a streamlined and customizable framework for efficient large model evaluation and performance benchmarking'
GitHub: github.com/modelscope/evalscope
#模型评估# #性能基准# #多模态# #AI创造营#

请到「今天看啥」查看全文

推荐文章

黄建同学 · 2025年会不会跳票，出来后易用不易用不敢说。但是我们在这个方向-20250222111107

5 小时前

爱可可-爱生活 · 通过统一稀疏注意力机制实现高效的长序列大语言模型服务查看图片-20250222080217

8 小时前

爱可可-爱生活 · 【[122星]funtrace：一款为C/C++开发者量身打造的-20250220140750

2 天前

爱可可-爱生活 · 【[370星]simple_GRPO：一个简单的 GRPO（Ge-20250219193305

2 天前

量子位 · DeepSeek满血微调秘籍开源！站在巨人肩膀打造私有模型，一手教程在此

3 天前

银幕穿越者 · 票补或将在国庆档回潮达到今年巅峰

8 年前

三节课 · 关于三节课公众号暂时进入“闭关”状态的通告

7 年前

V保险 · 朋友，保证做到这五件事，你根本不用买保险......

7 年前

半导体照明网 · 爱迪生138年的电灯生意要卖了，它最大的贡献不是照明

7 年前

冲蒌老伍 · 台山姣婆约仔，现场烧汁罩

7 年前

Sov5搜索 · 小百科 · 今天看啥 · 移动版

51好读 - 好文章就要读起来!