专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
目录
相关文章推荐
黄建同学  ·  mark,微调-20250210142341 ·  23 小时前  
爱可可-爱生活  ·  【AgentRecSys:一个专注于基于大型 ... ·  23 小时前  
宝玉xp  ·  Andrej Karpathy ... ·  3 天前  
宝玉xp  ·  哈哈,自从 DeepSeek ... ·  3 天前  
51好读  ›  专栏  ›  爱可可-爱生活

【AxBench:斯坦福NLP团队开发的Python库,用于评估-20250210133807

爱可可-爱生活  · 微博  · AI  · 2025-02-10 13:38

正文

2025-02-10 13:38

【AxBench:斯坦福NLP团队开发的Python库,用于评估大型语言模型(LLM)可解释性方法的实用性。亮点:1. 提供16K概念训练数据,助力模型精准理解;2. 包含10+种可解释性方法,涵盖微调和提示基线;3. 支持LLM-in-the-loop训练,生成数据成本低至0.01美元/概念】
'AxBench: a scalable benchmark that evaluates interpretability techniques on two axes: concept detection and model steering.'
GitHub: github.com/stanfordnlp/axbench
#大型语言模型# #模型可解释性# #数据生成# #AI创造营#






请到「今天看啥」查看全文