专栏名称: 爱可可-爱生活

知名互联网资讯博主北邮PRIS模式识别实验室陈老师

相关文章推荐

宝玉xp · 谁正在赚钱？通过分析 Stripe ... · 4 天前

宝玉xp · AI可以在设计好的工作流中充当重要角色，但是 ... · 5 天前

DataFunTalk · AI搜索在快消领域的最佳实践 · 5 天前

爱可可-爱生活 · [CL]《Does your LLM ... · 1 周前

爱可可-爱生活 · 本文通过将语言模型建模为广义结构方程模型并提 ... · 1 周前

51好读 › 专栏 › 爱可可-爱生活

【llama3_interpretability_sae：一个完-20241123155732

爱可可-爱生活 · 微博 · AI · 2024-11-23 15:57

正文

2024-11-23 15:57
本条微博链接

【llama3_interpretability_sae：一个完整的大语言模型(LLM)可解释性研究项目，使用稀疏自编码器(SAE)分析Llama 3.2模型，由纯PyTorch实现且可完全复现。包含从数据采集、SAE训练、特征分析到验证的全套流程，可帮助理解模型内部行为和概念表示】
'A complete end-to-end pipeline for LLM interpretability with sparse autoencoders (SAEs) using Llama 3.2, written in pure PyTorch and fully reproducible.'
GitHub: github.com/PaulPauls/llama3_interpretability_sae
#机器学习# #模型可解释性# #大语言模型# #神经网络#