专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
目录
相关文章推荐
Web3天空之城  ·  【天空访谈·播客】AI, DeepSeek ... ·  20 小时前  
Web3天空之城  ·  【天空访谈·播客】AI, DeepSeek ... ·  20 小时前  
命里有票  ·  用DeepSeek和豆包分别计算了一个日期问 ... ·  22 小时前  
命里有票  ·  用DeepSeek和豆包分别计算了一个日期问 ... ·  22 小时前  
营销之美  ·  DeepSeek使用图鉴:人类和AI谁在玩弄谁? ·  22 小时前  
营销之美  ·  DeepSeek使用图鉴:人类和AI谁在玩弄谁? ·  22 小时前  
爱可可-爱生活  ·  【[445星]EvalScope:一站式大模 ... ·  昨天  
51好读  ›  专栏  ›  爱可可-爱生活

【Savanna:为卷积多混合模型(StripedHyena 2-20250221141645

爱可可-爱生活  · 微博  · AI  · 2025-02-21 14:16

正文

2025-02-21 14:16

【Savanna:为卷积多混合模型(StripedHyena 2)预训练提供强大基础设施。亮点:1. 支持大规模分布式训练,优化千卡集群性能;2. 提供多种优化技术,如a2a和p2p上下文并行化;3. 已成功训练多个模型,如StripedHyena 7B和Evo 2 40B,覆盖超9T tokens】
'Savanna: Pretraining infrastructure for research and application of convolutional multi-hybrid models (StripedHyena 2).'
GitHub: github.com/Zymrael/savanna
#深度学习# #预训练模型# #大规模训练# #AI创造营#






请到「今天看啥」查看全文