专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
目录
相关文章推荐
爱可可-爱生活  ·  【[41星]AnyText2:让文本生成与编 ... ·  21 小时前  
新智元  ·  讯飞星火X1单挑满血版DeepSeek-R1 ... ·  昨天  
爱可可-爱生活  ·  【[49星]Code-R1:用可靠奖励重现代 ... ·  昨天  
量子位  ·  Claude公司估值615亿美元再融35亿, ... ·  2 天前  
黄建同学  ·  微软发布的 Magma ... ·  3 天前  
51好读  ›  专栏  ›  爱可可-爱生活

【[44星]OpenCoder-llm/opc_data_fil-20250305140102

爱可可-爱生活  · 微博  · AI  · 2025-03-05 14:01

正文

2025-03-05 14:01

【[44星]OpenCoder-llm/opc_data_filtering:为大规模代码预训练语料库量身打造的启发式过滤框架。亮点:1. 超过100条过滤规则,精准清洗代码数据;2. 灵活的规则配置,支持多种编程语言;3. 易于扩展,可快速适配不同数据集】
'Heuristic filtering framework for RefineCode'
GitHub: github.com/OpenCoder-llm/opc_data_filtering
#代码过滤# #数据清洗# #开源框架# #AI创造营#






请到「今天看啥」查看全文