专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
目录
相关文章推荐
人工智能那点事  ·  微信又双叒叕上新,这次有定制音色了?网友:“ ... ·  3 天前  
量子位  ·  云计算一哥的生成式AI之道:Choice ... ·  3 天前  
众视AsiaOTT  ·  智谱 “钞能力” 上线!30 ... ·  5 天前  
众视AsiaOTT  ·  智谱 “钞能力” 上线!30 ... ·  5 天前  
黄建同学  ·  微软markitdown文档转markdow ... ·  5 天前  
51好读  ›  专栏  ›  爱可可-爱生活

【Common Crawl Web Languages:一个众包-20241221151524

爱可可-爱生活  · 微博  · AI  · 2024-12-21 15:15

正文

2024-12-21 15:15

【Common Crawl Web Languages:一个众包项目,旨在帮助Common Crawl更好地爬取资源较少的语言网页,促进全球各种语言内容的覆盖和可访问性】'commoncrawl/web-languages: Crowd-sourced lists of urls to help Common Crawl crawl under-resourced languages.' GitHub: github.com/commoncrawl/web-languages #语言多样性# #众包项目# #网页爬取# #AI创造营#