专栏名称: 知识产权家
每日分享全球知识产权热点资讯与案例,助力国家知识产权战略实施,与中国知识产权人相伴成长。
目录
相关文章推荐
吃什么情报局  ·  疯了!7条39.9元!3A级抗JUN纯棉内裤 ... ·  昨天  
每天学点做饭技巧  ·  可媲美大牌的平价冲牙器,360度全方位清洁口 ... ·  2 天前  
每天学点做饭技巧  ·  拯救你的睡眠!睡前喷一喷。 ·  2 天前  
51好读  ›  专栏  ›  知识产权家

北京人工智能数据运营平台发布

知识产权家  · 公众号  ·  · 2024-06-18 11:35

正文

2024年北京智源大会开幕,会上发布“北京人工智能数据运营平台”,包括平台上线、重磅数据集开源和数据工具FlagData3.0。

据悉,北京人工智能数据运营平台是在国家发展改革委、国家数据局的指导下,由北京市发展改革委主导建设。该平台由市委网信办、市科委、市经信局、海淀区政府、中国网络空间安全协会人工智能安全治理专委会等单位支持,由智源研究院牵头,与京能数产等单位共同建设和推动,旨在打造开放型的数据运营平台。

本次发布的北京人工智能数据运营平台,汇集大量通用数据和行业数据,支持文本、图像、视频等多种模态,并提供全流程的数据处理工具。平台拥有超过700万亿字节的通用数据集,用于通用模型训练,同时,4.33万亿字节的行业垂类数据也为模型训练提供重要支持。目前,数据集涵盖医疗、教育、法律、新闻等18个行业的数据。未来,平台计划将数据扩展到约30个行业,以进一步提升数据的广泛性和应用价值。

针对不同数据特点,平台明确三种数据使用方式。一是开放领域采集的数据集将开源处理,用户可以免费下载。二是有意向互换高质量数据集的主体可以参与构建数据池,实现合作共建和共享数据集。三是对于高价值数据集,平台采用数算一体模式,确保数据在加工和训练过程中不出安全域,从而保障数据安全。

来源: AIGverse









请到「今天看啥」查看全文