人工智能治理专家认证CAIGP™培训课程
Certifitied Artificial Intelligence Governance Professional
CAIGP聚焦如何根据全球新兴法律和标准开发、集成和部署可信AI系统。课程包括AI技术、全球法律框架、全生命周期风险管理及国际标准、可信审查最佳实践等主题。
如果您希望报名培训,或有合作意向?请加微信!
请说明姓名+单位
刘烈宏分享了他基于数据和算力等角度对人工智能高质量发展的一些思考,并表示下一步,国家数据局将把握数字化、网络化、智能化发展的趋势,大力推进数据资源的整合共享和开发利用。
近日,2月29日,2024中关村论坛系列活动——第二届北京人工智能产业创新发展大会举办。会上,国家发展改革委党组成员,国家数据局党组书记、局长刘烈宏受邀发言。
刘烈宏指出,2023年,以ChatGPT为代表的生成式人工智能在语言对话领域率先取得巨大突破,并陆续在计算机、生物、化学等领域取得显著进展。国内诸多企业相继推出大模型及相关的产品,并在互联网服务和行业数据化场景中加速落地,展现出巨大的应用前景。2024年2月,视频生成大模型取得突破性进展,引起全球广泛关注和讨论。大模型技术具有规模扩展性强、多任务适应性、能力可塑性强的特点,并仍在快速迭代、持续研究,有望成为通用人工智能的可行路径之一。
刘烈宏指出:“
我们要充分发挥数据的基础资源作用和创新引擎作用,构建满足人工智能发展需要的数据开放、共享、流通、交易的模式,全面提高数据资源开发利用水平,让数据‘供得出、流得动、用得好’,真正成为人工智能发展的催化剂,推动做强、做优、做大数字经济。”
刘烈宏表示,将数据作为生产要素,是我国首次提出的重大理论创新,这也为我们抢抓人工智能战略机遇奠定了坚实的基础。大模型驱动的人工智能发展对于高质量数据供给提出了更高要求,数据要素的市场化配置和开发利用显得尤为重要。我们要充分发挥数据的基础资源作用和创新引擎作用。
大会现场,刘烈宏分享了他基于数据和算力等角度对人工智能高质量发展的一些思考。在他看来:
第一,高质量数据是人工智能发展的根基。
人工智能技术的历次突破都离不开高质量数据集的支撑。回顾历史,由七万张手写数字图片组成的数据集,促进了图像识别领域的发展,快速推动了数据自动分类和聚类技术的发展;由1400万张各类互联网图片组成的数据集开启了深度学习的时代,极大地提升了人工智能感知技术的能力;由自然语言、编程语言、网络数据等组成的万亿级多模态高质量数据级开启了大模型时代,人工智能开始具备一定的认知交付能力,使得机器认知,甚至通用智能成为可能。
今天数据的“质”和“量”是推动大模型不断进步的关键。例如,在前提条件不变的前提下,使用更高质量的数据集来做训练,能使20亿参数量级的模型超过100亿参数量级的模型。
第二,高性能算力是人工智能发展的基础。
面对生成式人工智能服务和大模型的迅速兴起带来的旺盛的算力需求,需要从算力供给和算力网络调度等方面来做好统筹协调。
从算力供给来看,需要加大低成本、高质量、易使用的算力供给;从算力网络的调度来看,需要做好人工智能、模型训练推理、离线分析等高时延业务等资源匹配,切实提升计算资源的整体使用率。
2023年12月,国家数据局联合有关部门共同印发了《深度实施东数西算工程加快构建全国一体化算力网的实施意见》,从“通用算力、智能算力、超级算力的一体化布局”“东中西部算力一体化协同”“算力数据算法一体化应用”“算力与绿色电力一体化融合”“算力发展与安全保障一体化推进”等五个统筹出发,推动建设联网调度、普惠易用、绿色安全的全国一体化算力网。
第三,行业应用是人工智能落地的关键。
我国超大规模市场为人工智能行业应用提供了丰富的土壤,这是我国推动人工智能应用迈向更高水平的重要优势。
例如在交通物流行业,人工智能技术应用可以助力企业提升运输效率,降低全社会物流的成本;在文化旅游行业开发文化大模型,能够贯通各类文化机构的数据中心,充分挖掘文化数据的价值;在科技创新领域以科学数据支撑大模型的开发,可以更深入地挖掘各类科学数据和科技的文献。