2024年4月,斯坦福大学发布《2024年人工智能指数报告》。
赛迪智库知识产权所和政策法规所
对该报告进行了编译,期望对我国相关决策部门提供参考和借鉴。
该报告在全球范围内具有极高的影响力,是美国、英国和欧盟等经济体政策制定者的重要参考资料。斯坦福大学已连续7年发布人工智能指数报告,今年发布的报告是迄今为止最全面的版本,梳理总结了人工智能的研发、技术性能、负责任的人工智能、经济、科学与医学、教育、政策与治理、舆论等方面的进展情况,分析了人工智能技术进步、公众对人工智能技术的看法以及人工智能发展的地缘政治动态等重要趋势。
(一)出版物
1. 从2010年到2022年,全球人工智能出版物总数增加两倍,机器学习领域出版物自2015年以来增长近七倍
从2010年到2022年,人工智能出版物总数增加近两倍,从2010年约88000篇增加到2022年240000多篇。过去十年,机器学习领域出版物增长最为迅猛(见图1),自2015年以来增长近七倍。继机器学习之后,2022年人工智能领域发表出版物最多的是计算机视觉(21309篇)、模式识别(19841 篇)和流程管理(12052篇)。
2.学术界是过去十年间全球所有地区人工智能研究主要来源
2022年,大部分人工智能出版物(81.1%)出自学术界,而学术界也是过去十年间全球所有地区人工智能研究主要来源(见图2)。
(二)专利
1. 近十年,人工智能专利数量显著增加,且全球已授权的人工智能专利大部分来自中国和美国
过去十年,人工智能专利数量显著增加。如2010年至2014年间,人工智能专利授权总量增长了56.1%;仅从2021年到2022年,人工智能专利数量就增长了62.7%。截至2022年,全球大部分已授权的人工智能专利(75.2%)来自东亚和太平洋地区(见图3),其次是北美洲,占21.2%。按地理区域划分,全球已权的人工智能专利大部分来自中国(61.1%)和美国(20.9%)。
(三)前沿人工智能研究
1.自2014年起,产业界开始引领机器学习模型发展
2023年,产业界推出了51个著名机器学习模型,而学术界只有15个。值得注意的是,2023年有21个著名模型是由产业界/学术界合作产生的,创下新高。创建尖端的人工智能模型需要大量的数据、计算能力和财政资源,产业界的主导地位日益增强。
2.2023年,著名机器学习模型总数排名前三的国家分别为美国、中国和法国
2023年,美国以61个著名机器学习模型遥遥领先,中国以15个紧随其后,法国以8个紧随其后。自2003年以来,美国生产的模型数量超过了英国、中国和加拿大等其他主要地区。自2019年以来,欧盟和英国首次在生产的著名人工智能模型数量上超过中国(见图4)。
3.机器学习模型中的参数是在训练过程中学习到的数值,参数较多的模型通常优于参数较少的模型
自2010年代初以来,Epoch数据集中机器学习模型参数总数急剧上升,这反映了人工智能模型设计任务的日益复杂性、数据可用性的提高、硬件的改进以及大型模型经证实的有效性。高参数模型在工业领域尤为突出,这表明OpenAI、Anthropic和谷歌等公司有能力承担海量数据训练的计算成本。
4.模型的复杂程度和训练数据集的大小会直接影响所需的计算量。模型越复杂,底层训练数据越大,训练所需的计算量就越大
最近,著名人工智能模型的计算用量呈指数级增长,这一趋势在过去五年尤为明显。计算需求的快速增长具有重要影响,如需要更多计算的模型通常会对环境造成更大的影响,而公司通常比学术机构更容易获得计算资源。图6显示了自2012年以来著名机器学习模型的训练计算量,如2017年发布的原始Transformer需要约7400每秒千万亿次浮点运算;谷歌的Gemini Ultra是目前最先进的基础模型之一,需要500亿每秒千万亿次浮点运算。
(一)时间轴:重要模型发布
(二)人工智能性能状况
截至2023年,人工智能在一系列任务中已达到超越人类能力的性能水平。图7显示了人工智能系统在与九项任务(如图像分类或基础阅读理解)相对应的九项人工智能基准方面相对于人类基线所取得的进展。仍有一些任务类别的人工智能未能超越人类能力,这些是更复杂的认知任务,如视觉常识推理和高级数学问题解决(竞赛级数学问题)。