本文转自微信公众号“新智元”,作者:新智元。
【导读】
据悉,Anthropic本周会提前放出Claude 4?并且,一份38页Anthropic经济指数报告放出,结论是43%的人类工作正在被自动化!一个有趣的现象是:低薪和高薪职业中,AI使用率都很低。
Claude 3.5 Opus无了,Anthropic本周可能会提前放出Claude 4。
网友爆料称,除了Claude 4,还有推理模型也将首亮相,评分全面超越o3。
Anthropic已经沉寂太久了,去年曾被传出内部模型研发受阻。
不久前,或许因为DeepSeek的冲击,OpenAI、谷歌密集上新了新模型全家桶。
这次Anthropic要直接来一波大的:评分超越「满血」o3,那可是目前公认的比DeepSeek-R1强的对手!
同一天,他们还发布了「Anthropic经济指数」报告,全文38页全面分析了数百万匿名Claude对话,从中揭示了AI在各个职业的应用现状。
Anthropic认为在未来几年,AI对人们的工作将产生重大影响,最新报告旨在长期追踪AI对劳动力市场和经济的影响。
论文链接:https://assets.anthropic.com/m/2e23255f1e84ca97/original/Economic_Tasks_AI_Paper.pdf
在这篇报告中,Anthropic从任务类型、使用深度、职业技能、收入水平等角度,讨论了AI对不同职业不同群体的影响。
主要结论如下:
-
AI的使用主要集中在软件开发和写作任务上,这两者占总使用量的近50%。
-
AI的使用范围更广泛,约有36%的职业在至少四分之一的相关任务中使用AI;在中等至高收入的工作中使用最为普遍。
-
在各类任务中,57%的使用表明AI在增强人类能力,而43%的使用表明在取代人类劳动,即工作自动化。
更值得一提的是,Cluade编码和数学占所有
使用量1/3(37.2%)。
为什么发布「经济指数」?
基于Claude.ai平台上数百万条匿名对话数据,该指数的首份报告提供了前所未有的分析和洞察,揭示在现代经济的各类任务中,如何实际应用AI。
迄今为止,这是关于AI融入现实经济活动的最清晰图景。
为了推动更广泛的研究,Anthropic决定开源本次分析所使用的数据集,供研究人员在此基础上进一步探索和扩展。
项目地址:https://huggingface.co/datasets/Anthropic/EconomicIndex
面对劳动力市场即将到来的转型及其对就业和生产力的影响,制定有效的政策措施需要多方视角,统筹兼顾。
因此,Anthropic诚挚邀请经济学家、政策专家及其他研究人员提供宝贵意见。
新论文基于对技术影响劳动力市场的长期研究,从工业革命时期的珍妮纺纱机到当今的汽车制造机器人。
关注AI(AI)的持续影响。新研究不调查人们的AI使用情况,也不尝试预测未来;相反,直接获取了AI实际使用的数据。
分析职业任务
新研究始于经济学文献中的重要洞见:有时候,关注职业任务而非职业本身,也有意义。
工作通常共享某些任务和技能:例如,视觉模式识别是设计师、摄影师、安检员和放射科医生共同完成的任务。
因此,预计AI会在不同职业中有选择地被采用,分析任务(而不仅仅是整体工作)将提供一个更全面的图景,展示AI如何融入经济。
使用Clio匹配AI使用与任务
这项研究得以实现,依靠的是Clio系统。在保护用户隐私的同时,它可以分析与Claude的对话。
新研究分析了约一百万次与Claude的对话(包括Free和Pro版本的对话),并按职业任务对对话进行分类。
美国劳工部维护着一个包含约20,000项具体工作任务的数据库,称为职业信息网络(O*NET)。
在线职业分类:https://www.onetonline.org/
根据美国劳工部的分类选择任务,Clio将每次对话与最能代表对话中AI角色的O*NET任务进行匹配。
Clio系统将与Claude的对话(严格保密,位于下图顶部左侧)转化为职业任务(下图顶部中间),并进一步映射到O*NET提供的职业/职业类别(顶部右侧)。
随后,这些数据可以输入到多种分析中(下图底部一行)。
最后,按照O*NET的分类方案,将任务分组到它们最能代表的职业中,并将职业分组到一小组总体类别中:教育和图书馆、商业和金融等。
算法流程总结
对不同职业影响
采用AI最多的任务和职业是「计算机与数学」类别,主要涵盖了软件工程角色。
37.2%的Claude查询属于这一类别,涉及的任务包括软件修改、代码调试和网络故障排除。
第二大类别是「艺术、设计、体育、娱乐和媒体」(10.3%的查询),主要反映了使用Claude进行各种写作和编辑任务。
不出所料,涉及大量体力劳动的职业,如「农业、渔业和林业」类别(0.1%的查询),在数据中表现最少。
新研究还将数据中的比例与各职业在整体劳动力市场中的出现率进行了比较,详细结果如下图所示。
职业内部AI使用程度
分析发现,在工作中AI的重度用户集中在极少数职业:仅约4%的职业在至少75%的任务中使用AI。
AI的中等使用率更为普遍:大约36%的职业,在至少25%的任务中一定程度地使用AI。
AI在经济中的应用分布:基于Claude.ai的真实使用数据。数据中的百分比表示与Claude的对话中涉及特定任务、职业及类别的比例。