编者注: Anthropic 发布了一份研究报告,分析了 AI 对劳动力市场的影响。他们通过分析 Claude.ai 上约一百万次对话数据得出以下发现:1) 目前 AI 主要用于软件开发和技术写作,约 36% 的职业在四分之一的相关任务中使用 AI,4% 的职业在四分之三的任务中使用 AI;2) AI 更倾向于增强人类能力(57%)而非自动化(43%);3) AI 使用更多集中在中高薪职业,如程序员和数据科学家,而在最低和最高薪职业中的使用率较低。
在未来几年中,AI 系统将对人们的工作方式产生重大影响。因此,我们正在启动 Anthropic 经济指数,这是一个旨在随时间了解 AI 对劳动市场和经济影响的倡议。
该指数的初始报告提供了基于数百万条匿名对话的首次数据和分析,这些对话来自 Claude.ai,揭示了迄今为止关于 AI 如何被纳入现代经济中实际任务的最清晰的画面。
我们还开源了用于此次分析的数据集,以便研究人员可以在我们的发现基础上进行构建和扩展。为了应对劳动市场即将发生的转变及其对就业和生产力的影响,制定政策响应将需要多种视角。为此,我们还邀请经济学家、政策专家和其他研究人员提供意见对指数进行反馈。
经济指数首份报告的主要发现包括:
- 如今,使用集中在软件开发和技术写作任务上。超过三分之一的职业(大约 36%)在至少四分之一的相关任务中使用 AI,而大约 4% 的职业在其三分之四的相关任务中使用 AI。
- AI 的使用更倾向于增强(57%),在这种情况下 AI 与人类合作并增强人类能力,相比之下自动化(43%)则是 AI 直接执行任务。
- AI 的使用在与中高薪职业相关的任务中更为普遍,如计算机程序员和数据科学家,但在最低和最高薪酬的角色中使用较少。这可能反映了当前 AI 能力的限制,以及使用该技术的实际障碍。
请参阅下文,了解我们的初步发现详情。
从 Claude.ai 的实际使用数据中提取的,关于 AI 在经济各领域的使用情况及方式。这些数字指的是与 Claude 进行的对话中,与这些个别任务、职业和类别相关的百分比。
在劳动市场上绘制 AI 使用图谱
我们的新论文基于对技术对劳动市场影响的长期研究,从工业革命时期的纺织杰妮到当今的汽车制造机器人。我们关注 AI 的持续影响。我们不对人们的 AI 使用进行调查,也不试图预测未来;相反,我们直接拥有 AI 实际使用的数据。
分析职业任务
我们的研究始于经济学文献中的一个重要洞见:有时,关注_职业任务_而不是_职业本身_是有意义的。工作通常有一些共同的任务和技能:例如,视觉模式识别是设计师、摄影师、安全检查员和放射科医生执行的任务。
某些任务更适合被新技术自动化或增强。因此,我们预期 AI 会被选择性地用于不同职业的不同任务,而分析任务——除了整体工作——将为我们提供一个更全面的图片,了解 AI 如何被整合到经济中。
使用 Clio 将 AI 使用与任务匹配
这项研究得以实现,多亏了 Clio,一个允许我们在保护用户隐私的同时分析与 Claude 的对话的系统。我们在大约一百万次与 Claude(具体来说,是 Claude.ai 上的 Free 和 Pro 对话)的对话数据集上使用了 Clio,并利用它按职业任务组织对话。
我们根据美国劳工部的分类选择了任务,该部门维护着一个包含大约 20,000 个特定工作相关任务的数据库,称为职业信息网络,或 O*NET。Clio 将每次对话与最能代表对话中 AI 角色的 O*NET 任务匹配(下图总结了这一过程)。然后,我们遵循 O*NET 方案,将任务分组到它们最能代表的职业中,再将这些职业分组到一小组总体类别中:教育与图书馆、商业与金融 等等。
我们的 Clio 系统如何将与 Claude 的对话(严格保密;左上)翻译成职业任务(中上)和从 O*NET 派生的职业/职业类别(右上)。然后,这些可以输入到各种分析中(下排;下文将更详细讨论)。
结果
按职业类型使用 AI 的情况。 在我们的数据集中,采用 AI 最多的任务和职业远远是“计算机和数学”类别,这在很大程度上涵盖了软件工程角色。37.2% 发送给 Claude 的查询属于此类别,涵盖了软件修改、代码调试和网络故障排除等任务。
第二大类别是“艺术、设计、体育、娱乐和媒体”(查询的 10.3%),主要反映了人们使用 Claude 进行各种写作和编辑。不出所料,涉及高度体力劳动的职业,如“农业、渔业和林业”类别(查询的 0.1%),代表性最低。
我们还将我们的数据中的比率与每个职业在整体劳动市场中出现的比率进行了比较。比较结果如下图所示。
对于每种职业类型,与 Claude 的相关对话的百分比以橙色显示,与美国经济中拥有该职业类型的工人百分比(来自美国劳工部的 O*NET 类别)以灰色显示。
职业内 AI 使用的深度。 我们的分析发现,很少有职业在大多数相关任务中使用 AI:只有大约 4% 的工作至少有 75% 的任务使用了 AI。然而,更适度的 AI 使用则更为普遍:大约 36% 的工作至少有 25% 的任务使用了 AI。
正如我们预测的,这个数据集中没有证据表明工作被完全自动化:相反,AI 在经济中的许多任务中被广泛应用,对某些任务群体的影响比其他任务群体更大。
AI 使用与薪资。 O*NET 数据库为列出的每个职业提供了美国的中位数薪资。我们将这些信息添加到我们的分析中,这使我们能够比较职业的中位数薪资和相应任务中 AI 使用的水平。
有趣的是,低薪和非常高薪的工作都有非常低的 AI 使用率(这些通常是涉及大量手工灵巧度的工作,如洗发水使用者和产科医生)。在中高薪范围内的特定职业,如计算机程序员和文案撰稿人,在我们的数据中是 AI 使用最频繁的用户之一。
年薪(x 轴)与与 Claude 进行的对话中涉及该职业的百分比(y 轴)。一些具有代表性的职业被突出显示。
自动化与增强。 我们还更详细地查看了任务是如何被执行的——具体来说,是哪些任务涉及到“自动化”(AI 直接执行任务,如格式化文档)与“增强”(AI 与用户合作执行任务)。
总的来说,我们看到了轻微倾向于增强,57% 的任务被增强,43% 的任务被自动化。也就是说,在一半以上的情况下,AI 不是用来替代人们执行任务,而是与他们一起工作,参与诸如验证(例如,复核用户的工作)、学习(例如,帮助用户获取新的知识和技能)和任务迭代(例如,帮助用户头脑风暴或执行重复的、生成性任务)等任务。
与 Claude 对话中涉及增强与自动化的百分比,以及每个类别内任务子类型的细分。子类型在我们的论文中定义如下。指令:以最少的互动完成任务委派;反馈循环:通过环境反馈指导任务完成;任务迭代:协作细化过程;学习:知识获取和理解;验证:工作验证和改进。
注意事项
我们的研究提供了一个独特的视角,展示了 AI 如何改变劳动市场。但像所有研究一样,它有重要的局限性。其中一些包括:
- 我们无法确定使用 Claude 完成任务的人是否是在工作中完成任务。有人向 Claude 寻求写作或编辑建议 可能 是在工作中进行,但他们也可能是在写作爱好的小说。
- 相关地,我们不知道用户 如何 使用 Claude 的回应。例如,他们是否在复制粘贴代码片段?他们是否在核实回应或不加批判地接受?我们数据中出现的一些看似自动化的行为实际上可能是增强:例如,用户可能会要求 Claude 为他们写一份完整的备忘录(这会被视为自动化),但之后他们自己编辑它(这将是增强)。
- 我们还只分析了来自 Claude.ai 免费和专业计划的数据,而不是 API、团队或企业用户的数据。虽然 Claude.ai 数据包含一些非工作对话,我们使用了一个语言模型来过滤这些数据,只包含与职业任务相关的对话,这有助于缓解这一担忧。
- 不同任务的数量众多,意味着 Clio 可能将一些对话错误地分类(请参阅完整论文,特别是附录 B,了解我们如何验证分析的细节);
- Claude 不能生成图像(除了通过代码间接生成),因此一些创造性的用途不会在数据中被提及;
- 鉴于 Claude 被宣传为最先进的编码模型的使用,我们可能预期编码作为一个用例被过度代表。因此,我们不认为我们数据集中的用途是 AI 使用的代表性样本。
结论和未来研究
AI 的使用正在迅速扩展,模型变得越来越能干。劳动力市场的情况可能在相对短的时间内看起来完全不同。因此,我们将随着时间的推移重复上述许多分析,以帮助跟踪可能发生的社会和经济变化。我们将定期发布结果和相关数据集,作为 Anthropic 经济指数的一部分。
这类纵向分析可以给我们提供关于 AI 和就业市场的新见解。例如,我们将能够监测 AI 在职业中使用深度的变化。如果 AI 仍然只用于特定任务,并且只有少数工作将 AI 用于其绝大多数任务,未来可能是大多数当前工作演变而非消失的未来。我们还可以监测自动化与增强的比率,提供自动化变得更普遍的领域的信号。
我们的研究提供了关于 AI 如何被使用的数据,但它不提供政策建议。关于如何为 AI 对劳动力市场的影响做准备的问题的答案不能直接来自孤立的研究;相反,它们将来自于广泛视角的证据、价值观和经验的结合。我们期待使用我们的新方法论为这些问题提供更多光明。
阅读完整论文以获取我们分析和结果的更多细节。
开放数据和征求意见
本文及人类经济指数最重要的贡献是其提供了关于 AI 影响的详细数据的新方法论。我们将立即公开分享我们用于上述分析的数据集,并计划在未来可用时分享更多此类数据集。
完整的数据集可以在这里下载。
研究人员提供关于我们数据的反馈并建议新的研究方向的表格在这里。
致谢
我们感谢 Jonathon Hazell、Anders Humlum、Molly Kinder、Anton Korinek、Benjamin Krause、Michael Kremer、John List、Ethan Mollick、Lilach Mollick、Arjun Ramani、Will Rinehart、Robert Seamans、Michael Webb 和 Chenzi Xu 对本文早期发现和草稿的建设性评论和讨论。
与我们合作
如果您对在 Anthropic 工作,研究 AI 对劳动市场的影响感兴趣,我们鼓励您申请我们的社会影响研究科学家和研究工程师角色。
脚注
1Clio 汇总大量对话,并将它们归类为更高级别的类别进行分析。重要的是,为了保护用户隐私,它能够在不让人类研究者看到原始对话的情况下进行。您可以在这里阅读更多关于 Clio 的信息。