当被问到“你使用人工智能吗?”时,大多数人可能会回答“是”。那么,如果有人问你,“你会把你的工作委托给人工智能吗?”你会怎么说?提出问题和提出问题看似相似,但其实是完全不同的。对方给出答案后,前者就结束了。后者期望对方动动手,为自己完成一些事情。
OpenAI 发布的这份报告根据贵公司的使用数据,从内部角度描述了从“提出问题”到“将事情委托给他人”的转变。而且,有趣的是,在这一变革中取得最大进展的人并不是工程师,而是开始蔓延到与代码关系不大的职业。生动的数字表明,我们与人工智能的交互方式正在悄然但必将进入下一个阶段。
2026 年 6 月,OpenAI 发布了一份分析 Codex 使用数据的报告,“向 Agentic AI 的转变:来自 Codex 的证据”。Drew Johnston 及其同事比较了三组:外部个人用户、组织用户和 OpenAI 员工。从 2026 年 1 月 1 日到 2026 年 6 月 1 日,Codex 的每周活跃用户增加了 5 倍以上。
截至 6 月 11 日,Codex 占 OpenAI 员工 ChatGPT 和 Codex 总体产出代币的 99.8%,组织用户占 63.3%,个人用户占 16.5%。组织帐户中的工程师平均在 Codex 中产生 26.8%,比年初增加了 5 倍。请求估计需要超过 8 小时的任务的个人用户百分比从 2.1% 增加到 25.6%。 26.6% 的用户使用了技能,而 OpenAI 员工的这一比例为 96.2%。 OpenAI 法律职位员工的月产出代币价值中位数是 2025 年 11 月的 13 倍,研究职位员工的月产出代币价值中位数超过 50 倍。
【编辑部评论】
这份报告由 OpenAI 以其研究组织“经济研究”的名义发布,AI使用方式从“对话”转向“委托”的转折点这是从我们自己内部数据的罕见观察点得出的。我为什么现在提出这个?原因很简单,因为第一次有大量证据表明,我们每天与之互动的聊天型人工智能(例如ChatGPT)已经开始过渡到下一个阶段。
首先要理解“代理”一词的含义。传统的聊天机器人仅限于回答问题和生成句子。另一方面,基于代理的人工智能读取文件、执行命令并重塑工件本身。换句话说,一个代表人类“执行工作”的实体。是。该报告根据用户“委托”的内容来衡量这种差异。
解释数字时必须小心。 Codex 占 OpenAI 内产出代币 99.8% 的事实令人印象深刻,但这仅适用于非常特殊的公司员工群体。外部组织用户的这一比例为 63.3%,个人用户的比例为 16.5%。 OpenAI 本身声明,它并不代表一个典型的组织。将该公司的内部数据视为反映“摩擦消失的未来”的实验室是恰当的。大概。
扩展到非开发人员是本报告的核心。据OpenAI官方博客《代理如何改变工作》显示,自2025年8月以来,非开发者用户的数量对于个人来说将增加137倍,对于组织来说将增加189倍。有人指出,即使在法律事务和招聘等看似与代码无关的工作中,Codex也已成为主要工具。人工智能代理在工程之外可以做什么的一个很好的例子是。
我想在这里添加一个更批判性的观点。 The Register、The Next Web等海外媒体指出,本报告中所有数据均由OpenAI自行报告,未经第三方验证。 The Register 打趣道,虽然法律团队的代币数量增加了 13 倍,但同期针对该公司的美国联邦诉讼数量从 35 起增加到 39 起(增长约 11%)。代币生成量的“投入量”指标并不一定意味着“结果的数量”或“质量的提高”。这个问题是一个重要的保留,读者应该冷静对待。
尽管如此,多家媒体都承认这种变化是真实的。我们想关注的是报告所进行的历史类比。作者引用了 David (1990) 的观点,他研究了从蒸汽机到电力的转变,技术的真正价值体现不是在“取代现有作品”的阶段,而是在“重新设计作品本身”的阶段我在争论。由于基于代理的人工智能不需要重新设计工厂等巨大的固定成本,因此其采用速度可能比过去的通用技术更快。这一观察结果充满了建议。
我们已经看到了技术的轮廓。超过 10% 的用户每周同时管理三个或更多代理,在 OpenAI 中,第 99% 的员工每天运行大约 71 小时的代理工作。人类一起工作和“监督”多个代理的方式与个人用手工作的方式有本质上的不同。是。
一个不可忽视的长期影响是工作的重组。报告预测,日常执行任务将变得不那么重要,而判断、监督、协调和审查将变得更加重要。团队构成、招聘需求、职业阶梯、按技能级别划分的工作分配——由于深入探讨了这些重新安排的可能性,本报告的政策范围超出了单纯的产品推广。。
从监管和治理的角度来看,代理自主运营的时间越长,验证其输出的成本和责任的定位就越容易受到质疑。报告本身反复强调,适当的人工审核流程是实现价值的先决条件。“能够快速做出某件事”和“能够正确完成它”之间仍然存在差距,而填补这一差距的组织能力将是下一个竞争轴心。,这就是我们的阅读。
【术语解释】
代理类型AI
代表用户自主行动的人工智能。与以回答问题结束的会话方法不同,其特点是可以委派和执行多步骤任务,例如读取文件、执行命令和修改可交付成果。
法典
OpenAI 基于代理的编码和业务平台。它于 2025 年 4 月首次发布,最初旨在软件开发,但其用途也扩展到非编码任务,例如文档创建和数据分析。
输出标记
AI 模型生成的最小信息单元。本报告重点关注代币数量而非活跃用户数量作为衡量使用“强度”的指标。然而,它是输入的数量,并不一定对应于输出的数量或质量。
技能/插件
一种将重复性工作组织成可重用形式的机制。技能是一组定义工作流程的指令,插件是捆绑技能和外部工具集成的分发单元。它可以在团队和组织之间共享,并有助于标准化工作流程。
并行度(concurrency)
用户同时运行多个 Codex 代理的程度。它被用作衡量向人类领导和监督代理团队的工作方式转变的指标。
外延的margin/内包的margin(extensive/intensive margin)
经济分析术语。前者指的是“人们是否首先使用它”,后者指的是“人们使用它的深度”。本报告将两者分开并衡量实际的实施情况。
泛用技术(general-purpose technology)
传播到整个经济并改变生产模式本身的基础技术。蒸汽机和电力是典型的例子,报告将代理型人工智能归入这一谱系。
马具
围绕AI模型和控制工具使用、内存和护栏的一组机制。 “代理由模型和安全带组成,”Codex 产品总监 Thibault Sautiaux 解释道。
[参考链接]
OpenAI 官方报告《智能体如何改变工作》(外部)
OpenAI官方博客介绍了这份报告。论文的要点用图解来解释,比如非开发者的使用量增加了 137 倍。
Codex(OpenAI公式制品ページ)(外部)
Codex 产品介绍页面。您可以看到基于代理的编码的整体情况,包括处理并行工作、技能和自动化功能的 Codex 应用程序。
法典开发人员(外部)
收集了Codex在实践中使用的官方技术文档,例如如何创建技能、使用AGENTS.md进行设置以及MCP配合等。
OpenAI(公司首页)(外部)
开发ChatGPT和Codex的AI公司官网。发布有关产品公告和研究报告的主要信息。
[参考文章]
独家:Codex代理正在逐渐成为主流(Axios)(外部)
介绍 OpenAI、哥伦比亚大学、杜克大学和宾夕法尼亚大学的联合报告。核心报告显示,Codex 的代币份额为员工 99.8%,组织 63%,个人 16.5%。
OpenAI 称员工不再局限于聊天而是代理(The Register)(外部)
内部采用率从大约 40% 增加到 97.9%,外部组织为 17.3%,个人为 0.7%。比较法律工作者13倍的代币和诉讼数量,我们指出数量和结果之间的差异。
OpenAI称其98%的员工现在使用Codex代理,但所有数据都是自我报告(The Next Web)(外部)
在介绍非开发者的使用量个人增加了137倍、组织增加了189倍这一事实的同时,他批评了所有数据都是自我报告且缺乏第三方验证的事实。
智能体如何改变工作(OpenAI 官方博客)(外部)
本报告的官方介绍博客。这是非开发人员使用的乘数的主要来源(个人:137x,组织:189x,内部公司:12x)。
OpenAI 推出针对白领工作的新 Codex 工具(TechCrunch)(外部)
关于 6 月 2 日发布的“Codex for every role”的报道。它提到每周有超过 500 万人,其中大约 20% 是知识工作者、站点职能部门和协作伙伴。
OpenAI 报告 Codex 使用量激增(财富)(外部)
对 Codex 产品经理 Thibault Sautiaux 的采访。我们将讨论扩展到非技术职位的策略,并介绍思科、英伟达和乐天等公司的示例。
[相关文章]
三星电子在全公司范围内推出 ChatGPT Enterprise 和 Codex | 2023 年人工智能禁令的重大转变
将 Codex 部署到整个公司(包括非开发人员)的示例。本文可以被理解为支持本文描述的“组织中委托使用的扩展”的具体示例。
日立 x OpenAI 携手 Codex 续写传统 - 从金融开始的人工智能现代化和网络防御
涉及企业实施法典的文章。本文是本文的延续,作为组织重新设计工作流程的运动。
Robinhood“代理交易”现已向所有用户开放。投资委托人工智能代理时代的曙光
这个例子体现了代理型AI在金融领域从“咨询”到“委托”的本质。本文的主题将从另一个方面进行补充。
[编者后记]
读完这篇报道,我突然回顾了这一天。查资料、写句子、编表格、安排发信息——如果你仔细观察,你会发现你一天的大部分时间都在“动手”,而不是“思考”。我意识到报告所说的“委托”正是这个意思:将这部分过程交给某人(某事)。
然而,这个故事有趣又困难的部分是,一旦你交出它,它就不会结束。乍一看,同时运行多个代理的工作方式是神奇的高效,但另一方面,这意味着你的角色从“创造者”变成了“协调者”。确保结果是正确的,纠正方向,把整个事情放在一起。一旦双手工作的忙碌消失,决策责任的额外负担仍然存在。这种未来的景象可以通过数字来窥见。
还有一件事要记住。本报告中的数据全部来自 OpenAI 内部。毫无疑问,使用量呈爆炸式增长。然而,“被大量使用”和“结果增加了相同的量”并不是一回事。即使代币数量增加13倍,也不意味着工作产出会增加13倍。我们能否继续保持这种明显的区别而不被激烈的数字所吞噬,对于与这项技术保持健康的关系可能非常重要。
当电力改变工厂时,真正的改变花了几十年的时间才发生。在基于代理的人工智能的情况下,该时钟可能运行得更快。如果是这样的话,我们可能没有想象中的那么多时间去思考什么该托付给别人,什么该保留。没必要着急,但也不能只是站在那儿看着。我认为我们现在处于如此完美的位置。
