OpenAI“Codex”显示向代理型 AI 的转变，对内部代币影响 99.8%，对非开发人员影响 137 倍

当被问到“你使用人工智能吗？”时，大多数人可能会回答“是”。那么，如果有人问你，“你会把你的工作委托给人工智能吗？”你会怎么说？提出问题和提出问题看似相似，但其实是完全不同的。对方给出答案后，前者就结束了。后者期望对方动动手，为自己完成一些事情。

OpenAI 发布的这份报告根据贵公司的使用数据，从内部角度描述了从“提出问题”到“将事情委托给他人”的转变。而且，有趣的是，在这一变革中取得最大进展的人并不是工程师，而是开始蔓延到与代码关系不大的职业。生动的数字表明，我们与人工智能的交互方式正在悄然但必将进入下一个阶段。

2026 年 6 月，OpenAI 发布了一份分析 Codex 使用数据的报告，“向 Agentic AI 的转变：来自 Codex 的证据”。Drew Johnston 及其同事比较了三组：外部个人用户、组织用户和 OpenAI 员工。从 2026 年 1 月 1 日到 2026 年 6 月 1 日，Codex 的每周活跃用户增加了 5 倍以上。

截至 6 月 11 日，Codex 占 OpenAI 员工 ChatGPT 和 Codex 总体产出代币的 99.8%，组织用户占 63.3%，个人用户占 16.5%。组织帐户中的工程师平均在 Codex 中产生 26.8%，比年初增加了 5 倍。请求估计需要超过 8 小时的任务的个人用户百分比从 2.1% 增加到 25.6%。 26.6% 的用户使用了技能，而 OpenAI 员工的这一比例为 96.2%。 OpenAI 法律职位员工的月产出代币价值中位数是 2025 年 11 月的 13 倍，研究职位员工的月产出代币价值中位数超过 50 倍。

从：向代理人工智能的转变：来自 Codex 的证据

【编辑部评论】

这份报告由 OpenAI 以其研究组织“经济研究”的名义发布，AI使用方式从“对话”转向“委托”的转折点这是从我们自己内部数据的罕见观察点得出的。我为什么现在提出这个？原因很简单，因为第一次有大量证据表明，我们每天与之互动的聊天型人工智能（例如ChatGPT）已经开始过渡到下一个阶段。

首先要理解“代理”一词的含义。传统的聊天机器人仅限于回答问题和生成句子。另一方面，基于代理的人工智能读取文件、执行命令并重塑工件本身。换句话说，一个代表人类“执行工作”的实体。是。该报告根据用户“委托”的内容来衡量这种差异。

解释数字时必须小心。 Codex 占 OpenAI 内产出代币 99.8% 的事实令人印象深刻，但这仅适用于非常特殊的公司员工群体。外部组织用户的这一比例为 63.3%，个人用户的比例为 16.5%。 OpenAI 本身声明，它并不代表一个典型的组织。将该公司的内部数据视为反映“摩擦消失的未来”的实验室是恰当的。大概。

扩展到非开发人员是本报告的核心。据OpenAI官方博客《代理如何改变工作》显示，自2025年8月以来，非开发者用户的数量对于个人来说将增加137倍，对于组织来说将增加189倍。有人指出，即使在法律事务和招聘等看似与代码无关的工作中，Codex也已成为主要工具。人工智能代理在工程之外可以做什么的一个很好的例子是。

我想在这里添加一个更批判性的观点。 The Register、The Next Web等海外媒体指出，本报告中所有数据均由OpenAI自行报告，未经第三方验证。 The Register 打趣道，虽然法律团队的代币数量增加了 13 倍，但同期针对该公司的美国联邦诉讼数量从 35 起增加到 39 起（增长约 11%）。代币生成量的“投入量”指标并不一定意味着“结果的数量”或“质量的提高”。这个问题是一个重要的保留，读者应该冷静对待。

尽管如此，多家媒体都承认这种变化是真实的。我们想关注的是报告所进行的历史类比。作者引用了 David (1990) 的观点，他研究了从蒸汽机到电力的转变，技术的真正价值体现不是在“取代现有作品”的阶段，而是在“重新设计作品本身”的阶段我在争论。由于基于代理的人工智能不需要重新设计工厂等巨大的固定成本，因此其采用速度可能比过去的通用技术更快。这一观察结果充满了建议。

我们已经看到了技术的轮廓。超过 10% 的用户每周同时管理三个或更多代理，在 OpenAI 中，第 99% 的员工每天运行大约 71 小时的代理工作。人类一起工作和“监督”多个代理的方式与个人用手工作的方式有本质上的不同。是。

一个不可忽视的长期影响是工作的重组。报告预测，日常执行任务将变得不那么重要，而判断、监督、协调和审查将变得更加重要。团队构成、招聘需求、职业阶梯、按技能级别划分的工作分配——由于深入探讨了这些重新安排的可能性，本报告的政策范围超出了单纯的产品推广。。

从监管和治理的角度来看，代理自主运营的时间越长，验证其输出的成本和责任的定位就越容易受到质疑。报告本身反复强调，适当的人工审核流程是实现价值的先决条件。“能够快速做出某件事”和“能够正确完成它”之间仍然存在差距，而填补这一差距的组织能力将是下一个竞争轴心。，这就是我们的阅读。

【术语解释】

代理类型AI
代表用户自主行动的人工智能。与以回答问题结束的会话方法不同，其特点是可以委派和执行多步骤任务，例如读取文件、执行命令和修改可交付成果。

法典
OpenAI 基于代理的编码和业务平台。它于 2025 年 4 月首次发布，最初旨在软件开发，但其用途也扩展到非编码任务，例如文档创建和数据分析。

输出标记
AI 模型生成的最小信息单元。本报告重点关注代币数量而非活跃用户数量作为衡量使用“强度”的指标。然而，它是输入的数量，并不一定对应于输出的数量或质量。

技能/插件
一种将重复性工作组织成可重用形式的机制。技能是一组定义工作流程的指令，插件是捆绑技能和外部工具集成的分发单元。它可以在团队和组织之间共享，并有助于标准化工作流程。

并行度（concurrency）
用户同时运行多个 Codex 代理的程度。它被用作衡量向人类领导和监督代理团队的工作方式转变的指标。

外延的margin／内包的margin（extensive／intensive margin）
经济分析术语。前者指的是“人们是否首先使用它”，后者指的是“人们使用它的深度”。本报告将两者分开并衡量实际的实施情况。

泛用技术（general-purpose technology）
传播到整个经济并改变生产模式本身的基础技术。蒸汽机和电力是典型的例子，报告将代理型人工智能归入这一谱系。

马具
围绕AI模型和控制工具使用、内存和护栏的一组机制。 “代理由模型和安全带组成，”Codex 产品总监 Thibault Sautiaux 解释道。

[参考链接]

OpenAI 官方报告《智能体如何改变工作》（外部）
OpenAI官方博客介绍了这份报告。论文的要点用图解来解释，比如非开发者的使用量增加了 137 倍。

Codex（OpenAI公式制品ページ）（外部）
Codex 产品介绍页面。您可以看到基于代理的编码的整体情况，包括处理并行工作、技能和自动化功能的 Codex 应用程序。

法典开发人员（外部）
收集了Codex在实践中使用的官方技术文档，例如如何创建技能、使用AGENTS.md进行设置以及MCP配合等。

OpenAI（公司首页）（外部）
开发ChatGPT和Codex的AI公司官网。发布有关产品公告和研究报告的主要信息。

[参考文章]

独家：Codex代理正在逐渐成为主流（Axios）（外部）
介绍 OpenAI、哥伦比亚大学、杜克大学和宾夕法尼亚大学的联合报告。核心报告显示，Codex 的代币份额为员工 99.8%，组织 63%，个人 16.5%。

OpenAI 称员工不再局限于聊天而是代理（The Register）（外部）
内部采用率从大约 40% 增加到 97.9%，外部组织为 17.3%，个人为 0.7%。比较法律工作者13倍的代币和诉讼数量，我们指出数量和结果之间的差异。

OpenAI称其98%的员工现在使用Codex代理，但所有数据都是自我报告（The Next Web）（外部）
在介绍非开发者的使用量个人增加了137倍、组织增加了189倍这一事实的同时，他批评了所有数据都是自我报告且缺乏第三方验证的事实。

智能体如何改变工作（OpenAI 官方博客）（外部）
本报告的官方介绍博客。这是非开发人员使用的乘数的主要来源（个人：137x，组织：189x，内部公司：12x）。

OpenAI 推出针对白领工作的新 Codex 工具（TechCrunch）（外部）
关于 6 月 2 日发布的“Codex for every role”的报道。它提到每周有超过 500 万人，其中大约 20% 是知识工作者、站点职能部门和协作伙伴。

OpenAI 报告 Codex 使用量激增（财富）（外部）
对 Codex 产品经理 Thibault Sautiaux 的采访。我们将讨论扩展到非技术职位的策略，并介绍思科、英伟达和乐天等公司的示例。

[相关文章]

三星电子在全公司范围内推出 ChatGPT Enterprise 和 Codex | 2023 年人工智能禁令的重大转变
将 Codex 部署到整个公司（包括非开发人员）的示例。本文可以被理解为支持本文描述的“组织中委托使用的扩展”的具体示例。

日立 x OpenAI 携手 Codex 续写传统 - 从金融开始的人工智能现代化和网络防御
涉及企业实施法典的文章。本文是本文的延续，作为组织重新设计工作流程的运动。

Robinhood“代理交易”现已向所有用户开放。投资委托人工智能代理时代的曙光
这个例子体现了代理型AI在金融领域从“咨询”到“委托”的本质。本文的主题将从另一个方面进行补充。

[编者后记]

读完这篇报道，我突然回顾了这一天。查资料、写句子、编表格、安排发信息——如果你仔细观察，你会发现你一天的大部分时间都在“动手”，而不是“思考”。我意识到报告所说的“委托”正是这个意思：将这部分过程交给某人（某事）。

然而，这个故事有趣又困难的部分是，一旦你交出它，它就不会结束。乍一看，同时运行多个代理的工作方式是神奇的高效，但另一方面，这意味着你的角色从“创造者”变成了“协调者”。确保结果是正确的，纠正方向，把整个事情放在一起。一旦双手工作的忙碌消失，决策责任的额外负担仍然存在。这种未来的景象可以通过数字来窥见。

还有一件事要记住。本报告中的数据全部来自 OpenAI 内部。毫无疑问，使用量呈爆炸式增长。然而，“被大量使用”和“结果增加了相同的量”并不是一回事。即使代币数量增加13倍，也不意味着工作产出会增加13倍。我们能否继续保持这种明显的区别而不被激烈的数字所吞噬，对于与这项技术保持健康的关系可能非常重要。

当电力改变工厂时，真正的改变花了几十年的时间才发生。在基于代理的人工智能的情况下，该时钟可能运行得更快。如果是这样的话，我们可能没有想象中的那么多时间去思考什么该托付给别人，什么该保留。没必要着急，但也不能只是站在那儿看着。我认为我们现在处于如此完美的位置。