人性化的《克劳德十四行诗 5》公布，接近顶级 Opus 4.8 - 能够以低价运行一整天的自主代理的威力有多大？

“如果你把它留给人工智能，它就会在你睡梦中完成。”看来这种工作方式最终将以现实的价格实现。到目前为止，智能人工智能可以思考复杂的任务并完成它们直到最后，这让你每次移动任务时都要注意仪表。 Anthropic发布的Claude Sonnet 5是一个降低了“智能”和“休闲”之间障碍的模型。一个即使整天运行也能盈利的代理会如何改变我们的工作？我们将一一揭开最强车型被国家刻意封杀的价格表背后的机制和时代潮流。

Anthropic于2026年6月30日发布了Claude Sonnet 5。它被定位为所有Sonnet模型中最像代理的模型，并使用浏览器或终端自主运行。

性能接近 Opus 4.8，并且在推理、工具使用、编码和知识工作方面较 Sonnet 4.6 有所改进。它将从同一天起适用于所有计划，并且将成为免费版和专业版的默认模型。它也可在 Claude Code 和 Claude Platform 中使用，API 模型名称为 claude-sonnet-5。截至 2026 年 8 月 31 日，首发价格将为每 100 万个输入代币 2 美元，每 100 万个输出代币 10 美元，此后输入价格将为 3 美元，输出价格为 15 美元。

安全评级显示不良行为比 Sonnet 4.6 少，网络功能比 Opus 4.8 和 Mythos 5 低。默认情况下启用网络防护措施。

从：介绍克劳德十四行诗 5

模型	输入（/100万个代币）	产出（/100万枚代币）	作品比例
十四行诗 5 （首发价/~8月31日）	2美元（约300日元）	10美元（约1500日元）	约40%
十四行诗 5 （标准价格/9月1日起）	3美元（约450日元）	15 美元（约 2250 日元）	约60%
作品 4.8	5美元（约750日元）	25 美元（约 3750 日元）	100%（基准）
单价为每百万代币。日元兑换按1美元=150日元计算。 Sonnet 5的标准价格（输入3美元/输出15美元）与上一代Sonnet 4.6相同，只是8月31日之前的入门价格暂时较低。此外，在 Sonnet 5 中，由于新的 tokenizer，同一句子的 token 数量可能会增加约 1.0 至 1.35 倍，并且有效成本将会波动。

【编辑部评论】

对于这个消息，我首先要指出的是：“中档型号 Sonnet 已经接近高端 Opus。”这是一点。 Anthropic 传统上认为自主任务越困难，所需的 Opus 类就越昂贵。该线现已下降至低价中档。

最具象征意义的是编码索引。根据 TechCrunch 报道的数据，Sonnet 5 在一项基于代理的编码基准测试中得分为 63.2%，Opus 4.8 得分为 69.2%，上一代 Sonnet 4.6 得分为 58.1%。差距还是有的，但考虑到价格，这种接近度也不小。

那么为什么“现在”如此重要呢？关键在于“运营成本”而不是业绩本身。

与聊天不同，代理等待人类的指令，代理重复调用工具、检查结果并采取下一步的过程。更智能的模型可以运行这个循环更长时间，但它们也会消耗更多的代币并导致账单膨胀。海外媒体一致指出企业全面引入代理商后面临“高额费用”的现实。

Sonnet 5 可以被解读为一张正面回答这一痛点的卡片。看看价格，入门价格不到 Opus 的一半，9 月后的标准价格约为 Opus 的 60%。它很适合。如果你能以与 Opus 类似的质量以这种水平运行一台机器一整天，那么以前无法盈利的自动化将成为现实。这种实际反应的一个例子是，Zapier 代表作证说，他们能够完成“更新帐户层次结构并发送发布公告”的两步任务。

然而，仅从价格表上的数字看其表面价值还为时过早。 Sonnet 5 采用了新的分词器，即使在同一个句子中，令牌数量也可以增加大约 1.0 到 1.35 倍。其机制是，即使显示的单价下降，实际收取的代币数量也会增加。尽管 Anthropic 表示他们已经设定了入门定价，以使迁移几乎不产生成本，但我们建议您使用自己的工作负载进行测试。

当谈到安全时，有一个悖论经常被忽视。讽刺的是，Sonnet 5之所以能够广泛向公众发布，是因为它“网络攻击能力低”。在与 Mozilla 联合进行的 Firefox 漏洞测试中，该模型始终无法创建有效的攻击代码。由于容量受到抑制，设计理念是可以将轻型防护措施分配到所有计划。

这一点与监管环境有关。据雅虎财经等消息人士透露，由于美国政府的意愿，Anthropic的顶级游戏《神鬼寓言5》和《神话5》实际上已经停止向外国用户提供。据说这样做的原因是担心黑客滥用。在一个最强大的大脑与国家安全直接相关并受到控制的时代，选择以任何人都可以使用的形式广泛分发能力有限的中级模型是有丰富想法的。

从长远来看，这“人工智能的民主化”与“尖端技术的锁定”同时进行的作品这是处理日常任务的实用代理的横截面，将被广泛使用且价格低廉，而真正强大的功能将保留在监管和验证的高墙后面。作为从业者，我们很可能会接触到前者。

我们不能忽视这样一个事实：Anthropic 于 6 月 1 日在其预计将于今年晚些时候进行的首次公开募股 (IPO) 之前秘密向美国证券交易委员会提交了文件。公司的价值与能吸引多少开发商直接挂钩，而“便宜又好用的代理商”是竞争的主战场。如果你将它与 OpenAI 的 GPT-5.6 Sol 和 Google 的 Gemini 3.5 Flash 放在一起阅读，你可以清楚地看到公司集体从“对话式人工智能”转向“工作式人工智能”的趋势。

对于想要接触未来的读者来说，其实际好处是显而易见的。以前“成本太高而难以处理”的自主任务最终落入个人和小团队的手中。现在是时候开始委派小的重复性任务并亲自看看有效成本了。

【术语解释】

代理人工智能
它是指人工智能能够自行制定计划，利用浏览器、终端等工具连续执行多个步骤，而不需要人类一步步指令的状态。

推论（reasoning）
思维的功能是从给定的信息中理解并得出答案。就人工智能而言，它指的是逐步推进想法的能力。

令牌/令牌生成器
AI处理句子时的最小单位是token。分词器是一种将句子划分为标记的机制，当方法改变时，即使在同一个句子中，标记的数量也会增加或减少。使用费根据代币数量确定。

基准
使用常见问题衡量模型性能的评估指标。每项任务，例如编码或计算机操作，都会被量化和比较。

知识工作
涉及知识的专业工作的总称，例如研究、分析和文档创建。

网络安全保障
它是指实时检测并阻止危险网络攻击的安全机制。

漏洞/漏洞利用
漏洞是软件中隐藏的缺陷或弱点。漏洞利用是指用于利用它的方法或代码。

首次公开募股／美国证券交易委员会
IPO是首次公开募股，即公司首次向市场出售其股票。 SEC是美国证券交易委员会，是美国负责审查和监督上市的监管机构。

[参考链接]

Claude（Anthropic官方聊天服务）（外部）
Claude 的官方入口，您可以通过浏览器免费试用。 Sonnet 5 在免费版和专业版中作为默认模型提供。

Claude Code（公式制品ページ）（外部）
Anthropic 的代理型开发工具，可让您在终端上进行编码。还兼容 Sonnet 5。

克劳德平台/API文档（外部）
开发人员通过 API 合并 claude-sonnet-5 的官方技术文档。它可用于检查价格和速率限制。

扎皮尔（官方网站）（外部）
商业自动化服务。一位公司工程师作证说，他能够使用 Sonnet 5 更新 Salesforce 并发送通知。

Mozilla Firefox（官方网站）（外部）
Anthropic 与之合作评估漏洞开发安全性的浏览器。该漏洞已在 Firefox 148 中修复。

OpenAI（官网）（外部）
竞争平台模型开发公司。最新的“GPT-5.6 Sol”也被宣布为最像特工的型号。

谷歌双子座（官方网站）（外部）
谷歌的生成式人工智能。 5月份发布的“Gemini 3.5 Flash”正在对代理使用进行比较。

[参考文章]

Anthropic 推出 Claude Sonnet 5 作为一种更便宜的代理运行方式（TechCrunch）（外部）
有文章报道，在类似代理的编码中，Sonnet 5 为 63.2%，Opus 4.8 为 69.2%，Sonnet 4.6 为 58.1%。

Anthropic推出更便宜的代理模型Claude Sonnet 5（The Next Web）（外部）
一篇文章分析了新分词器的注意事项（同一句话最多可以变成 1.35 倍的分词器）以及运营成本。

Anthropic 推出更便宜的 Claude Sonnet 5 模型，科技寻求人工智能节省（雅虎财经）（外部）
一篇报道 IPO 背景的文章，包括《神鬼寓言 5》和《神话 5》的停播以及 6 月 1 日向 SEC 秘密备案。

Anthropic 首次推出 Claude Sonnet 5，用于网络风险较低的日常代理任务（Axios）（外部）
一篇文章总结了所有计划中的默认建模以及从聊天转向任务委托的行业趋势。

Anthropic Sonnet 5：它缩小了与Opus 4.8的差距，而且价格便宜到8月（The New Stack）（外部）
一篇文章，提供了最大努力的性能比较和首次采用介绍性价格的目标，以及公共关系评论。

[相关文章]

Claude Opus 4.8发布，Anthropic的“诚实AI”是什么？
发布顶级型号 Opus 4.8 进行比较。这是本文的基础，本文还解释了分词器和工作量控制。

克劳德 Opus 4.7 发布 | “神话试玩版？”网络安全兼容模型的性能如何？
这一集解释了抑制网络能力和安装防护措施的设计理念，以及更新标记器的先例。

Anthropic IPO启动 ─ Claude开发商秘密向SEC提交S-1，超越OpenAI
本集提供了评论中提到的 6 月 1 日秘密 S-1 提交的详细信息，并补充了定价策略背后的上市背景。

[编者后记]

说实话，这个消息最让我感动的不是基准数据，也不是低廉的价格。 “聪明但昂贵”和“便宜但不令人满意”的二元选择正在逐渐开始消失——这更像是一场地震性的转变。

直到现在，当我们要求人工智能做某事时，我感觉我们内心的某个地方会踩刹车并想：“我不知道这要花多少钱。”当刹车松开时，人们突然变得更大胆。 “这个也请你尝试一下。”“失败了也没关系，尝试一次就可以了。”当你能做这么小、不合理的事情时，技术可能会从工具变成伴侣。

另一方面，同一篇文章还描述了这样一个现实：最强大的模式正在被政府的决定所锁定。与此同时，任何人都可以使用的区域正在迅速扩大，同时，真正强大的力量正在被围堵在墙内。当我并排看到这两个产品时，我觉得仅仅因为它更方便而感到高兴是不够的。

尽管如此，总是像我们这样行动迅速的人最先拿起落在我们面前的工具。如果你可以整天运行一个人工智能而不用担心盈利，你会首先委托给它什么？我计划首先让它每天早上收集信息，看看它是否易于使用。如果我们能再次谈论成功和失败，我会很高兴。