TrendAI 利用 Claude Opus 4.8 加强漏洞检测 - 与 Anthropic 共同打造人工智能防御前线

到目前为止,漏洞搜寻一直是攻击者和防御者之间的猫捉老鼠的游戏。一种新的场景正在出现,“人工智能将成为防御方面的主力”。趋势科技的企业品牌TrendAI使用Anthropic的最新模型Claude Opus 4.8来加速弱点的发现、优先级排序和修复。在人工智能往往被视为攻击工具的时代,这种合作是一个转折点,在这个转折点中,同样的力量可以用于防御。


2026 年 5 月 29 日,趋势科技旗下企业品牌 TrendAI 宣布正在与 Anthropic 一起评估和使用 Claude Opus 4.8。

本新闻稿是 2026 年 5 月 28 日在美国发布的新闻稿的缩写翻译。TrendAI 参与了 Anthropic 的验证计划,该计划对利用前沿人工智能模型进行防御目的的组织进行认证。安全分析师、AppSec 团队和 SOC 团队将利用获得的见解,通过 TrendAI Vision One 网络安全平台确定漏洞优先级、绘制攻击向量图并进行修复(包括虚拟修补)。 TrendAI 的 CPO 和 CBO、TrendAI 负责人 Rachel Jin 谈论了这一举措。 TrendAI 与 185 个国家的公司和政府机构有着良好的合作记录。趋势科技总部位于东京新宿,总裁兼首席执行官为 Eva Chen,TSE Prime 股票代码为 4704。

从: TrendAI 部署 Claude Opus 4.8 增强漏洞检测和风险缓解

【编辑部评论】

我们之所以关注这一消息,是因为这不是一次性的产品发布,而是“人工智能防御”这一大趋势的一部分。首先,我们来整理一下如何阅读该版本。

趋势科技正在通过 Anthropic 使用 Claude Opus 4.8 来评估高级推理如何增强安全操作。换言之,此时更准确的说法是,将其视为验证和使用过程中的一个举措,而不是一份全面产品实施完成的报告。请注意,最初的英文版本后来发布了更正,并且内容也经过了发行者的更正。这就是为什么你应该小心演讲的细微差别。

另一件需要记住的事情是,这不是“第一次合作”。2026 年 4 月 30 日,两家公司还宣布合作部署 Claude Opus 4.7 进行安全研究。当时,TrendAI 解释说,其于 2025 年推出的内部研究平台 AESIR 将使用 Claude Opus 4.7 “像攻击者一样进行推理”,以确定哪些内容是可访问和可利用的。这一次,我们提高了标准,可以理解为不断深化。

关键是文中提到的“人择验证计划”。正式名称是网络验证计划。通常,生成的人工智能具有内置的护栏来防止滥用,但在涉及跟踪攻击者思维的漏洞研究等任务时,这些可能会成为障碍。通过此认证,组织可以申请合法的防御工作,以调整其双用途网络工作限制(通常默认情况下会被阻止)。然而,这并不意味着禁止用途将被取消。如果你把它理解为一种平滑攻击方占据优势的情况的机制,那就更容易理解了。

那么为什么现在这么紧急呢?其背景是人工智能已经开始利用传统方法难以发现的漏洞。 Anthropic 于 4 月 7 日宣布的 Project Glasswing 的未发布模型 Claude Mythos Preview 在基准 ExploitBench 中表现出色,该基准主要针对 Chrome 等 JavaScript 引擎 V8 中的 41 个漏洞。根据评估条件和聚合方法,顶级“任意代码执行(ACE)”的命中数显示有所不同。 ExploitBench预印本(arXiv论文2605.14153)的主要评估显示41个案例中有18个,而Anthropic在其红队解释中显示的Baseline和Nudged条件的总和是41个案例中的21个(约51%)。在这两次计算中,其他模型最多只有两种情况达到了相同的最高水平,并且报告了显着差异。据报道,Mythos 在 FFmpeg 中发现了一个已有 16 年历史的 bug,即使经过 500 万次自动化测试也没有发现。

Anthropic 对这一计划的投入程度可以从其资源规模看出。该公司已正式承诺在这些努力中提供高达 1 亿美元的 Mythos Preview 使用积分,并向开源安全组织直接捐赠 400 万美元。相当多的投入已经开始在防守端建立立足点。

这项技术实施后会发生什么变化?该版本设想将漏洞管理从静态扫描转变为动态、上下文风险缓解。具体来说,SOC 和 AppSec 团队可以从连续粉碎无数警报的任务中解放出来。您将能够将注意力转移到确定优先级上,例如“哪些缺陷实际上被利用了以及它们会对业务产生多大影响?”当与虚拟补丁(一种在进行根本性修复之前暂时阻止攻击向量的技术)相结合时,预计会缩短修复所需的时间。

这与当地的紧急问题直接相关。研究表明,即使在 12 个月后,组织中发现的很大一部分漏洞仍未得到修复。这些数字因研究者和目标而异,但一个常见的问题是结构本身,修正无法跟上发现的速度。我们正在尝试利用人工智能来缩小这一差距,而这一差距不能通过简单地增加人力和预算来填补。

但是,我们也不应该忽视潜在的风险。快速发现漏洞的能力对于防御者和攻击者来说都是强大的。这就是为什么 Anthropic 使用认证系统来缩小用户范围,并且不向公众提供其最高性能的模型。如果人类相信人工智能提出的优先事项和修复计划而不进行验证,则可能会出现新的盲点。innovaTopia 的编辑政策是将决策者置于人类手中的原则在安全领域具有同样的分量。

我们还可以添加市场走势的观点。此公告不仅仅涉及趋势科技。竞争对手 Palo Alto Networks 也宣布将在 Unit 42 的 Frontier AI Defense 中使用 Claude Opus 4.7。在数据安全领域,MIND宣布成为第一家获得Cyber​​ Verification Program认证的公司。此次合作被定位为各大公司相继将前沿模型纳入国防领域的竞争的一部分。两家公司关系的扩大也体现在Anthropic的言语中。 Anthropic 网络安全主管 Ash Alhashim 表示,TrendAI 正在以其 35 年的业绩记录为基础,并通过 Vision One、Zero Day Initiative 和 Pwn2Own 等举措“将规模转向防御”。

从监管和长远角度来看,这一趋势可能会重新考虑“人工智能治理”本身。 Release所指的“控制平面”是一种将AI的使用方式可视化、监控并在必要时自动关闭的机制。我们如何设计一个治理框架,既能保护AI,又能保护它? Anthropic 在其 Glasswing 公告中表示:“保护世界网络基础设施的安全可能需要数年时间,但前沿人工智能能力将在未来几个月内显着进步。”如何弥合这一时间差距将是未来几年讨论的话题。

这一事件可以说是一个标志,争论的重心正在从“人工智能成为攻击工具”的单调谈论转向“人工智能如何发展成为防御主力”的建设性问题。身在那个过渡时期的感受,就是我现在写这篇文章的原因。

【术语解释】

脆弱性
软件或系统中隐藏的安全缺陷或弱点。如果被攻击者利用,它就会成为未经授权的访问和信息泄露的网关。

虚拟补丁(虚拟补丁)
一种在修改程序本身之前通过暂时阻止攻击路径来提供保护的技术(基本响应)。它用于需要时间进行纠正的生产环境,以防止损坏而不拖延。

SOC(安全运营中心)
每天 24 小时监控组织系统以检测和响应网络攻击迹象的专业团队或其基地。

AppSec(应用程序安全)
是指从应用程序开发到运营各个阶段,为防止漏洞产生并确保安全而做出的所有努力。

AESIR
TrendAI 于 2025 年推出的基于人工智能的内部安全研究平台。通过将机器速度的自动分析与人类专家监督相结合来发现和演示漏洞。

模糊测试
它是一种自动向程序发送大量欺诈或意外数据以发现异常行为漏洞的测试方法。

任意代码执行 (ACE)
这是指攻击者能够在目标系统上自由运行他/她想要的程序的情况。它被认为是最严重的漏洞之一。

零日漏洞
开发人员尚不知道且没有可用补丁的漏洞。风险很高,因为它可以在没有对策的情况下受到攻击。

控制平面(控制板)
负责网络和系统的“控制和命令”的层。在本文中,该术语指的是集中控制人工智能使用状态的可视化、监控和自动响应的治理系统。

前沿模型
当前具有前沿能力的大规模人工智能模型的总称。虽然它具有很高的推理能力,但据说如果滥用的话也非常危险。

网络验证计划
由 Anthropic 运营的认证系统。经认证的组织可以请求调整其默认块,以实现防御目的的合法双重用途工作。即使在获得认证后,禁止用途仍将继续受到限制。

玻璃翼计划
Anthropic 于 2026 年 4 月宣布了一项利用人工智能进行防御的计划。未发布的高性能模型“Claude Mythos Preview”专供保护关键基础设施的组织使用。

漏洞利用基准
一种评估标准(基准),根据成就级别使用 5 个级别和 16 个标志来衡量 AI 模型利用现实世界漏洞的程度。本文参考了Chrome JavaScript引擎V8中41个漏洞的评估结果。

基线/微调(评估条件)
ExploitBench 评估中使用的条件名称。基线指的是模型本身,而推动指的是研究人员在关键点提供建议的情况。由于两者的成就数量不同,因此在读取数字时有必要检查条件。

零日倡议(ZDI)/Pwn2Own
两者都是为了鼓励发现和报告未知漏洞而做出的努力。 Pwn2Own被称为在接近真实环境的条件下比拼抗攻击能力的竞赛。

缩略翻译
翻译要点而不是整个原文。本新闻稿已作为美国版本的删节版发布。

[参考链接]

TrendAI Vision One™ 平台(趋势科技)(外部)
作为本文核心的人工智能驱动的网络安全平台的官方介绍页面。

趋势科技人工智能安全(官方)(外部)
总结 TrendAI 人工智能安全政策和相关产品组的官方页面。

人择(官方网站)(外部)
开发克劳德的人工智能安全和研究公司的官方网站。我们正在传达我们为安全所做的努力。

Anthropic「Project Glasswing」(公式)(外部)
关于利用人工智能进行防御的官方解释。您可以查看有关提供模型和支持规模的主要信息。

Claude(公式)(外部)
Anthropic 提供的对话式人工智能“Claude”的官方服务页面。你其实可以尝试一下。

[参考文章]

TrendAI™部署Claude Opus 4.8以推进漏洞检测和风险缓解(美通社/订正版)(外部)
有关此案的主要信息英文版。标题是“简介”,但正文是“评估”,可以理解为验证阶段的一项举措。

利用评估(人类红队/主要信息)(外部)
Mythos Preview 解释说,基线和微移总共达到了 41 个 ACE 中的 21 个。最多 2 个其他型号。

ExploitBench:LLM网络安全代理的能力阶梯基准(arXiv)(外部)
ExploitBench 的 arXiv 预印本(主要信息)。在主要评估中,Mythos Preview 据说在 41 个案例中的 18 个案例中获得了 ACE。

Anthropic 最危险的模型第一天就被未经授权访问(TechTimes)(外部)
一篇解释性文章,整理了平均 9.90/16 等数字以及 Project Glasswing 的整体情况。

Glasswing 项目:保护 AI 时代的关键软件(Anthropic 公式)(外部)
指定支持规模的主要信息,包括高达 1 亿美元的使用积分和 400 万美元的捐赠。

TrendAI™ 和 Anthropic Advance … 与 Claude Opus 4.7(美通社/4 月 30 日)(外部)
这次的第一部分。内部研究平台 AESIR 解释了如何使用 Opus 4.7 “像攻击者一样推理”。

利用 Anthropic 的 Claude Opus 4.7 增强人工智能驱动的防御(Palo Alto Networks 公式)(外部)
竞争对手 Palo Alto 也在 Unit 42 的 Frontier AI Defense 中使用了 Opus 4.7。支持竞争格局。

[相关文章]

TrendAI 和 Anthropic 合作,使 AI 能够自主发现 Claude Opus 4.7 中的漏洞
就在这篇文章之前。这是一个后续来源,报道了 Opus 4.7 中相同的 TrendAI x Anthropic 合作,并详细解释了 AESIR 的机制。

克劳德 Opus 4.7 发布 | “神话试玩版?”网络安全兼容模型的性能如何?
公布 Opus 4.8 上一代型号的说明。与Mythos Preview的关系以及新CVP的建立是可以控制的。

是否存在“防守优势”? Anthropic 的 Glasswing 项目和人工智能网络能力的结构
批判性地深入挖掘本文提到的“攻防速度差距”。结构上验证了防守者优越性的前提。

Claude Mythos Preview 在第一个月内检测到超过 10,000 个严重漏洞
Glasswing 项目的初步结果报告。后续报告用实际数据支持了本文中的 ExploitBench 和 Mythos 的强大功能。

Claude Opus 4.6 发现 Firefox 中的 22 个漏洞——AI 成为安全研究人员的那一天
使用人工智能发现漏洞的基本示例。这将作为回顾这一主题的技术历史的辅助线。

[编者后记]

有关安全的文章往往会煽动“危机”。然而,当我们进行这次采访时,我们有一种安静的感觉,即防守者开始获得同样的尖端力量。

我们不仅仅为攻击的消息做好准备,我们还关注保护攻击的技术已经发展到什么程度。我们希望您能够更接近每天与之交互的服务幕后发生的战斗。