GPT-5.5被评为英国AISI网络评估最强候选者——继Mythos之后完成32步攻击

2026 年 4 月 30 日,英国人工智能安全研究所 (AISI) 发布了 OpenAI 的 GPT-5.5 网络能力评估。高级套件专家级的平均通过率为 71.4%,高于 Anthropic Claude Mythos Preview 的 68.6%、GPT-5.4 的 52.4% 和 Opus 4.7 的 48.6%。 The Last Ones 是与 SpectreOps 共同构建的 32 步企业网络攻击模拟,10 次中有 2 次成功完成端到端,成为继 Mythos Preview 之后的第二次成功。 Crystal Peak Security 提供的 rust_vm 挑战在 10 分 22 秒内完成,API 费用为 1.73 美元。

另一方面,用Hack The Box构建的七步ICS攻击模拟“冷却塔”仍然悬而未决。专家红队在 6 小时内确定了通用越狱。同日发布的网络安全漏洞调查发现,43%的英国企业在过去12个月内遭遇过网络漏洞或攻击。英国政府宣布推出网络安全和弹性法案以及9000万英镑的新预算。

从: 我们对 OpenAI GPT-5.5 网络能力的评估 | AISI工作

【编辑部评论】

AISI(英国人工智能安全研究所)GPT-5.5 评估中真正重要的不是各个基准数据本身。两个由不同开发者、不同架构诞生的前沿模型,各自达到了相同的高度。事实就是如此。这表明的是“全行业能力曲线的陡峭”,而不是“特定实验室的突破”,编辑部认为这是AISI在本文中最想强调的一点。

首先,我想补充一些关于 AISI 的信息。 AISI是英国科学、创新和技术部下属的研究机构,自2023年以来一直以独立第三方的身份跟踪和评估Frontier AI的网络能力。这项评估的独特价值在于,除了OpenAI和Anthropic自己公布的数据外,政府研究机构还使用相同的尺度对它们进行并列比较。

特别值得注意的是 AISI 是一个脚注。将 TLO 性能从十分之 1 修正为十分之 2。事情就是这样发生的。他们将 OpenAI 的 GPT-5.5 系统卡上与“1/10”不同的数字作为他们自己的评分错误发布并纠正。当绩效评估中的诚实成为信任的货币时,这种透明度已成为其他实验室和评估机构的标准行为。

一个技术亮点是 Crystal Peak Security 提出的 rust_vm 挑战焦点。 GPT-5.5用了10分22秒解决了该问题,使用Binary Ninja、gdb、Python、Z3等工具耗时约12小时,使用Binary Ninja、gdb、Python、Z3等工具,API使用费为1.73美元。值得注意的是,当跳转表偶然发现一个空的 PIE 可执行文件时,它会自动readelf -rW分配重定位信息并自诊断和自纠正仿真器实现中的任何中断号混淆。这是一种长期自主的表现,不是“写代码”,而是“破译未知的处理系统并反复推理以实现目标”。

由此衍生出的AISI自己的观点是本文的核心。网络攻击能力它是作为通用能力(例如长期自主性、推理和编码)改进的副产品而出现的。——换言之,其结构是这样的:“通用智能模型即使不是专门为黑客攻击而创建的,也可以完成黑客的工作。”这一观察动摇了人工智能能力治理的设计理念。

另一方面,文章也对过度威胁论进行了适当纠正。 GPT-5.5无法解决工业控制系统(ICS)攻击模拟“冷却塔”。此外,该研究机构本身强烈指出,AISI 的范围缺乏现实环境中存在的主动防御者、防御工具和警报惩罚,并且其针对坚固目标的有效性尚未得到测量。认识到“研究环境中的能力上限”与“实战中的成就点”之间仍然存在距离,是值得与读者分享的重要前提。

保障方的意见也不容忽视。 AISI专家团队只需 6 小时即可探索通用越狱我做到了。与能力演进的速度相比,保障措施的强度仍处于人类想象所能突破的水平。虽然OpenAI事后进行了修正,但AISI因提供版本中的配置错误而无法验证最终效果,也说明了当前AI安全评估的现实。

innovaTopia编辑部在此强调以下几点:这种技术趋势并非“只针对攻击者”这是一个不对称的希望。 OpenAI 正在规划一条通过可信访问计划(包括可信网络访问(TAC))向防御者解锁高级模型的路径。 Anthropic 还创建了自己的框架“Project Glasswing”,为有限数量的合作伙伴组织提供 Claude Mythos 预览版。攻击和防御在同一技术基础上越来越同步加速。

政策时机也具有启发性。同日发布的英国《2025/2026 年网络安全漏洞调查》发现,43% 的英国企业在过去 12 个月内遭遇过网络漏洞或攻击。英国政府正试图通过推出《网络安全与弹性法案》和9000万英镑的新预算来应对这一问题,但立法和预算将能够在多大程度上支持人工智能能力的指数级增长,这不仅是英国,也是包括日本在内的其他国家面临的共同挑战。

从长远来看,我有一种感觉,网络安全行业本身的经济结构将会发生变化。在漏洞发现实际上已成为“商品化”资源的世界中​​,稀缺资源并不是发现它的能力。待修改、应用和操作的规则移到一边。我们正处于一个转折点,组织对人工智能自动发现的大量漏洞报告进行优先排序、实施、部署和验证的能力将成为一种竞争优势。

对于想要了解、触摸、参与未来的读者来说,这篇文章不仅仅是一份基准报告。重新设计人工智能与人类社会安全关系的起点这是我希望您阅读的主题。随着攻击和防御在相同的技术基础上加速,公司和个人正在进入一个阶段,他们正在重新选择委托什么、留下什么以及学习什么。

【术语解释】

CTF(夺旗)
网络安全领域的一种竞赛形式,参赛者发现并利用漏洞来获取隐藏的“标志”(密码)。它正在成为人工智能评估的基准,因为它衡量逆向工程、密码破解和网络开发等不同领域的能力。

TLO(最后的)
AISI 与 SpectreOps 合作构建的 32 步企业网络攻击模拟。它模仿整个现实世界的入侵杀伤链,包括侦察、凭证盗窃、跨 Active Directory 的横向移动、通过 CI/CD 供应链以及窃取受保护的数据库。

ICS(工业控制系统)/OT(运行技术)
一组控制物理过程的嵌入式系统,例如发电厂、工厂、供水和污水处理系统。这是一个比 IT 网络更需要稳健性的领域,因为任何中断都会对社会基础设施产生直接影响。

通用越狱
一种通用越狱技术,可以绕过人工智能模型的安全控制,并对各种恶意问题生成违规响应,否则这些问题应该被拒绝。严重的问题是单一方法可以解锁多种攻击场景。

红队
安全实践中攻击者视角的评估方法在人工智能领域,这是指专家团队积极寻找模型安全控制中的弱点并获取用于设计改进的知识的活动。

前沿人工智能
这个名字指的是一组目前拥有世界上最先进能力的大规模人工智能模型。例如 OpenAI 的 GPT 系列、Anthropic 的 Claude 系列和 Google 的 Gemini 系列,这些都被政府指定为独立评估对象。

可信访问程序
由 OpenAI 运营的具有高级网络功能的模型的有限访问框架。通过向已验证身份的安全防御者提供该服务,将鼓励防御者使用该服务,同时降低被利用攻击的风险。 Anthropic 有一个名为 Project Glasswing 的 Claude Mythos Preview 独立框架,每个公司都采取了不同的方法。

玻璃翼计划
Anthropic 建立的以安全为重点的联盟,旨在提供对 Claude Mythos Preview 的有限访问。 AWS、苹果、思科、CrowdStrike、谷歌、摩根大通、Linux 基金会、微软、NVIDIA、Palo Alto Networks 等都参与其中,旨在加强全球关键软件防御。

网络安全和弹性法案
英国政府正在出台立法来保护基本服务和数字服务。目的是加强人工智能时代网络威胁的监管基础。

反应剂
交替重复“推理”和“行动”的人工智能代理的基本配置。在此 GPT-5.5 评估中,运行 Bash 和 Python 的 ReAct 代理在 Kali Linux 容器上运行。

PIE(位置无关的可执行文件)
一种可执行文件格式,其内存位置在运行时动态确定。因为加载程序在程序启动时就完成了跳转表的真实地址,仅靠静态分析无法直接读取函数指针。

杀伤链/横向移动
杀伤链是一个概念,指的是攻击者从入侵到实现目标所采取的步骤链。横向移动是指在初始渗透后将权限扩展到同一网络内的其他主机的过程。

活动目录
Microsoft 面向企业的 ID 和权限管理平台。它是一个集中管理用户、设备和组策略的系统,实际上是企业网络的“钥匙”,使其成为攻击者的主要目标。

漏洞补丁波
指由于人工智能自动发现漏洞的速度加快,开发人员和系统运营商被迫在短时间内应用大量补丁的情况。 NCSC 敦促各组织做好准备。

[参考链接]

AI Security Institute(AISI)公式サイト(外部)
英国政府附属的人工智能安全研究所。独立开展前沿人工智能模型的能力评估和治理研究。

OpenAI官网(外部)
GPT-5.5 的开发者。一家研究、开发和提供AI模型的美国公司,并通过系统卡发布对其模型的评价。

人智官方网站(外部)
开发 Claude Mythos Preview 和 Opus 4.7 的美国人工智能公司。它以其以安全研究为核心的组织管理而闻名。

幽灵行动官方网站(外部)
一家网络安全公司,共同创建了 AISI 的 TLO 系列。它是Active Directory攻击路径管理工具“BloodHound”的开发商。

晶峰安全官网(外部)
一家提供 AISI 高级网络任务(rust_vm 挑战等)的安全公司。它专门从事漏洞研究和高级攻击模拟。

黑客盒子官方网站(外部)
ICS攻击模拟“冷却塔”建设合作伙伴。它在全球范围内用作网络安全培训平台。

官方网站不规范(外部)
AISI 高级网络任务的联合开发者。专门从事前沿人工智能威胁评估的安全研究组织。

国家网络安全中心(NCSC)官网(外部)
负责英国网络安全政策和技术建议的政府机构。在政府通信总部的领导下,它为公司和公共机构发布指南。

英国政府 — 2025/2026 年网络安全漏洞调查(外部)
英国政府每年发布的网络损害实际状况调查。这是与本次 AISI 评估同一天发布的最新版本。

[参考文章]

我们对 Claude Mythos Preview 网络能力的评估 |美国钢铁协会(外部)
对克劳德神话预览的初步评价,这是本次比较的主题。他们报告说,他们在 10 次中完成了 TLO 3 次,在 Expert CTF 中取得了 73% 的成功率。

人工智能网络能力曲线 |弹性网络(外部)
一篇比较 Mythos Preview 和 GPT-5.5 的分析文章,并认为“每一代的能力曲线都变得更加陡峭”。从实践者的角度来看,它可以作为强化材料。

GPT-5.5系统卡|开放人工智能(外部)
OpenAI自己发布的GPT-5.5评估。在某些领域,数字的解释方式和粒度与 AISI 博客不同,因此它作为主要信息的参考来源非常有价值。

GPT-5.4-Cyber​​ 和 GPT-5.5 面向人工智能网络安全的未来 |流体攻击(外部)
从行业角度比较 OpenAI 的 Trusted Access for Cyber​​ 和 Anthropic 的 Project Glasswing。数据来自多个独立评估机构。

AISI:GPT-5.5 在进攻性网络任务方面与 Mythos 不相上下 |结果感知(外部)
AISI评估总结,重点比较4种模型。诸如 43% 的损坏率和 9000 万英镑的新预算等政策数字也被整理出来。

GPT-5.5:完整指南(2026)|欧米加(外部)
组织发布 GPT-5.5 和 Project Glasswing 详细信息(包括参与公司列表)的解释性文章。它被用作确认专有名词的来源。

[相关文章]

Anthropic《克劳德神话预览》限量发售|自主发现几十年前的漏洞,为何历史上最强大的人工智能没有向公众开放?
关于 Mythos Preview 本身的解释性文章,它将作为领先模型出现在本次 AISI 评估中。涵盖了 Project Glasswing 的建立历史以及 Mythos 网络能力的整体情况。

是否存在“防守优势”? Anthropic 的 Glasswing 项目和人工智能网络能力的结构
本文的第一部分基于这样的观点:它不仅对攻击者开放,而且对防御者开放,正如本文的编辑评论中所讨论的那样。包括 OpenAI 和 Anthropic 的结构比较。

OpenAI“GPT-5.5”发布 |增强的代理编码,与 Claude Opus 4.7 和 Gemini 3.1 Pro 竞争,并为拉姆齐数的新证明做出贡献
GPT-5.5主体发布说明。包含本文的必备信息,例如准备框架和网络可信访问如何将其分类为“高”。

推出GPT-5.4-Cyber​​——OpenAI通过认证体系逐步向防御者开放网络防御AI
了解有关 OpenAI 网络可信访问 (TAC) 计划的更多信息。这是本文提到的安全访问框架的先例示例。

人择“神话”的真实身份——零日机器的威力只是夸大其词吗?(内部)
一篇文章,包括对神话能力评估的批判性观点。结合 AISI 评估显示的“第二个实现独立的案例”这一事实来看,它就变得立体了。

克劳德神话动摇了日本的金融基础设施日本金融厅、日本银行和三大银行为何采取紧急措施(内部)
同日发表的一篇文章讨论了前沿人工智能网络能力对日本方面的政策影响。本文提供了一个将本文讨论的“英国政策时机”与日方联系起来的视角。

[编者后记]

不同开发者的前沿人工智能都各自达到了相同的高度。为什么不一起思考一下,这种“跨行业能力曲线的陡峭化”对于我们的工作和生活安全意味着什么?在同一技术基础上,攻防同步加速。

您合作的组织和您每天使用的服务如何为这一变化做好准备?前沿人工智能如何既可以作为威胁,又可以作为加强防御的工具?对于这个问题,编辑部将继续追究。