Kimi WebBridge 简介 | “本地优先”安全吗?重新审视代理人信任轴

人工智能代替人类自动执行“看屏、点击、填表”等操作的时代正在悄然进入实用阶段。然而,对于许多服务来说,浏览器操作历史记录和登录会话是通过云服务器路由的。对于访问个人银行账户和内部系统的代理人来说,这是一个不容忽视的问题。总部位于北京的 Moonshot AI 发布的 Kimi WebBridge 因其打破这一假设的本地优先设计而受到关注。我们将整理信息,包括公司周围的背景。


2026 年 5 月,Moonshot AI 发布了 Kimi WebBridge,这是一个允许 AI 代理像人类一样操作浏览器的扩展。与 Chrome 和 Edge 兼容,可从 Chrome Web Store 和 Kimi 官方网站购买。

最大的特点是本地执行。该扩展程序旨在通过 Chrome DevTools 协议与设备上的后台服务进行通信,因此浏览器操作永远不会离开用户的计算机。它在您现有的 Chrome 或 Edge 窗口上运行,并且可以按原样使用登录的 cookie 和会话信息。

兼容的工具有 Kimi Code CLI、Claude Code、Cursor、Codex 和 Hermes,这些工具可以独立于 Kimi 生态系统使用。

此扩展的基础是 Kimi 模型系列。最新的 K2.6 于 2026 年 4 月发布,根据 Moonshot 的数据,它在衡量现实世界软件工程能力的基准 SWE-Bench Pro 上得分为 58.6%。这高于 GPT-5.4 的 57.7% 和 Claude Opus 4.6 的 53.4%(这两个值均由 Moonshot 公布。分数根据测量条件而变化)。上一代Kimi K2于2025年7月作为具有1万亿个参数的开源Mixture-of-Experts模型出现,并在开源模型中排名第一,在LMSYS Arena排行榜上排名第五。

Kimi 因 2026 年 3 月的 Cursor 丑闻而受到广泛关注。Cursor 是一家当时估值 293 亿美元的编码人工智能初创公司,宣布 Composer 2 为“专有前沿模型”,开发者在 24 小时内分析了 API 流量,并确定其基于 Kimi K2.5。几个小时内,Cursor 的副总裁承认使用了开源基础设施,联合创始人 Aman Sanger 也承认了未披露的情况,称这“从一开始就是一个问题”。

浏览器代理领域包括 Anthropic 的 Computer Use、OpenAI 的 Operator 和 ChatGPT Atlas、Google 的 DeepMind 主导的代理以及 Perplexity 的 Comet 浏览器。虽然许多涉及通过云处理,但 Kimi WebBridge 目前保持本地优先的设计。

从: Kimi WebBridge 让 AI 代理驱动您的浏览器,并将您的数据保存在本地

【编辑部评论】

将浏览器这个“最敏感区域”交给代理的意义

随着人工智能代理变得越来越实用,浏览器处于特殊的地位。我们每天都会登录数字生活中最敏感的领域:我们的银行账户、我们的医疗记录、我们的内部 CRM 和 Slack、我们的电子邮件、我们的工资系统。

如果我们要包括“代表人类运行的人工智能”,那么就会出现不止一个设计问题。代理可以看到什么?向外部发送哪些信息以供决策?你通过谁的服务器? Moonshot AI 的 Kimi WebBridge 提出了“本地优先”作为这个问题的答案。然而,为了准确评估这一设计理念,还需要分析竞争公司的实施情况。

“云型与本地型”实际上是一个粗略的二分法

原始文章简单地将 WebBridge 与“本地”和人类计算机使用、OpenAI Operator/Atlas 以及 Perplexity Comet 与“云”进行了对比。然而,如果你实际上遵循每个公司的设计,那么组成会更加复杂。

OpenAI 的 ChatGPT Atlas 作为基于 Chromium 的专有桌面浏览器进行分发,虽然推理依赖于 OpenAI 的服务器,但 Chromium 引擎本身在用户的计算机上运行。OpenAI 将这种设计称为“OWL(OpenAI 的 Web 层)”,并使用在主应用程序外部的服务层中运行 Chromium 浏览器进程的结构。

Anthropic 的 Computer Use(API 版本)更进一步。官方文档明确指出“计算机使用是客户端工具”和“会话期间的屏幕截图、鼠标操作、键盘输入和文件保存在用户环境中而不是在 Anthropic 中”,并且还可以支持 ZDR(零数据保留)。 Claude Cowork 是一款于 2026 年 1 月发布的消费产品,旨在在 Apple 虚拟化框架上的 VM 沙箱内运行代理,并在需要 Web 访问时通过模型上下文协议 (MCP) 调用主机上的 Chrome。

换句话说,浏览器代理领域的进展并不是“一切都在云端处理的阵营”和“一切都在本地处理的阵营”之间的冲突。在“云端推理,更接近本地执行”的共同方向内,设计不同的信任边界是。

WebBridge的真正独特之处:现有浏览器扩展+代理独立性

基于这种构成,WebBridge 的差异化因素可分为两类。

首先,作为扩展程序运行在现有的 Chrome 或 Edge 上这就是设计。 Atlas和Comet采取的是强制用户切换到新的专有浏览器的方式,而WebBridge只是在用户日常使用的浏览器环境中添加了一个代理的“手”。它是一种不划分cookie、登录会话、书签和扩展等数字环境的结构。

其次是,与代理无关的这是必然的。 WebBridge可以与Kimi Code CLI、Claude Code、Cursor、Codex、Hermes配合使用,可以连接Kimi模型以外的AI助手作为推理引擎。从技术上讲,这是将“浏览器交互层”和“推理模型层”分开的设计选择。与 Atlas 专属于 ChatGPT、Cowork 专属于 Claude 的结构相比,WebBridge 保留了代理选择的自由度。

还值得注意的是,它使用 Chrome DevTools Protocol 作为其通信协议。 CDP 是开发人员用来调试浏览器的公共协议,在代理和浏览器之间提供技术上可验证的交互层。

“本地优先”解决什么问题?

我们需要在这里停下来。根据 Moonshot 的官方解释和 Decrypt 的描述,对于 WebBridge,“Moonshot 永远看不到页面的内容。”但是,驱动 WebBridge 本身的 Kimi K2.6 模型是作为云服务提供的,代理用于做出决策的上下文(与任务相关的屏幕截图、文本等)的处理无法完全从公开信息中确定。

换句话说,“本地优先”可能意味着它没有将所有浏览器会话信息、cookie 和浏览历史记录持续发送到 Moonshot 服务器的结构。这是安全和隐私方面的重要区别,但这并不意味着一切都在设备内完成。

还必须清楚地识别本地优先设计无法解决的风险。即时注入是一种攻击,其中嵌入恶意网页的指令会误导代理,无论数据发送的路由如何,都会存在这种攻击。事实上,在本地环境中,成功的攻击可以产生更广泛的影响,因为它可以直接操纵用户的登录会话。这种结构反映在 Anthropic 在宣布其 Cowork 时不同寻常的警告中,即“提示注入是最大的风险”。

本地第一是“避免数据集中在服务器上”是一种设计选择,并不是保证智能体本身安全的设计。未来的智能体评估必须不要混淆两者。

底层正在进行的另一个结构性变革:开源模式和代理市场

到目前为止,我们已经讨论了设计,但围绕 WebBridge 的上下文中还有另一个轴。

为 WebBridge 提供支持的 Kimi 模型系列是开源的。2026 年 3 月的 Cursor 丑闻揭露的是,被一家当时估值 293 亿美元的美国编码 AI 初创公司宣布为“专有前沿模型”的 Composer 2 的基础实际上是开源的 Kimi K2.5。Moonshot 的预学习主管通过标记器分析确认了完全匹配,并且 Cursor 也承认使用了开源基础设施。

这一现象表明人工智能开发的价值链正在发生变化。模型本身的差异化价值正在消失,价值可能会转向持续学习、强化学习、流程设计和用户体验。Cursor 副总裁 Lee Robinson 解释说,“大约 75% 的计算资源都花在了 Cursor 自己的训练管道上”,这也承认对基础模型的依赖太大,不容忽视。

Moonshot AI 进入 2026 年,获得了美团领投的 20 亿美元融资,估值接近 200 亿美元,几乎是 2025 年底估值的五倍。据报道,该公司的年度经常性收入(ARR)也超过 2 亿美元。 WebBridge 的独立于代理的设计可以解读为使用 Kimi 模型作为推理基础扩展到代理市场下层的策略的一部分。

对于我们日本读者来说,这篇作文值得仔细看。这里有一个结构,仅凭“来自中国的人工智能产品”的标签是无法看出的——开源模式正在支持美国尖端人工智能初创公司的悖论,以及这一点延伸到浏览器代理的设计选择的事实。

选择浏览器代理时,仅仅在云或本地两件事之间做出决定是不够的。推理数据流向哪里?执行环境在哪里?推理模型可以替代吗?该模型的许可证是什么?即时注入对策是如何设计的?─ 只有拥有这多个独立的轴,您才能做出适合您需求的选择。可以说WebBridge起到了可视化这个决策轴的作用。

【术语解释】

Chrome 开发者工具协议 (CDP)
Google 开发的用于浏览器调试的通信协议。用于以编程方式访问浏览器内部状态(DOM 结构、网络通信、JavaScript 执行状态等)的低层通信接口。 WebBridge 最初是为开发人员提供的调试工具,现已将其重新定位为充当代理和浏览器之间的桥梁。

混合专家(MoE)
AI 模型的架构方法。尽管它有大量称为“专家”的子网络,但它的设计目的是根据每次推理期间的输入有选择地仅激活一些专家。即使参数总数很大,实际计算成本也可以保持在较低水平,即使对于 Kimi K2(1 万亿个参数)等超大型模型也可以进行高效推理。

SWE-Bench Pro
Scale AI 开发的用于衡量 AI 编码代理能力的基准。它由从实际存储库中提取的 1,865 个任务组成,并评估 AI 是否可以自主修复错误并向代码添加功能。它强调抗污染性(旨在防止学习数据污染),据说不易出现分数膨胀。每个模型的得分根据测试时的代理配置(脚手架)而有所不同,Kimi K2.6 的 58.6% 得分是 Moonshot 公布的值(尚未确认在 Scale AI 官方公共排行榜上正式注册)。

及时注射
一种将恶意指令嵌入网页或输入文本以强制 AI 代理执行非预期操作的攻击方法。代理以“所查看页面的内容”为指导,其方式被误解为对自身的指令。即使数据传输路由是本地的,也无法避免这种情况,而且代理运行环境的权限越大,造成的损害可能就越大。

零数据保留(ZDR)
确保通过 API 发送或接收的数据不会存储在服务提供商的服务器上的策略。 Anthropic 在其企业 API 中提供的选项。对于医疗、金融、法律等处理机密数据的组织来说,引入人工智能是一项重要要求。

模型上下文协议(MCP)
Anthropic 开发的开放标准协议。定义 AI 助手与外部工具、数据源和应用程序交互的通用接口。 Claude Cowork利用VM中的Claude通过MCP操作主机上的Chrome,作为标准化AI与外部环境之间的连接的尝试而受到关注。

LMSYS 竞技场(竞技场)
由加州大学伯克利分校 LMSYS 团队开发的 LLM 评估平台,目前以 Arena 的形式运营(原 LMSYS Chatbot Arena,arena.ai)。两个人工智能模型匿名回答同一问题,用户选择更好的一个(Elo Rating),该模型根据超过 600 万条人类偏好数据发布排名。特点是它反映的是真实用户的主观评价,而不是基准数字。

[参考链接]

Kimi WebBridge 官方设置页面(外部)
官方页面指导您完成 WebBridge 的安装过程、连接命令以及如何设置 Kimi Claw Desktop。还包括 Mac 下载链接和 Windows 的 PowerShell 命令。

Kimi WebBridge 帮助中心(外部)
官方故障排除信息,包括如何处理连接错误、连接到支持的代理的命令以及计划要求(Allegretto 及以上)。

Kimi 模型存储库 (GitHub)(外部)
Moonshot AI 的 GitHub 组织。 Kimi K2 等开源模型的代码和论文存储库是公开可用的。适合想要直接查看模型实现的开发人员。

Chrome DevTools 协议官方文档(外部)
Google 的 CDP 规范的官方参考。您可以检查WebBridge内部使用的协议的详细信息。适合想要从技术上了解代理和浏览器如何通信的读者。

SWE-Bench Pro 官方排行榜(Scale AI)(外部)
由 Scale AI 运营的 SWE-Bench Pro 官方排行榜。与每个型号的最新分数进行比较。请注意,Kimi K2.6(58.6%)是Moonshot公布的值,其在Scale AI官方公共排行榜上的正式注册在文章发表时尚未得到确认。

竞技场排行榜(外部)
前 LMSYS 聊天机器人竞技场。 LLM排名基于真实用户偏好投票。 Kimi K2 在开源评估平台中排名第一,总体排名第五。您还可以查看当前的排名。

人性计算机使用文档(外部)
Anthropic 的计算机使用 API 官方指南。详细介绍了客户端设计、ZDR 支持和安全注意事项。适合想要深入研究文中提到的“本地优先设计比较”的开发者。

克劳德·科沃克产品页面(外部)
Anthropic的消费代理产品。您可以查看文章中提到的VM沙箱设计和通过MCP运行Chrome的官方信息。对于将设计理念与 WebBridge 进行比较很有用。

[参考视频]

Kimi WebBridge:本地人工智能代理,保护您的数据隐私(英语、约5分)
回顾视频,通过演示解释了 WebBridge 的本地执行机制以及它与基于云的代理之间的区别。

[参考文章]

Kimi WebBridge 将开源人工智能转变为本地浏览器运营商(Open Source For You / 2026年5月)
一篇解释性文章,将 WebBridge 定位在开源 AI 基础设施的背景下。名为“与代理无关的浏览器自动化层”的组织很有帮助。

构建 ChatGPT Atlas(OpenAI 官方博客/2026)
OpenAI 对 Atlas 的架构解释。我们确认了 OWL(OpenAI 的 Web 层)设计的细节以及以类似 Docker 的方式管理 Chromium 作为应用程序服务层的结构。

Atlas 背后的架构:OpenAI 的 Web Agent(ByteByteGo / 2026年)
OWL 架构的技术解释。计算机使用模型与Chromium浏览器引擎的详细集成方法以及保障措施的实施。这对于理解 Atlas 的本地实现至关重要,Atlas 被认为是“云类型”。

计算机使用工具 – Anthropic Documentation(Anthropic公式 / 随时更新)
官方文档明确指出Anthropic的Computer Use是一个客户端工具并支持ZDR。这被称为重新评估“云类型”分类的基础。

Moonshot AI 的 Kimi WebBridge:让您的 AI 代理浏览网页(FrontierNews.ai / 2026年5月)
一篇报道美团领投融资(估值约 200 亿美元,融资 20 亿美元)且 ARR 超过 2 亿美元的文章。 Moonshot AI 业务规模的数据来源。

Anthropic 推出 Cowork,一款可在您的文件中运行的 Claude 桌面代理(VentureBeat / 2026年1月)
Cowork 发布覆盖范围。 Anthropic 发出警告“提示注入是最大风险”这一事实的来源。在讨论本地代理安全风险时引用。

[编者后记]

将您的浏览器委托给人工智能代理——这一曾经看似不可能的操作现在已成为一个实用的选择。本地优先设计是一个诚实的答案,但正如即时注入的风险所显示的那样,信任问题不能仅通过数据流向来解决。当我们试图选择一个“安全代理人”时,我们的决定依据应该在哪里?这难道不是一个我们社会尚未达成共识的问题吗?