在中国杭州举行的阿里云峰会2026上,阿里巴巴宣称将“打造中国的AI工厂”。发布的包括可自主运行长达35小时的大规模语言模型Qwen3.7-Max、自主研发的AI芯片真武M890以及捆绑128个加速器的超级节点服务器盘九AL128。完整的人工智能堆栈战略,其中从芯片到云、人工智能模型和代理基础设施的所有五个层次都是在内部准备的,代表了中国科技公司在美国出口限制下替代国内产品的最前沿。当这个同样兼容 Anthropic Claude Code 和 Qoder 的模型到达全球开发者手中时,AI 行业的版图将如何重新绘制?我们将结合海外多个报道和官方信息,对这一全面进入代理时代的公告进行解读。
2026年5月20日,阿里巴巴在中国杭州举行的阿里云峰会上宣布全面升级全人工智能栈。据报道,最新的大规模语言模型 Qwen3.7-Max 在内部基准测试中可连续运行长达 35 小时,并可进行超过 1,000 次工具调用,并针对 OpenClaw、Hermes Agent、Claude Code、Qwen Paw 和 Qoder 进行了优化。计划通过 Model Studio 向世界各地的开发人员提供。
在基础设施方面,盘九发布了AL128超级节点服务器,该服务器将128个AI加速器集成到单个机架中,并实现PB/s规模的带宽。在中国市场,在百联上有售,并推出了Agentic RL。半导体子公司 T-Head 宣布推出真武 M890,具有 144GB 内存和 800GB/s 芯片间带宽,原生支持 FP32 至 FP4、总带宽为 25.6Tbps 的 ICN Switch 1.0 以及软件堆栈 T-Head SAIL™。真武已发货超过 560,000 台,并已被 20 个行业的 400 多家公司安装。
【编辑部评论】
阿里巴巴此次宣布的不仅仅是新产品阵容的增加。声明是少数在内部部署“完整人工智能堆栈”的企业之一是。阿里云高级副总裁刘伟刚在峰会上表示,“我们打造的是中国的人工智能工厂”,并宣布公司致力于芯片、智能体云、人工智能模型、模型服务基础设施、智能体应用五个层面的一体化运营。官方博客文字也写着“2025年5月20日”,但页面日期、相关官方文章以及路透社和南华早报的报道均一致为2026年5月20日,因此这被认为是官方文字中的拼写错误。
我想在这里重点关注的是这个版本一个象征AI行业从“个体模型竞争”转向“全栈竞争”的例子这就是重点。 OpenAI和Anthropic通过专注于模型来争夺霸主地位,NVIDIA则专注于芯片,而阿里巴巴则通过垂直整合战略来竞争。
Qwen3.7-Max的“连续运行35小时、超过1000次工具调用”的影响很大,但这里需要谨慎。这些都是基于阿里巴巴和Qwen的内部基准的说法,尚不存在独立的第三方验证。。 Qwen 官方博客将具体条件描述为“约 35 小时、1,158 次工具调用、432 次内核评估”,但该模型目前处于“预览”阶段,据悉尚未发布开放权重版本。
尽管如此,长期自主运行的方向仍然是各大AI公司关注的趋势之一。到目前为止,人工智能一直专注于持续几分钟到几小时的任务,但代理人工智能一种“人工智能在你过夜时完成研究、编码和验证”的世界观。我们的目标 Qwen3.7-Max 针对其他公司和自己公司的主要代理框架(例如 Claude Code 和 Qoder)进行了优化,这表明阿里巴巴的目标是成为平台游戏。
对于真武M890的硬件方面,我们需要更加冷静的看待。根据海外报道和分析,该芯片的FP16性能为0.6 PFLOPs,相当于NVIDIA A100,是H20性能的三倍左右,是符合中国出口法规的版本(数字在阿里巴巴官方文本中无法确认,均基于二手报道)。另一方面,与NVIDIA最新一代Blackwell还是有很大区别的,其立场是出口限制下中国市场H100一代的候选替代品它被视为。
不过,这种“H100换代”的立场具有重大的地缘政治意义。由于美国出口法规的限制,中国企业无法合法购买H100及以上的高性能芯片。国内替代品的存在是在中国市场竞争的重要前提。这将是。随着华为提供的国产AI芯片“Ascend”的存在感不断增加,阿里巴巴也以超过56万颗的出货记录加入竞争。
经济规模也不容忽视。阿里巴巴宣布将在三年内投资 3800 亿元人民币(约合 530 亿美元)用于云和人工智能基础设施,这超过了该公司过去 10 年累计的人工智能支出,其半导体子公司 T-Head 的 IPO 计划也已被报道(具体时间尚未正式披露)。此外,据阿里巴巴官方透露,到2026年底,AI模型及应用业务的ARR(相当于年度经常性收入)预计将达到300亿元人民币(约合41亿美元)。人工智能作为利润引擎正在成为现实。
这对日本科技公司的影响是显而易见的。首先,代理人工智能的基础设施要求是“内存容量”、“片间带宽”、“低精度计算”等非常规轴我们已经进入了一个重视第二的时代,随着中美两极分化的持续,在全球开展业务的日本企业在选择车型时越来越需要有多种选择。
风险方面,随着自主运行时间变长,“不可控性”与“责任定位”成为新的讨论点。阿里巴巴将安全治理功能纳入百联平台,可以看作是针对这一问题的积极回应。当涉及超过 1,000 次工具调用的长时间运行任务中发生某些情况时,哪个决策阶段负责,这是法律体系未能跟上技术步伐的一个领域。
从长远来看,正如计划于2027年第三季度发布的后继芯片真武V900(据称具有216GB内存和1,200GB/s带宽)和2028年发布的J900的公开路线图所示,尽管中国AI半导体在性能上与Blackwell一代仍有差距,但在构建自己的生态系统方面正在稳步推进我正在做。我们认为,这一声明应该被铭记,因为它标志着世界人工智能基础设施版图将在未来几年内被大幅改写。
【术语解释】
完整的人工智能堆栈
构成人工智能服务的技术层垂直堆叠为半导体芯片、云基础设施、基础模型、模型服务库和代理应用程序等多层的结构。虽然内部采购所有层使优化和差异化变得更加容易,但它也需要大量的投资和技术能力。
代理人工智能
与每次收到人类指令时都会做出响应的传统人工智能不同,它是在给定目标时自主做出决策并执行多个步骤的人工智能的总称。通过结合“工具调用”(例如编写代码、编辑文件和搜索网络)来完成长任务。
工具调用
这是LLM调用和操作外部软件和函数的机制。通过内部链接搜索、代码执行、文件读写等,成为AI从单纯的文本生成器进化为“工人”的基础。
长期任务
一项需要很长时间和多个步骤才能完成的任务。这是代理AI的核心评估指标,需要坚持不懈才能达到最终目标,同时不能忽视上下文并从错误中恢复。
HBM3(高带宽内存3)
这是安装在 GPU 等 AI 芯片中的高带宽内存的第三代标准。对于存储和处理LLM庞大的参数至关重要,容量和带宽决定了AI芯片的性能。
FP4/FP32(浮动小数点精度)
它是数值计算中精度的表达单位。 FP32用于高精度学习,FP4是用4位表示的超低精度格式,据说可以有效加快推理速度并降低成本。
PB/s(拍字节每秒)/Tbps(太比特每秒)
数据传输速率的单位。 1PB/s 意味着每秒传输约 100 万 GB,在大规模 AI 集群中非常重要,因为多个芯片之间的通信速度成为瓶颈。
代理强化学习
这是一种利用智能体的执行结果作为反馈的强化学习方法。这种方法涉及通过现实世界中的反复试验不断改进模型,这直接导致自主任务的准确性提高。
人工智能工厂
这个概念是,连续处理学习和推理的系统被视为“工厂”。这也是NVIDIA首席执行官黄仁勋经常使用的表达方式,它表明了一种将AI重新定义为像电力或钢铁一样的基础设施行业的世界观。
Bailian(百炼)
这是阿里云模型工作室在中国的名称。它是一个生成式人工智能平台,允许企业通过API使用Qwen系列等,并且随着本次发布,添加了Agentic RL和安全治理功能。
ARR(年度经常性收入)
年度普通收入转换。这是订阅型业务中每月经常性收入换算为12个月的指标,表明稳定收入基础的规模。
LM竞技场
它是一个基准测试平台,用户可以匿名比较两个人工智能模型的答案并进行投票,以确定它们的相对性能排名。它作为不依赖于供应商公布的值的实用评估在业界被广泛引用。
华为Ascend/寒武纪
两者都是中国国产AI芯片的代表。作为一家在美国出口限制下可以取代NVIDIA的国内公司,它将与T-Head一起在提高中国半导体自给率方面发挥核心作用。
[参考链接]
阿里云官网(外部)
阿里巴巴集团负责云和人工智能业务的核心子公司的官方网站。它负责监督本文中宣布的 Qwen 等产品组。
奇文官方网站(外部)
阿里巴巴开发的大型语言模型“Qwen”系列的官方门户。提供最新的型号信息和开发者文档。
阿里云模型工作室(外部)
阿里云的生成式AI平台,可以通过API使用Qwen系列等。在中国市场,将以“百联”为名称进行销售。
T-Head(平头哥半导体/Pingtouge Semiconductor)公式サイト(外部)
阿里巴巴半导体设计子公司官网。负责真武系列等AI加速器的设计与开发。
阿里巴巴集团3800亿元投资公告(外部)
阿里巴巴集团正式发布,宣布三年内3800亿元人民币(约合530亿美元)的云和人工智能基础设施投资计划。
英伟达官方网站(外部)
GPU 和 AI 加速器市场全球领导者的官方网站。本文要比较的产品包括H100、H200和Blackwell。
Anthropic(Claude Code)公式サイト(外部)
Anthropic 代理编码工具 Claude Code 的官方页面。 Qwen3.7-Max 已宣布支持的主要框架之一。
[参考文章]
Qwen3.7:代理前沿(阿里云交换机)(外部)
Qwen官方博客对Qwen3.7-Max的详细解释。公开了连续运行35小时的具体条件:1158次工具调用和432次内核评估。
阿里巴巴发布全新AI芯片、旗舰机型,重构代理时代云栈AI(外部)
阿里云官方的一篇文章解释了整个堆栈。它还明确指出,到2026年底,AI业务的ARR预计将达到300亿元人民币(约41亿美元)。
阿里巴巴推出新的人工智能芯片,推动国产替代品(路透社)(外部)
路透社初步采访。真武在中国努力加强半导体自给率的背景下报道了M890的发布,并提到了推出V900和J900的计划。
阿里巴巴瞄准 NVIDIA Hopper,推出真武 M890 AI 芯片,声称性能是 H20 的 3 倍、144GB HBM3 以及截至 2028 年的路线图(外部)
二次报告指出,真武M890的FP16性能为0.6 PFLOPs,与NVIDIA A100相当,大约是H20的3倍。介绍V900和J900的公开路线图。
阿里巴巴自主研发的Qwen3.7-Max可自主运行35小时(VentureBeat)(外部)
一篇分析文章指出,Qwen3.7-Max 支持外部工具,例如 Anthropic 的 Claude Code 作为专有模型。
阿里巴巴推出Qwen新机型、定制芯片,力争成为中国AI工厂(南华早报)(外部)
一篇主要采访文章报道了刘伟刚的声明,即他正在“在中国建立一个人工智能工厂”,以及他拥有人工智能堆栈的所有五层的战略地位。
阿里巴巴通过新芯片和模型升级加大人工智能力度(华尔街日报)(外部)
《华尔街日报》全面报道。 Eddie Wu 的评论将人工智能产品定位为阿里云的主要收入增长动力。
阿里巴巴推出真武M890,中国NVIDIA替代推力加大(TNW)(外部)
独立评估将真武 M890 定位为 NVIDIA H100 一代的替代品,并且在受到出口限制的中国市场上可以成为实质性替代品。他还提到了T-Head IPO计划。
[相关文章]
阿里巴巴代理AI“悟空”——业务自动化将进展到什么程度?
解读阿里巴巴2026年3月宣布的企业代理平台“悟空”。这是定位为这一全AI栈战略第一阶段的重要举措。
阿里巴巴宣布Qwen3-Omni,计划投资530亿美元人工智能,并计划扩建欧洲和南美数据中心
一篇相关文章详细介绍了本社论中提到的 3800 亿元人民币(530 亿美元)的人工智能/云投资计划。您可以全面了解阿里巴巴的全球战略。
Anthropic 展望 2028 年中美人工智能竞争的两种情景——被半导体法规划分的未来
相关文章从人择角度解读中美半导体竞争,这也是本文的地缘政治背景。
Qwen3-Coder-Next 简介:本地可执行的编码 AI,即使使用 80B 参数也仅运行 3B
一篇文章宣布 Qwen 系列的编码专用版本。您可以了解Qwen3.7-Max代理编码能力的谱系。
华为Ascend 910C:中国AI芯片挑战NVIDIA,中美高科技竞争进入新阶段
一篇关于中国国产AI芯片华为Ascend的文章,它是T-Head真武M890的竞争对手。对于了解整个中国半导体生态系统很有用。
[编者后记]
“我把工作交给人工智能过夜,早上醒来时它就完成了。”——这种工作方式正在成为现实。阿里巴巴这次的宣布在中国似乎是一个遥远的故事,但Qwen3.7-Max还针对您日常使用的Claude Code和Qoder等工具进行了优化,您的选择肯定会扩大。
如果您想将一项任务委托给您的项目代理,它会是什么?尝试和比较多个模型似乎是一个有趣的周末。请告诉我们您触及未来的那一刻。
