Qwen3：阿里巴巴开源中国首个混合推理AI——不同使用“快思维”和“慢思维”的下一代模型

2025年4月29日，阿里巴巴集团发布了最新的大规模语言模型Qwen3。 Qwen3是中国首个混合推理模型，旨在融合“快思维”和“慢思维”模式以降低计算成本。

Qwen3系列共有八个模型，其中包括六个密集模型（0.6B、1.7B、4B、8B、14B、32B）和两个混合专家（MoE）模型。 MoE模型分别为旗舰模型“Qwen3-235B-A22B”（总参数数2350亿个，有效参数数220亿个）和轻量化模型“Qwen3-30B-A3B”（总参数数300亿个，有效参数数30亿个）。

所有这些模型都是开源的，可以在 HuggingFace、GitHub 和阿里云在线界面上免费获得。

Qwen3具有两种推理模式，可以根据任务的复杂程度在“详细的逐步解答”和“快速反应”之间切换，采用平衡速度和智能的灵活设计理念。

据阿里云介绍，Qwen3-235B-A22B在编码、数学、通用推理基准测试中均表现出色，与DeepSeek-R1、01.AI的o1和o3-mini、Grok-3、Gemini 2.5 Pro等前沿模型不相上下。

Qwen3 在大约 36 万亿个代币的大型数据集上进行训练，这是其前身 Qwen2.5 大小的两倍。它还支持119种语言和方言，并增强了多语言处理能力。

与 DeepSeek R1 相比，Qwen3-235B-A22B 需要约三分之一的 VRAM（视频内存），显着降低了部署成本。

从：阿里巴巴推出并开源中国首个混合推理人工智能模型Qwen3

【编辑部评论】

Qwen3的到来可以说是中国人工智能发展的一个重要里程碑。一种称为“混合推理”的新方法代表了人工智能思维过程的重大演变。

该模型最显着的特点是它融合了类似于人类认知科学中的“系统1（快速、直觉思维）”和“系统2（慢速、深思熟虑思维）”的双重处理理论。这使我们能够快速响应简单的问题，并根据情况制定针对复杂问题的逐步思维过程。

值得注意的是，这个先进的模型已经开源发布。这将促进人工智能技术的民主化，因为研究人员和开发人员将能够自由使用和修改它。

从基准测试结果来看，Qwen3-235B-A22B在许多方面的性能仅次于Google Gemini 2.5 Pro，特别是在名为CodeForces Elo的竞争性编程基准测试中，它的表现优于Gemini 2.5 Pro。这可以说是中国人工智能研究已经达到世界最先进水平的证明。

此外，通过采用MoE（专家混合）架构，2350亿个参数中只有约220亿个参数被实际使用，从而实现了高效的设计。与 DeepSeek R1 相比，这需要大约三分之一的 VRAM（视频内存），从而显着降低部署成本。

Qwen3支持119种语言和方言，增强了多语言能力。它还在大约 36 万亿个代币的大型数据集上进行训练，这是其前身的两倍。

中国人工智能开发的竞争正在加剧，许多公司都在培养LLM，包括DeepSeek、百度的ERNIE和字节跳动的豆宝。数据显示，到2024年，中国将注册并上线约200个生成式人工智能模型，注册用户将超过6亿。

随着Qwen3的出现，AI应用范围将进一步扩大。我们为您提供构建移动设备、智能眼镜、自动驾驶汽车和机器人等下一代应用程序所需的灵活性。

另一方面，先进人工智能技术的传播也引发了信息可靠性、版权、隐私等问题。特别是，随着中国人工智能企业与美国研究机构的竞争加剧，限制获取模型训练所需芯片等政策也正在实施。

未来，Qwen3等混合推理模型可能会带来AI思维过程的质的提升，从而导致AI发展出与人类更加相似的决策能力。这可以说预示着AI演进的新方向，超越了单纯的性能提升。

【术语解释】

混合推理模型：
一种可以在“快思维”和“慢思维”两种思维模式之间切换的AI模型。与人类的思维过程相比，就像根据情况使用直觉判断（快思维）和逻辑分析（慢思维）一样。

教育部（专家混合）：
结合了多个“专家”人工智能的结构。例如，一个系统，其中有一个由医生、机械师、厨师等专家组成的团队，并且由最合适的专家来响应每个问题。虽然参数总数很多，但实际使用的只有部分，所以效率很高。

代币：
AI 处理的最小文本单位。在日语中，1 个标记大约为 1-2 个字符。 36万亿的训练数据相当于人类数千年也无法阅读的海量文本。

VRAM（视频内存）：
运行 AI 模型所需的显卡内存。较大的型号需要更多的 VRAM，而且价格也更昂贵。

[参考链接]

奇文官方网站（外部）
Qwen3的官方博客。列出了型号特征和技术细节。

阿里巴巴云（外部）
阿里巴巴集团的云计算服务。开发并提供Qwen3。

Qwen3 GitHub（外部）
发布 Qwen3 开源代码和模型的存储库。

抱脸Qwen（外部）发布 Qwen 模型的 Hugging Face 页面。您也可以在线尝试该模型。

[参考视频]

[编者后记]

AI的“思维方式”正在进化。像Qwen3这样的人工智能，以不同的方式使用“快思考”和“慢思考”，可能正在接近我们人类的认知过程。如何在您的业务和日常生活中利用这种双面人工智能？另外，为什么不考虑一下通过开源将为日本开发者社区带来哪些可能性呢？人工智能从“观察者”到“参与者”进化的大门已经打开。

[相关文章]

在 innovaTopia 上阅读更多 AI（人工智能）新闻