2025年4月29日,阿里巴巴集团发布了最新的大规模语言模型Qwen3。 Qwen3是中国首个混合推理模型,旨在融合“快思维”和“慢思维”模式以降低计算成本。
Qwen3系列共有八个模型,其中包括六个密集模型(0.6B、1.7B、4B、8B、14B、32B)和两个混合专家(MoE)模型。 MoE模型分别为旗舰模型“Qwen3-235B-A22B”(总参数数2350亿个,有效参数数220亿个)和轻量化模型“Qwen3-30B-A3B”(总参数数300亿个,有效参数数30亿个)。
所有这些模型都是开源的,可以在 HuggingFace、GitHub 和阿里云在线界面上免费获得。
Qwen3具有两种推理模式,可以根据任务的复杂程度在“详细的逐步解答”和“快速反应”之间切换,采用平衡速度和智能的灵活设计理念。
据阿里云介绍,Qwen3-235B-A22B在编码、数学、通用推理基准测试中均表现出色,与DeepSeek-R1、01.AI的o1和o3-mini、Grok-3、Gemini 2.5 Pro等前沿模型不相上下。
Qwen3 在大约 36 万亿个代币的大型数据集上进行训练,这是其前身 Qwen2.5 大小的两倍。它还支持119种语言和方言,并增强了多语言处理能力。
与 DeepSeek R1 相比,Qwen3-235B-A22B 需要约三分之一的 VRAM(视频内存),显着降低了部署成本。
从:阿里巴巴推出并开源中国首个混合推理人工智能模型Qwen3
【编辑部评论】
Qwen3的到来可以说是中国人工智能发展的一个重要里程碑。一种称为“混合推理”的新方法代表了人工智能思维过程的重大演变。
该模型最显着的特点是它融合了类似于人类认知科学中的“系统1(快速、直觉思维)”和“系统2(慢速、深思熟虑思维)”的双重处理理论。这使我们能够快速响应简单的问题,并根据情况制定针对复杂问题的逐步思维过程。
值得注意的是,这个先进的模型已经开源发布。这将促进人工智能技术的民主化,因为研究人员和开发人员将能够自由使用和修改它。
从基准测试结果来看,Qwen3-235B-A22B在许多方面的性能仅次于Google Gemini 2.5 Pro,特别是在名为CodeForces Elo的竞争性编程基准测试中,它的表现优于Gemini 2.5 Pro。这可以说是中国人工智能研究已经达到世界最先进水平的证明。
此外,通过采用MoE(专家混合)架构,2350亿个参数中只有约220亿个参数被实际使用,从而实现了高效的设计。与 DeepSeek R1 相比,这需要大约三分之一的 VRAM(视频内存),从而显着降低部署成本。
Qwen3支持119种语言和方言,增强了多语言能力。它还在大约 36 万亿个代币的大型数据集上进行训练,这是其前身的两倍。
中国人工智能开发的竞争正在加剧,许多公司都在培养LLM,包括DeepSeek、百度的ERNIE和字节跳动的豆宝。数据显示,到2024年,中国将注册并上线约200个生成式人工智能模型,注册用户将超过6亿。
随着Qwen3的出现,AI应用范围将进一步扩大。我们为您提供构建移动设备、智能眼镜、自动驾驶汽车和机器人等下一代应用程序所需的灵活性。
另一方面,先进人工智能技术的传播也引发了信息可靠性、版权、隐私等问题。特别是,随着中国人工智能企业与美国研究机构的竞争加剧,限制获取模型训练所需芯片等政策也正在实施。
未来,Qwen3等混合推理模型可能会带来AI思维过程的质的提升,从而导致AI发展出与人类更加相似的决策能力。这可以说预示着AI演进的新方向,超越了单纯的性能提升。
【术语解释】
混合推理模型:
一种可以在“快思维”和“慢思维”两种思维模式之间切换的AI模型。与人类的思维过程相比,就像根据情况使用直觉判断(快思维)和逻辑分析(慢思维)一样。
教育部(专家混合):
结合了多个“专家”人工智能的结构。例如,一个系统,其中有一个由医生、机械师、厨师等专家组成的团队,并且由最合适的专家来响应每个问题。虽然参数总数很多,但实际使用的只有部分,所以效率很高。
代币:
AI 处理的最小文本单位。在日语中,1 个标记大约为 1-2 个字符。 36万亿的训练数据相当于人类数千年也无法阅读的海量文本。
VRAM(视频内存):
运行 AI 模型所需的显卡内存。较大的型号需要更多的 VRAM,而且价格也更昂贵。
[参考链接]
奇文官方网站(外部)
Qwen3的官方博客。列出了型号特征和技术细节。
阿里巴巴云(外部)
阿里巴巴集团的云计算服务。开发并提供Qwen3。
Qwen3 GitHub(外部)
发布 Qwen3 开源代码和模型的存储库。
抱脸Qwen(外部)发布 Qwen 模型的 Hugging Face 页面。您也可以在线尝试该模型。
[参考视频]
[编者后记]
AI的“思维方式”正在进化。像Qwen3这样的人工智能,以不同的方式使用“快思考”和“慢思考”,可能正在接近我们人类的认知过程。如何在您的业务和日常生活中利用这种双面人工智能?另外,为什么不考虑一下通过开源将为日本开发者社区带来哪些可能性呢?人工智能从“观察者”到“参与者”进化的大门已经打开。
