阿里千问最强模型重磅亮相多项性能破全球纪录-时事新闻-世界论坛网（电脑版）

首页

即时

热点

图片

论坛

简体/繁体 | 广告服务 | 联系我们 | 关于我们 |

世界论坛网 > 时事新闻 > 正文

阿里千问最强模型重磅亮相多项性能破全球纪录
www.wforum.com \| 2026-01-26 08:38:48 潮新闻 \| 0条评论 \| 查看/发表评论




1月26日，阿里正式发布千问旗舰推理模型Qwen3-Max-Thinking，创下数项权威评测全球新纪录，性能媲美GPT-5.2、Gemini 3 Pro，成为迄今为止最接近国际顶尖模型的国内最强AI大模型。通过总参数、强化学习、推理计算的极致规模扩展，千问新模型实现了性能的大幅飞跃，刷新科学知识（GPQA Diamond）、数学推理（IMO-AnswerBench）、代码编程（LiveCodeBench）等多项关键性能基准测试的全球纪录。 Qwen3-Max-Thinking是目前阿里规模最大、能力最强的千问推理模型，其总参数量超万亿（1T），预训练数据量高达36T Tokens。此前，预览版Qwen3-Max-Thinking斩获数学推理AIME 25和HMMT 25的国内首个双满分，推理性能已让人惊艳；在此基础上，阿里通义团队进行了更大规模的强化学习后训练，全面提升了正式版Qwen3-Max-Thinking性能：在涵盖事实知识、复杂推理、指令遵循、人类偏好对齐、Agent能力等19个公认的大模型基准测试中，千问旗舰推理模型刷新了数项最佳表现（SOTA）纪录，整体性能可媲美 GPT-5.2-Thinking-xhigh、Claude Opus 4.5 和 Gemini 3 Pro 。在关键的模型推理能力提升中，千问新模型采用了一种全新的测试时扩展（Test-time Scaling）机制，推理性能提升的同时还更经济。业界普遍的推理时计算，只会简单增加并行推理路径，重复推导已知结论，造成冗余推理效率低下；而千问采用的这一新机制，可对此前推理的结果进行“经验提取”式的提炼，并据此进行多轮自我迭代，在相同的上下文中实现更高效的推理计算，获得更智能的推理结果。基于这一推理技术创新，千问推理性能和推理效率大为提升，比如在启用工具的“人类最后的测试”HLE中，千问得分58.3，大幅超过GPT-5.2-Thinking的45.5、Gemini 3 Pro的45.8，录得当前所有模型的最高分。面向即将到来的智能体Agent时代，Qwen3-Max-Thinking还大幅增强了自主调用工具的原生Agent能力。具体而言，在完成初步的工具使用微调后，通义团队对模型进一步在大量多样化任务上进行了基于规则奖励与模型奖励的联合强化学习训练，使得Qwen3-Max-Thinking拥有更智能结合工具进行思考的能力。这种自适应的工具调用能力可在QwenChat上完整体验，模型自主选用搜索、个性化记忆和代码解释器等三个核心的Agent工具功能，提供专业人士一样水平的回答，更合用户心意、更智能、更流畅；同时，模型幻觉也大为降低，为解决真实复杂任务打下基础。目前，开发者可在QwenChat上免费体验Qwen3-Max-Thinking模型，企业可通过阿里云百炼获取新模型API服务，普通用户也可通过千问PC端和网页端试用模型。据了解，千问APP也即将接入新模型，所有用户都可免费体验千问最强模型。

当前新闻共有0条评论	分享到：

评论前需要先登录或者注册哦

全部评论

暂无评论

	实用资讯

24小时新闻排行榜

	印度前陆军一号“反水”：阿克赛钦换藏南
	俄军羡慕！中国空警-3000就是“世界最强”
	开战66天战火重燃美伊海战全面打响
	重金升级F16，巴铁为什么不增购歼10？
	官媒首次曝光100式战车训练画面不料…

48小时新闻排行榜

	印度前陆军一号“反水”：阿克赛钦换藏南
	俄军羡慕！中国空警-3000就是“世界最强”
	开战66天战火重燃美伊海战全面打响
	重金升级F16，巴铁为什么不增购歼10？
	官媒首次曝光100式战车训练画面不料…
	川普深夜最新表态
	史无前例！乌克兰机器人组团开赴前线
	习铁杆亲信这一幕，像极了秦刚消失前
	周恩来大哭彭德怀给出“老奸巨猾”4个字
	爆中共空军悄悄大洗牌

热门专题

1	中美对抗	2	以哈战争	3	乌克兰战争
4	美国大选	5	李克强猝逝	6	新冠疫情
7	香港局势	8	委内瑞拉	9	华为
10	黑心疫苗	11	“低端人群”	12	美国税改
13	红黄蓝幼儿园	14	中共19大	15	郭文贵

广告服务 | 联系我们 | 关于我们 | 网站导航 | 隐私保护

Jobs. Contact us. Privacy Policy. Copyright (C) 1998-2026. Wforum.COM. All Rights Reserved.