新榜讯 1月26日消息,阿里巴巴正式发布千问旗舰推理模型Qwen3 - Max - Thinking。据阿里方面表示,该模型在多个关键维度取得显著提升,涵盖事实知识、复杂推理、指令遵循、人类偏好对齐以及智能体能力等方面。在19项权威基准测试里,Qwen3 - Max - Thinking展现出强大实力,其性能可与GPT - 5.2 - Thinking、Claude - Opus - 4.5和Gemini 3 Pro等顶尖模型相媲美。此外,Qwen3 - Max - Thinking引入两项核心创新技术,一是具备自适应工具调用能力,能够按需调用搜索引擎和代码解释器,此功能现已在Qwen Chat上线;二是采用测试时扩展技术(Test - Time Scaling),有效提升推理性能。
