新榜讯 财联社9月12日消息,阿里巴巴旗下通义千问重磅发布下一代基础模型架构Qwen3 - Next,同时开源了基于此架构的Qwen3 - Next - 80B - A3B系列模型。与Qwen3的MoE模型结构相比,该架构实现了多项核心改进,涵盖混合注意力机制、高稀疏度MoE结构、一系列利于训练稳定的优化举措,以及能提升推理效率的多token预测机制。
服务号
手机端