智能日报
业界资讯 智能手机 电脑硬件 平板电脑 智能手表 智能家电 耳机音频 笔记本 热点资讯

阿里千问Qwen3-Coder-Next发布:以低推理成本解锁高效编程智能体新可能

2026-02-04来源:天脉网编辑:瑞雪

阿里巴巴旗下千问团队近日正式发布全新语言模型Qwen3-Coder-Next,这款专为编码代理和本地开发场景设计的开放权重模型,通过创新架构与训练方法在编程智能体领域展现出显著优势。该模型基于Qwen3-Next-80B-A3B-Base构建,采用混合注意力机制与专家混合(MoE)架构,在保持低推理成本的同时实现了强大的编程能力。

在训练方法上,研究团队突破传统参数扩展模式,重点强化智能体训练信号的扩展性。通过构建包含大规模可验证编程任务和可执行环境的训练体系,模型能够直接从环境反馈中学习优化。具体训练流程涵盖四个阶段:首先在代码与智能体相关数据上进行持续预训练,随后利用高质量智能体轨迹数据进行监督微调,接着针对软件工程、QA测试、Web/UX设计等领域开展专家训练,最终将多领域专家能力蒸馏整合到单一可部署模型中。这种训练范式特别强化了长程推理、工具调用和错误恢复能力,这些特性对现实编程场景至关重要。

性能评估显示,该模型在多个权威编程智能体基准测试中表现突出。在SWE-Bench系列测试中,使用SWE-Agent框架时模型在Verified版本上取得超过70%的准确率,在多语言版本和更具挑战性的Pro版本中仍保持竞争力。特别值得注意的是,尽管激活参数规模仅30亿,其性能已可媲美激活参数多10-20倍的开源模型。在TerminalBench 2.0和Aider等基准测试中,模型同样展现出优异表现。

效率分析图表揭示,Qwen3-Coder-Next在性能与资源消耗间实现了更优平衡。在SWE-Bench-Pro测试中,30亿激活参数版本的性能与参数量大数十倍的模型相当,展现出显著的成本优势。虽然全注意力架构的专有模型在绝对性能上仍占优势,但该模型在低成本智能体部署场景中已处于领先位置,特别适合资源受限环境下的编程任务处理。

技术文档显示,模型开发团队将持续优化推理决策能力,计划扩展对更多编程任务类型的支持,并建立快速迭代机制根据用户反馈持续改进。目前该模型已通过ModelScope和Hugging Face平台开源,开发者可自由获取模型权重及训练代码进行二次开发。

2025智能手电推荐:为女性夜间安全护航,隐蔽实用紧急防护一步到位
隐形设计解决携带痛点 :16.2cm×2.1cm笔形外观,可伪装成日常用品,避免传统防身工具的尴尬 专利电弧防卫系统:推出式电弧技术,3秒内触发强光+电弧震慑,弥补生理力量差距 定位录音一体化 :通过蓝…

2026-02-04

科创创业人工智能ETF工银588430开盘上扬,重仓股多数飘红新易盛领涨
来源:新浪基金∞工作室 2月3日,科创创业人工智能ETF工银(588430)开盘涨1.39%,报1.165元。科创创业人工智能ETF工银(588430)重仓股方面,新易盛开盘涨4.10%,中际旭创涨2.71%…

2026-02-04

三星Galaxy S26 Ultra海报曝光 钴紫色外观亮眼 2026年或成首款万元Ultra旗舰
快科技2月2日消息,三星将在本月举办Galaxy Unpacked活动,正式发布年度旗舰Galaxy S26系列,包含GalaxyS26、Galaxy S26+和Galaxy S26 Ultra三款旗舰。相…

2026-02-04

技钢科技发布两款企业级工作站主板,适配英特尔至强Xeon 600系列处理器
规格较低的 MW54-HP0 则采用 ATX 板型,内存方面是 4 通道 2DPC 共 8 根,支持 RDIMM 的同时保留对 MRDIMM的兼容。 其提供 5 个 PCIe 5.0×16 插槽、3 个 …

2026-02-04

美国学者亲历:中国无人驾驶出租车穿梭自如,多城试点展现科技新貌
美国商业内幕网1月31日文章,原题:我们在中国乘坐了数十辆无人驾驶出租车,以下是我们的所见所闻 也许你已在美国试乘过无人驾驶出租车。但不必担心,中国对外国人越来越开放,技术越来越先进,我们遇到的一些障碍甚至…

2026-02-04

苹果联合特拉维夫大学推PCG技术:AI语音生成效率质量双提升
试验数据显示,应用 PCG 技术后,语音生成速度提升了约 40%,且并未牺牲音频质量。 在一项极限压力测试中,研究人员将 91.4% 的语音token 替换为同组的其他 token,结果显示词错率仅增加了…

2026-02-03