智能日报
业界资讯 智能手机 电脑硬件 平板电脑 智能手表 智能家电 耳机音频 笔记本 热点资讯

全球大模型盲测新排名揭晓 阿里Qwen3.6-Plus成中国AI编程能力领跑者

2026-04-04来源:天脉网编辑:瑞雪

在AI编程能力的全球竞技场上,中国科技企业正以惊人速度崛起。阿里巴巴最新发布的大语言模型Qwen 3.6-Plus,在国际权威评测平台Code Arena的React专项榜单中以1452分位列全球第二,仅落后于Anthropic的Claude-Opus-4.6-Thinking(1540分),却以4分优势超越OpenAI最新模型GPT-5.0-High(1448分),更以12分差距领先Google的Gemini 3.1 Pro Preview(1440分)。这一成绩标志着中国大模型在AI Coding领域首次实现与全球顶尖模型的正面交锋并占据优势。

Code Arena作为LMArena旗下专注AI编程能力的子榜单,采用真实用户盲测与实时对抗机制,被业界视为衡量模型工程化能力的"试金石"。其React专项榜单聚焦Web开发场景,要求模型独立完成从项目初始化到调试运行的全流程,考验的是完整的工程思维而非单一代码补全能力。这种严苛的评测标准,使得该榜单成为Agent时代衡量模型综合实力的关键指标。

Qwen 3.6-Plus于4月2日正式发布,凭借原生多模态理解与推理能力,在代码生成与Agent任务中展现出独特优势。测试数据显示,该模型在多项权威编程评测中,以远低于竞争对手的参数量(千问3.6系列参数规模显著小于GLM-5、Kimi-K2.5等模型),实现了更高效的性能表现。特别是在处理复杂Web开发任务时,其端到端开发能力得到充分验证,能够自主完成需求分析、架构设计、代码实现与错误修复等全链条工作。

这一突破性成果直接推动阿里巴巴在全球AI实验室排名中升至第四位,紧随Anthropic、OpenAI和Google之后。值得关注的是,Qwen 3.6-Plus在Code Arena总榜单中同样位居国产模型首位,其代码生成质量与工程化水平获得国际认可。开发者社区反馈显示,该模型在处理动态界面渲染、状态管理等React核心特性时,展现出接近人类工程师的编码逻辑与问题解决能力。

据阿里巴巴技术团队透露,Qwen 3.6-Plus作为千问3.6系列的首发模型,后续将开源不同参数规模的版本以满足多样化需求。更值得期待的是,性能更强的旗舰模型Qwen 3.6-Max已完成研发,预计将于近期正式发布。这一系列动作表明,中国科技企业正在通过持续创新,重塑全球AI竞争格局。

Galaxy S26 Ultra来袭:性能影像防护齐发力,安卓机皇实至名归
Galaxy S26 Ultra 并不是一个只会堆参数的“偏科生”,它是一款在顶级性能、极致影像、硬核防护三个维度都做到了行业“天花板”水平的全能机皇。 如果你想要一台能让你彻底忘记充电宝、拍照能横扫朋…

2026-04-04

官方仿原贴皮磁吸手机壳走红:消费理性觉醒与供应链效率的完美碰撞
其核心竞争力在于:• 模具开发:自建200+套模具库,覆盖全球2000+款机型,新机72小时内完成开模•工艺覆盖:掌握超纤贴皮、热压成型、超声波焊接等全工艺,可生产素皮、真皮、精织纹等全材质仿原磁吸壳• 品…

2026-04-04

关停Sora视频应用后,OpenAI收购TBPN播客,布局内容传播新路径
TBPN 主持人同时也将加入 OpenAI 的市场与传播团队,利用其对行业趋势的敏锐度,帮助 OpenAI 创新 AI技术的推广方式。对于一家 AI 公司而言,直接拥有媒体平台是否会对其编辑独立性构成潜在…

2026-04-03

手机市场风云变幻:小米老机型涨价,红魔硬扛,华为老款降价逆势操作
不仅仅是OPPO、vivo,今天小米也宣布将在4月11日开始调整部分老产品的价格,而手机小厂,魅族选择停止研发新机,真我选择回归OPPO,但是也有例外! 现在手机依然还能抗住不涨价,可能有几个原因,一是备货充…

2026-04-03