智能日报
业界资讯 智能手机 电脑硬件 平板电脑 智能手表 智能家电 耳机音频 笔记本 热点资讯

MiniMax M3发布:12小时自主炼模,解码加速15倍,多模态能力再升级

2026-06-01来源:快讯编辑:瑞雪

MiniMax正式推出新一代旗舰大模型MiniMax M3,在编程与Agent能力领域取得显著突破。该模型在多个基准测试中展现出领先水平,尤其在真实软件工程能力评估框架SWE-Bench Pro上,其表现超越GPT-5.5和Gemini 3.1 Pro,接近Claude Opus 4.7。

技术架构方面,MiniMax M3采用全新稀疏注意力机制MSA(MiniMax Sparse Attention),支持百万级上下文窗口处理。相较于前代全注意力模型M2,该架构在预填充阶段实现9倍加速,解码阶段加速效率达15倍以上。这种设计通过精确的KV块分块策略,在保持计算精度的同时显著降低资源消耗,使单token计算量仅为前代的二十分之一。

作为原生多模态模型,M3具备图片、视频输入及桌面操作能力。在OmniDocBench多模态测试集中,其表现优于Gemini 3.1 Pro;在自主Agent评测框架Claw-eval上获得最高评分。训练数据规模达100万亿token级别,通过交错数据排列方式实现不同模态语义空间的深度融合。实测显示,该模型能详细描述图像细节,但在地理定位等复杂视觉任务中,与头部模型仍存在差距。

在自主训练能力测试中,M3展现惊人潜力。研究团队要求其在12小时内从零开始训练4个基础模型,全程无人干预完成数据合成、训练、评估全流程。最终这些模型在数学推理、工具调用等任务上达到基础能力水平,综合得分0.37,接近GPT-5.5(0.39)和Claude Opus 4.7(0.42)。在CUDA内核优化任务中,该模型连续工作24小时,通过1959次工具调用将硬件利用率从7.6%提升至71.3%,实现9.4倍加速。

配套发布的AI编程工具MiniMax Code专为M3设计,充分发挥其长上下文处理和原生多模态特性。该工具支持跨应用、跨系统操作,具备Computer Use能力。实测显示,M3在文档协作系统开发任务中,能主动规划技术方案、设计单元测试,并在执行过程中持续反思优化代码结构。

商业化方面,M3已通过API、Token Plan和MiniMax Code平台上线。API定价采用512k上下文分档策略,提供标准模式和优先调用方案,输入输出价格分别为2.1元/百万tokens和8.4元/百万tokens,缓存读取费用0.42元/百万tokens。当前模型技术报告及权重代码计划在十日内开源,MiniMax Code也将后续开放。

在编程任务实测中,M3展现双面性:其生成的赛车游戏界面美观但可玩性不足,动态SVG图像存在细节偏差;但在复杂文档系统开发中,能准确规划技术架构并设计验证环节。这种能力特征反映出当前大模型在工程化落地过程中,既具备理解复杂工作流的潜力,仍需提升任务交付的完整性。

荣耀WIN2新机配置曝光:2nm芯片加185Hz屏,是创新突破还是冒险一搏?
以我口气去年WIN一代虽然不算高,但也不便宜,而现在这个这配置——2nm芯片、10000mAh、185Hz屏、主动散热——成本明显飙升,所以从荣耀不做公益的角度能感受,价格一般来说会比一代要高,而且现在还有涨…

2026-06-01

华为nova 16系列发布:深度定制时代少年团专属功能 影像周边亮点十足
PChome 6月1日消息,今日,华为nova16系列及全场景新品发布会已开启,并表示华为nova 16拥有时代少年团专属功能。据介绍,华为nova 16系列深度定制了时代少年团专属功能,涵盖主题、音效、影…

2026-06-01

肇庆买苹果手机避坑指南!亲测这家苹果专卖店正品保障服务佳
临街独立门店,不用在商场里绕来绕去,进门就能看到店员不会一直跟着推销,有问题问他们才会过来解答买完可以现场激活设备、迁移数据,不用自己回家折腾热门机型基本都有现货,不用等官网发货五、线下买苹果手机必看避坑指…

2026-06-01

2026学生党购机指南:OPPO Reno15系列直屏手机怎么选才不踩坑?
在2026年的智能手机市场中,OPPO Reno15系列凭借其独特的小直屏设计和强大的AI拍照功能,迅速成为学生群体和年轻用户的热门选择。补贴后12+256GB版本仅需2499元起,512GB大存储版本也控制…

2026-06-01

家电ETF国泰159996开盘微跌0.27% 美的格力等重仓股表现各异涨跌互现
来源:新浪基金∞工作室 6月1日,家电ETF国泰(159996)开盘跌0.27%,报1.463元。家电ETF国泰(159996)重仓股方面,美的集团开盘跌0.66%,格力电器跌0.69%,三花智控涨0.00%…

2026-06-01

Anthropic推Claude Opus 4.8:强化诚实可靠,AI协作新挑战待解
按照惯例,发布会上少不了一串亮眼的跑分:SWE-bench Pro从64.3%升到69.2%,数学测试USAMO拿了96.7%,综合推理评分比GPT-5.5领先121个Elo分……但Anthropic选择把…

2026-06-01