智能日报
业界资讯 智能手机 电脑硬件 平板电脑 智能手表 智能家电 耳机音频 笔记本 热点资讯

Kimi开源混合线性注意力架构Kimi Linear 性能效率双提升 成本降低

2025-11-02来源:快讯编辑:瑞雪

大模型领域迎来重要突破,月之暗面公司正式开源其自主研发的混合线性注意力架构Kimi Linear。该架构在短上下文、长上下文及强化学习扩展机制等多个场景中,首次实现了对传统Transformer架构全注意力机制的全面超越,为人工智能模型效率提升开辟了新路径。

核心创新在于其开发的线性注意力模块Kimi Delta Attention(KDA)。该模块通过引入通道级对角门控机制,在Gated DeltaNet基础上实现技术升级。相较于传统头部遗忘门控,这种细粒度设计使每个特征维度具备独立遗忘率,显著提升了有限状态RNN内存的利用效率。实验数据显示,在保持模型质量的前提下,KDA将KV缓存占用率降低75%,同时使百万级Token解码吞吐量提升至原有架构的6倍。

研究团队采用3:1的混合架构设计,将KDA与全注意力层按比例交错排列。这种创新结构在生成长序列时,既能通过全注意力层维持全局信息流通,又可大幅削减内存消耗。预训练的Kimi Linear模型拥有30亿激活参数和480亿总参数,在1.4万亿token训练数据支撑下,于通用知识、数学推理、编程能力及中文任务等多个维度均展现出显著优势。

技术实现层面,KDA采用Diagonal-Plus-LowRank(DPLR)矩阵变体进行动态参数化,配合定制分块并行算法,在保持与经典delta规则一致性的同时,将计算复杂度降低近半。输出阶段通过块间递归与块内并行策略,充分释放张量核心计算潜力。神经参数化设计采用低秩输出门结构,在确保参数公平比较的基础上,有效缓解注意力陷阱问题。

性能评估显示,该架构在BBH常识推理、MMLU学科测试、HellaSwag情景预测等基准测试中均取得最高分。数学领域方面,在AIME 2025、HMMT 2025等高难度竞赛级测试中表现突出;编程能力验证中,PolyMath-en和LiveCodeBench等平台成绩领先。中文任务评估中,Ceval和CMMLU测试得分创下新高。效率对比实验表明,当处理512k长度序列时,其性能达到传统架构的2.3倍,处理百万级序列时效率提升近3倍。

开源内容包含KDA内核代码、vLLM集成方案及预训练模型检查点。开发者可通过GitHub(fla-org/flash-linear-attention)和Hugging Face(moonshotai/Kimi-Linear-48B-A3B-Instruct)平台获取完整资源。这项突破不仅为长序列建模提供了高效解决方案,更通过直接替代传统注意力机制的特性,显著降低模型优化成本,为人工智能应用落地开辟新可能。

马斯克勾勒未来手机蓝图:AI主导影音呈现,告别传统OS与应用
IT之家 11 月 1 日消息,马斯克在昨天发布的最新一期乔・罗根播客中谈到了自己对智能手机未来的看法:“我们未来所谓的电话,将实际上是一个用于AI 推理的边缘节点,并配备通信功能。服务器端的 AI 将与“…

2025-11-02

小米米家空调智能诊断功能上线,联网远程精准识别122项异常
IT之家 11 月 1 日消息,此前小米宣布米家空调服务从 6 年免费包修升级为 10 年免费包修,而目前小米宣布旗下米家空调智能服务再次升级,迎来“智能诊断”功能,可以远程检测识别空调的“内外机脏堵、系统缺…

2025-11-01

华为旗舰大折叠新机曝光:或为Mate X7 搭载麒麟9030 配置全面升级
10月30日,博主“数码闲聊站”爆料了一款华为旗舰大折叠的配置信息。 博主称,“华为一款旗舰大折叠,内部代号Delphi,或许是MateX7?工程机有曜石黑 / 幻影紫 / 寰宇红 / 云锦蓝 / 云锦白,…

2025-11-01

苹果下一代AirPods Pro前瞻:H3芯片加持,红外摄像头赋能新体验
分析师普遍认为,下一代AirPods Pro可能是现有AirPods Pro 3的升级版本,类似于AirPods Pro 2在发布一年后获得USB-C充电盒等改进而未更名的策略。郭明錤此前透露,搭载红外摄像…

2025-11-01

英伟达携手诺基亚:以AI-RAN赋能,共筑6G通信新未来
此次合作旨在推动无线通信在性能和效率方面的创新,确保消费者在设备上使用生成式AI、智能体AI和物理AI应用时能获得"无缝"的网络体验。 此次合作还将看到英伟达向诺基亚投资10亿美元,两家公司表示这标志着AI…

2025-10-31

苹果OLED布局提速:iPad多系列2026起升级,MacBook Pro/Air陆续跟进
苹果正推进OLED显示屏在多款设备中的应用,计划逐步以OLED技术取代现有的LCD屏幕。 根据最新进展,iPad mini预计最早于2026年迎来OLED屏幕升级,同时将引入更先进的防水功能。即将在2026…

2025-10-31

英伟达发布Vera Rubin超级平台,算力大幅提升,携手美实验室推进科研与AI发展
从架构层面看,Vera Rubin 是英伟达迄今最复杂的计算平台,由 Vera CPU 和 Rubin GPU 组成,分为普通版 VeraRubin NVL144 和 Ultra 版 NVL576。 会上…

2025-10-29

一加15强势登场:400万跑分+165Hz高刷+7300mAh电池,性价比之选
现在主流旗舰还停留在120Hz,而一加15直接把上限抬高到165Hz,这就好比别人用的是普通高速公路,它已经把加速道延伸到航空母舰甲板上了。如果你是那种手机当掌机用、FPS天天排位冲分、帧率就是尊严、电量就是…

2025-10-29

苹果OLED屏幕升级路线图揭晓:iPad mini与MacBook Pro或率先于2026年升级
与 iPad Air 类似,计划于 2026 年春季更新的 MacBook Air 也将继续采用 LCD 屏幕。 该博文指出苹果的 OLED屏幕部署策略呈现出清晰的梯队化特征:高端的 Pro 系列率先完成…

2025-10-29

苹果加速布局OLED阵营:iPad mini、iPad Air及MacBook系列将逐步告别LCD
快科技10月29日消息,据媒体报道,苹果正在研发搭载OLED显示屏的iPad mini、iPad Air、MacBook Pro和MacBookAir机型,苹果已在iPad Pro中采用OLED屏,并计划在…

2025-10-29