智能日报
业界资讯 智能手机 电脑硬件 平板电脑 智能手表 智能家电 耳机音频 笔记本 热点资讯

蚂蚁百灵Ling-2.6-flash模型揭晓:高效推理,百万字长篇轻松生成

2026-04-22来源:天脉网编辑:瑞雪

蚂蚁集团旗下百灵团队近日宣布,其最新研发的轻量级大模型Ling-2.6-flash正式亮相。该模型此前以匿名形式在OpenRouter平台上线测试,迅速攀升至热榜首位并持续保持领先地位,日均调用量突破百亿级tokens。经过多轮优化验证,这款总参数量达104B、激活参数7.4B的Instruct模型,现已在OpenRouter与官方平台同步开放免费API调用服务。

技术团队通过架构创新实现性能突破,该模型采用混合线性注意力机制与稀疏化MoE架构,在4卡H20硬件环境下推理速度达340 tokens/s,Prefill吞吐量达到主流模型的2.2倍。特别在token效率优化方面,模型在Artificial Analysis完整评测中仅消耗15M tokens即达成目标,成本约为同类模型的十分之一。这种设计使其在长文本生成、实时交互等场景中展现出显著优势,百万字级内容可在数十分钟内完成创作。

针对Agent应用场景,研发团队构建了专项强化训练体系。通过扩展高保真交互数据集,模型在工具调用、多步骤规划等核心能力上取得突破性进展。在BFCL-V4、TAU2-bench等权威评测中,该模型与参数量更大的竞品相比,仍保持相近甚至领先的性能表现。实测数据显示,其可稳定处理需求整理、任务拆解等复杂工作流,幻觉率较前代降低37%,结果可用性显著提升。

在应用开发层面,Ling-2.6-flash展现出强大的场景适应能力。测试案例显示,模型可在1分钟内完成包含明暗模式切换、响应式设计的网站开发,并支持局部功能秒级修改。结合Kilo Code插件使用时,多子Agent协同机制使输出效率进一步提升。目前该模型已支持BF16、FP8、INT4等多种精度模式,其中INT4量化版本可在DGX Spark硬件上运行,为边缘设备部署提供可能。

当前开放的服务方案包含双重福利:首周提供完全免费的API调用,之后每日保留50万tokens免费额度,超出部分按输入0.6元/百万tokens、输出1.8元/百万tokens计费。技术社区可期待的是,该模型的BF16、FP8、INT4版本代码即将开源,配套的推理算子优化方案也将陆续公开,这为开发者自定义部署提供了重要支撑。

尽管在复杂系统开发等场景仍存在局限,但百灵团队通过持续迭代已显著改善模型稳定性。最新测试表明,在涉及中英双语切换、长程任务执行等场景时,模型的响应准确率较测试初期提升29%。技术白皮书显示,研发团队正探索通过动态注意力分配机制,进一步突破推理深度限制,在保持高效特性的同时提升复杂场景处理能力。

谷歌本周发布TPUv8双芯策略:剑指AI芯片市场,英伟达面临新挑战
快科技4月21日消息,据报道,谷歌计划在本周于拉斯维加斯举行的Google Cloud Next大会上,发布其新一代TPUv8 AI芯片,剑指英伟达在AI芯片市场的霸主地位。 据TrendForce预估,2…

2026-04-22

库克将卸任苹果CEO,智界高层谈苹果汽车遗憾或暗示V9新动向
IT之家 4 月 21 日消息,苹果公司今日宣布,蒂姆 · 库克(Tim Cook)将出任苹果董事会执行董事长,硬件工程高级副总裁约翰 ·特努斯(John Ternus)将担任苹果下一任首席执行官,该任命自…

2026-04-22

罗姆第5代SiC MOSFET问世:高温性能提升,助力电动汽车与工业电源升级
IT之家 4 月 21 日消息,日本半导体制造商 ROHM(罗姆)今日宣布其在今年 3 月成功完成了第 5 代碳化硅 (SiC) MOSFET的开发工作。相较上代,新产品通过器件结构改进和制造工艺优化在 1…

2026-04-22

库克今年9月卸任苹果CEO 约翰·特努斯接任 苹果开启新篇章
快科技4月21日消息,苹果公司即将迎来重大人事调整。今日,苹果CEO蒂姆·库克宣布,将于今年9月卸任CEO一职,并转任执行董事长,届时,CEO职位将由现任苹果硬件工程高级副总裁约翰·特努斯接任。 库克还表示…

2026-04-22

华为Pura X系列成绩亮眼:标准版与典藏版热销,Pura X Max新机登场
据CNMO了解,华为Pura X于2025年3月发布,内屏采用16:10阔型折叠屏设计,显著提升了视频观看体验与文档阅读效率。 华为PuraX Max不仅拥有双面阔型、内外沉浸的阔感体验,而且还拥有软硬件…

2026-04-22