智能日报
业界资讯 智能手机 电脑硬件 平板电脑 智能手表 智能家电 耳机音频 笔记本 热点资讯

蚂蚁百灵大模型Ling-2.6-flash发布:技术优化提效 免费API助力开发者体验

2026-04-23来源:快讯编辑:瑞雪

蚂蚁集团旗下百灵大模型近日正式发布Instruct模型Ling-2.6-flash,该模型总参数量达104B,激活参数为7.4B。这款新模型在技术路径选择上突破传统框架,通过优化推理效率、Token使用效率及Agent场景适配性,构建起差异化的技术优势。其核心架构创新与场景化设计,使其在同类模型中展现出显著竞争力。

技术团队在架构设计上采用混合线性计算模式,通过底层计算单元的重组优化,使模型在4卡H20硬件环境下实现340 tokens/s的推理速度,Prefill吞吐量达到Nemotron-3-Super的2.2倍。这种设计突破了单纯依赖模型规模提升性能的路径,在保持智能水平的同时,将硬件资源利用率提升至新高度。在Token效率方面,研发团队通过动态输出校准机制,使模型在Artificial Analysis评测中仅消耗15M tokens即达成目标,用量仅为同类模型的十分之一。

针对企业级应用需求,模型特别强化了Agent场景能力。通过优化工具调用接口、多步骤任务拆解算法及执行链路容错机制,Ling-2.6-flash在BFCL-V4、TAU2-bench等权威评测中,与参数规模更大的模型展开正面竞争,仍取得领先或持平的优异成绩。特别是在复杂任务执行环节,其表现已达到同尺寸模型的行业标杆水平。

为降低开发者使用门槛,百灵大模型同步推出双重接入方案。即日起在OpenRouter平台及官方渠道提供为期一周的免费API调用服务,后续采用阶梯计价模式:国际版输入0.1美元/百万tokens,输出0.3美元/百万tokens;国内版输入0.6元/百万tokens,输出1.8元/百万tokens,并保留每日50万tokens的永久免费额度。缓存命中场景下,国际版按20%比例收取0.02美元/百万tokens的费用。

开源计划方面,技术团队透露BF16、FP8、INT4等量化版本将于近期陆续开放下载。这些版本在保持核心性能的同时,将硬件适配门槛降低60%以上,特别适合边缘计算设备部署。此次开源策略覆盖从研发到落地的全链条需求,为不同规模的企业提供灵活的技术选择空间。

华为Pura90系列逆势登场:加量降价,影像突破引领手机市场新潮流
华为全新发布Pura90系列,在内存涨价数倍、各大手机厂商纷纷上调售价数百元的当下,华为直接做到加量不加价,Pura90进阶版和顶配版更是降价500元到2000元,这份诚意瞬间点燃全场! 更值得期待的是,P…

2026-04-23

OpenAI意外“剧透”:GPT-5.5等多款前沿AI模型现身Codex CLI终端
IT之家 4 月 22 日消息,OpenAI 今天(4 月 22 日)发布 ChatGPT Images 2.0 生图工具外,其偷跑的GPT-5.5 模型迅速成为网友热议焦点。根据部分网友反馈,在 Code…

2026-04-23