智能日报
业界资讯 智能手机 电脑硬件 平板电脑 智能手表 智能家电 耳机音频 笔记本 热点资讯

Gartner:Token成本降不抵需,前沿智能普及仍面临成本挑战

2026-04-16来源:互联网编辑:瑞雪

据市场研究机构Gartner最新预测,到2030年,生成式人工智能领域中1万亿参数规模的大语言模型推理成本将较2025年下降超过90%。这一趋势主要得益于半导体技术突破、基础设施效率优化以及模型架构创新等多重因素的共同作用。其中专用推理芯片的广泛应用和边缘计算设备的普及被视为关键推动力。

在技术演进路径上,Gartner观察到芯片利用率提升和模型设计优化正在形成协同效应。研究显示,到2030年新开发的大语言模型在成本效益方面将达到2022年早期模型的100倍。这种指数级提升不仅体现在参数规模扩张上,更反映在单位算力消耗的显著降低。研究总监Will Sommer指出,半导体制造工艺的突破与算法效率的改进正在重塑AI基础设施的经济模型。

但成本下降的传导机制存在明显阻滞。尽管基础计算单元(AI Token)的单价将持续走低,但企业用户实际支付的费用未必同步下降。当前技术条件下,执行复杂任务所需的Token消耗量正呈现爆发式增长。以代理式AI模型为例,其单次任务处理的Token需求量是传统聊天机器人的5-30倍,这种差异在多模态交互场景中可能进一步扩大。

这种供需关系的动态变化正在引发新的经济挑战。虽然单位Token成本持续走低,但整体推理成本因需求激增反而可能上升。Gartner特别警示,某些企业可能陷入"伪优化"陷阱——用低廉的Token价格掩盖系统架构缺陷,这种做法在代理式AI规模化部署时将暴露严重问题。Sommer强调,高级推理任务所需的计算资源始终具有稀缺性,单纯依赖成本下降无法解决根本问题。

面对这种技术经济范式转变,企业需要重构AI部署策略。Gartner建议建立分层模型架构:将高频标准化任务分配给轻量化领域专用模型,这类模型经过针对性优化后,在特定场景的性能可超越通用大模型,且成本降低80%以上。同时,前沿大模型应严格限定在高价值复杂任务领域,通过精准的资源管控避免算力浪费。这种异构模型协同工作模式,正在成为下一代AI平台的核心竞争力。

华为一季度国内出货量TOP10机型揭晓 Mate 80系列表现亮眼成主力
从机型分布看,榜单以Mate与nova、Pura三条产品线为主,并覆盖畅享系列。前十中Mate系列占据4席,nova系列2席,Pura系列2席,畅享系列2席,显示华为在旗舰与中端价位段均有多款机型进入出货量…

2026-04-16

苹果低价笔记本MacBook Neo热销,A18 Pro芯片告急未来或涨价停产
据相关报道显示,MacBook Neo一经推出便彻底引爆市场,首批现货已经售罄,A18 Pro芯片库存也已消耗殆尽。 这意味着目前这种高性价比策略可能只是短期行为,如果苹果无法在不增加成本的前提下解决芯片供…

2026-04-16

内存成本上涨 PC厂商纷纷提价 苹果或借机扩大份额 十年Mac用户或增一倍
外媒称,整个科技行业都受到了内存成本大幅上涨的冲击。 外媒表示,目前还不清楚这种情况能持续多久,因为苹果公司历来都将毛利率目标设定在 37%到 38% 左右,而且似乎非常不愿意接受这一令人羡慕的利润率受到…

2026-04-16

中科曙光6万卡AI4S集群投入使用:国产算力新突破赋能多领域科研
4月14日,在河南郑州国家超算互联网核心节点,中科曙光正式发布了6万卡AI4S(AI forScience)计算集群并宣布投入使用,这是目前国内规模最大的AI4S计算集群,没有之一。 算力层面,6万卡集群的…

2026-04-16

谷歌Android Canary 2604更新:界面交互优化,清空通知提示更直观
谷歌明确表示 Android Canary并不稳定,强烈建议用户不要在主力设备上安装该版本,而且为了加速新特性验证流程,本月发布时间还较上月(2026 年 3 月)提前。如需停止接收测试版更新,必须刷入非…

2026-04-16

华为Pura X Max横向阔折叠新机将至 携AI眼动翻页等多功能4月20日发布
IT之家 4 月 15 日消息,华为终端 BG 首席执行官何刚今日再次预告了 Pura X Max 横向阔折叠新机。据介绍,华为 Pura XMax 将支持 AI 眼动翻页、横屏双翻页等功能,同时阅读软件还…

2026-04-16