智能日报
业界资讯 智能手机 电脑硬件 平板电脑 智能手表 智能家电 耳机音频 笔记本 热点资讯

MIT联合英伟达推TLT技术,推理大模型训练效率大幅跃升

2026-02-28来源:快讯编辑:瑞雪

麻省理工学院(MIT)携手英伟达、苏黎世联邦理工学院等机构,共同推出了一项名为“驯服长尾”(TLT)的创新技术,旨在显著提升推理大语言模型(LLM)的训练效率。这一突破性成果,为人工智能领域的高效训练提供了新的解决方案。

推理大语言模型在解决复杂问题时展现出强大的能力,通过拆解步骤逐步推导答案。然而,在强化学习(RL)的训练过程中,这类模型对算力和能耗的需求极为庞大。研究团队深入分析后发现,在训练过程中,生成多个备选答案的“推演”阶段占据了总训练时间的85%。由于不同处理器处理任务的速度不同,完成较快的处理器往往需要等待其他处理器处理长文本任务,导致大量时间被浪费,形成了严重的效率瓶颈。

为了解决这一问题,MIT的研究人员与合作伙伴共同提出了“驯服长尾(TLT)”自适应解决方案。该方案的核心在于引入“投机解码”技术,即利用一个较小的“草稿模型”快速预测大模型的未来输出,再由大模型对这些预测进行批量验证。这种方式避免了逐个顺序生成输出的传统模式,从而大幅加快了处理速度。

在传统的投机解码方法中,草稿模型通常只训练一次并保持静态。然而,在强化学习过程中,主模型需要更新数千次,静态草稿模型很快就会失效,无法与主模型保持同步。为了克服这一挑战,TLT系统引入了“自适应草稿训练器”。当部分处理器完成短查询任务后进入闲置状态时,系统会立即调度它们实时训练草稿模型,确保草稿模型始终与目标大模型保持高度同步。

TLT系统还配备了“自适应推演引擎”,能够根据工作负载特征自动调整解码策略,确保在不增加额外算力开销的情况下,实现草稿模型与目标大模型的高效协同。这一创新设计使得训练过程更加灵活和高效。

基于真实世界数据集的测试结果显示,TLT技术在保持模型准确率完全无损的前提下,将多个推理大语言模型的训练速度提升了70%至210%。这一成果不仅显著缩短了训练时间,还降低了能耗和成本,为人工智能的大规模应用提供了有力支持。

值得一提的是,训练过程中得到的轻量级草稿模型还可以作为副产品直接用于后期的高效部署。这一特性进一步提升了TLT技术的实用价值,为人工智能模型的优化和部署提供了新的思路。研究团队计划将该技术融入更多训练与推理框架中,以进一步降低AI开发成本并提升能源利用率。

苹果安卓用户必看!3款实用提醒工具深度测评,帮你找到最佳选择
不管你是安卓换苹果,还是手机换平板,登录同一账号,所有提醒事项、笔记内容秒同步,内容云端备份加以保障,误删也能通过时间轴一键找回,安全感拉满!敬业签凭借全平台同步、强大的提醒功能和实用的附加功能,成为更优秀选…

2026-02-28

石头科技2025年营收大增55.85%达186.16亿 净利润下滑31.19%仍积极布局未来
来源:证券时报e公司 人民财讯2月27日电,石头科技(688169)2月27日发布业绩快报,2025年实现营业总收入186.16亿元,同比增长55.85%;归母净利润13.6亿元,同比下降31.19%;基本每…

2026-02-28

MWC 2026将至,vivo X300 Ultra携双2亿全大底影像登场,能否登顶影像王座?
继荣耀、中兴、传音之后,国产手机巨头vivo官宣,将在MWC 2026上带来年度机皇:vivo X300 Ultra。这款镜头将以影像套装的形式出现,装上之后,让手机瞬间化身堪比单反的远距离摄影能力。 此…

2026-02-28

华为Mate 80系列多节点销量碾压Mate 70,全周期或冲1200万台新高峰
数据显示,华为Mate 80系列自2025年11月28日开售以来,在预售、首周、首月及上市后92天等各个关键时间节点,销量均全面超越前代Mate70系列。 2026年2月8日(92天):累计销量311.05…

2026-02-28

雷军直播揭秘:小米5年前布局自研电池包,SU7安全升级亮点多
IT之家 2 月 27 日消息,今天晚间,小米创办人,董事长兼 CEO雷军与多位小米专家在小米汽车工厂直播,这是春节假期后雷军的第一场直播。“5 年前我们造车的时候,我们就下决心一定要把电池做好,所以我们组…

2026-02-28

AI视频春节“出圈”:县城老人用它哄娃社交,解锁创作新技能
从我妈用奥特曼哄孙子,到大姨的家庭群社交,这些案例没有任何一个发生在一线城市,没有任何一个使用者能解释“大模型”的原理,但他们共同构成了AI视频最真实的用户画像。 AI视频可能正在经历同样的“预期修正”,它…

2026-02-28