智能日报
业界资讯 智能手机 电脑硬件 平板电脑 智能手表 智能家电 耳机音频 笔记本 热点资讯

美团开源INT8无损量化DeepSeek R1,A100性能提升50%

2025-03-07来源:ITBEAR编辑:瑞雪

近期,美团搜推机器学习团队宣布了一项开源新进展,成功实现了对DeepSeek R1模型的无损INT8精度量化。这一成果在3月4日正式对外公布,标志着美团在深度学习模型优化方面取得了重要突破。

据了解,DeepSeek R1模型原本采用的是FP8数据格式的权重,这一特性使得它对GPU芯片类型有着严格的要求。具体而言,只有英伟达的新型GPU,如Ada和Hopper架构的芯片,才能够支持该模型的部署。而对于其他型号的GPU,如广泛应用的A100,则无法直接运行DeepSeek R1模型。

为了打破这一限制,美团的机器学习团队进行了深入的技术研发,成功实现了对DeepSeek R1模型的INT8精度量化。量化后的模型不仅保持了原有的性能,还在部署上具备了更高的灵活性。目前,该量化代码已经被整合进了开源LLM推理框架SGLang中,而量化后的模型也已经发布到了Hugging Face社区,供广大开发者使用。

据官方测试,在A100 GPU上部署满血版的DeepSeek R1模型,并基于INT8量化后,相比之前采用的BF16格式,吞吐量实现了50%的提升。这一成果不仅提升了模型的运算效率,还为更广泛的应用场景提供了可能。

美团搜推机器学习团队的这一开源成果,无疑为深度学习模型的优化和应用带来了新的思路。通过量化技术,可以在不牺牲模型性能的前提下,提升模型的运算效率和部署灵活性。这对于推动深度学习技术的发展和应用具有重要意义。

美团团队还将继续探索深度学习模型的优化方法,不断提升模型的性能和效率。相信在不久的将来,我们将会看到更多来自美团的开源成果和技术创新。

对于广大开发者而言,这一开源成果无疑是一个福音。通过利用美团提供的量化模型和推理框架,他们可以更加高效地开发和部署深度学习模型,为人工智能技术的发展和应用贡献自己的力量。

同时,我们也期待美团搜推机器学习团队在未来能够带来更多优秀的开源成果和技术创新,为人工智能领域的发展注入新的活力。

石头科技:以技术创新重塑智能清洁体验,引领行业迈向高精度智能化新高度
这种以用户需求为导向的技术创新模式,正在引发行业连锁反应,促使多家头部企业加大在环境感知、人机交互等领域的研发投入,推动整个智能清洁产业链向高精度、高智能化方向升级。石头科技通过构建“基础研究-技术转化-场…

2025-12-31

三星2026年电视将支持谷歌相册,独占新功能带来大屏观影新体验
IT之家 12 月 30 日消息,三星电子昨日宣布计划在 2026 年为其电视产品引入对谷歌相册 (Google Photos)的支持,用户将可在三星电视的大屏幕上重温拍摄的美好回忆。 而在 2026 年下…

2025-12-31

京东方中国首条8.6代AMOLED生产线提前点亮 量产冲刺开启新篇章
这是继该产线提前封顶后,项目建设的又一重大里程碑,标志着京东方在中尺寸 OLED 技术研发、工艺调试与量产准备方面率先取得关键性突破,为后续产品量产交付奠定基础;同时也意味着该项目率先实现从“建设期”到“运…

2025-12-31

iQOO15凭何成为内行首选?性能续航屏幕全优,4000元档全能之选
即使你是追求均衡体验的普通用户,iQOO15在屏幕观感、系统流畅度和日常使用体验上的均衡表现,也值得考虑。内行人的建议很明确:如果你需要一部性能强劲、续航持久、屏幕出色且没有明显短板的手机,iQOO15确…

2025-12-31

孟晚舟新年致辞:2025拼搏奋进,2026战略聚焦以质开启新程
华为2025年业务聚焦5G-A、鸿蒙生态、乾崑智驾及行业数智化等方向取得进展。我们助力运营商建设5G-A网络,为6000万用户提供极速网络联接体验; 在生态伙伴的支持下,鸿蒙生态体验加速从“可用”到“好用…

2025-12-30