智能日报
业界资讯 智能手机 电脑硬件 平板电脑 智能手表 智能家电 耳机音频 笔记本 热点资讯

AMD集成DeepSeek-V3模型至MI300X GPU,AI推理能力再升级!

2025-01-25来源:ITBEAR编辑:瑞雪

AMD近期宣布了一项重大进展,成功将经过优化的DeepSeek-V3模型集成到其Instinct MI300X GPU上。这一模型通过SGLang进行了强化,专为AI推理设计,旨在提升性能。

事实上,早在去年12月26日,AMD已在Github上发布了支持DeepSeek-V3模型的SGLang v0.4.1版本,为这一集成奠定了基础。

据AMD透露,DeepSeek V3是目前性能最强的开源大型语言模型(LLM),其表现甚至超越了GPT-4。这一成就得益于SGLang与DeepSeek团队的紧密合作,使得DeepSeek V3在发布首日便能在英伟达和AMD的GPU上顺利运行。AMD还特别感谢了美团搜索与推荐算法平台团队以及DataCrunch提供的GPU资源支持。

DeepSeek-V3模型采用了混合专家(MoE)架构,总参数量高达6710亿,每个token激活370亿参数,展现出强大的处理能力。为了实现高效推理和高经济效益的训练,该模型引入了多头潜在注意力(MLA)和DeepSeekMoE架构。

DeepSeek-V3开创性地采用了一种无辅助损失的负载平衡策略,并设置了多标记预测训练目标,进一步提升了模型的性能。这使得开发人员能够利用高级模型,同时处理文本和视觉数据,从而广泛获取先进功能,并享受更多功能带来的便利。

AMD Instinct GPU加速器与DeepSeek-V3的结合,为AI模型的运行带来了显著改善,特别是在推理方面。AMD表示,ROCm中广泛的FP8支持有助于解决内存瓶颈和高延迟等关键问题。这使得平台能够在相同的硬件限制下处理更大的模型或批处理,从而提高了训练和推理过程的效率。

FP8降低精度计算减少了数据传输和计算中的延迟。AMD ROCm扩展了其对FP8的支持,从框架到库,全面提升了性能和效率。这一技术革新为AI模型的高效运行提供了有力保障。

iPhone 17系列中国市场激活量破千万 性能升级受消费者青睐
【环球网科技综合报道】11月14日消息,据科技博主@数码闲聊站披露,苹果 iPhone 17 系列本周在中国市场的激活量已突破1000万台,创下该系列上市以来的阶段性销量新高,印证了中国消费者对其产品升级的认…

2025-11-15

中国“天衍-287”超导量子计算机搭建完成 搭载同款芯片将全球开放应用
感谢IT之家网友 的线索投递! 11 月 14 日消息,据《科创板日报》11 月 13日报道,从中国电信量子研究院获悉,搭载“祖冲之三号”同款芯片的超导量子计算机“天衍-287”已完成搭建。 该量子计算系…

2025-11-14

四名MIT辍学00后,两年打造AI编程神器,估值冲300亿成资本新宠
两年前,在完成种子轮融资后,创始人曾写了这样的期待—— Cursor的诞生,推动了「氛围编程」(vibe coding)在全球兴起。 他还在创纪录的时间内,完成了一份手写编程测试,给早期Facebook投资…

2025-11-14

iPhone 17系列发售不到俩月,中国市场激活量破1000W,双十一销量也亮眼
11月14日,数码博主“数码闲聊站”发文透露iPhone17系列于本周完成中国市场激活1000W+。 iPhone17系列9月19日正式发售,如今距发售不到两个月。 该博主此前曾透露,截至11月2日,iPh…

2025-11-14

荣耀500 Pro配置亮点全揭秘:骁龙8至尊版+2亿主摄+8000mAh长续航
【CNMO科技消息】11月14日,有数码博主曝光了荣耀500Pro的核心参数。CNMO注意到,新机将搭载骁龙8至尊版移动平台,电池容量达到8000mAh,主打2亿像素大底主摄。 除了上述核心亮点外,荣耀50…

2025-11-14

苹果iPhone 17系列发售不到俩月 中国市场激活量或破千万
苹果 iPhone 17 系列于今年 9 月 19 日正式发售,如今还不到两个月。 该博主曾透露,截至 11 月 2 日,苹果 iPhone17 系列国内激活销量超 825 万。具体数据如下: iPho…

2025-11-14

OPPO Reno15 Pro 11月17日登场:天玑8450+2亿主摄,屏幕续航全面升级
最新泄露的信息显示,这款新机将在屏幕、影像和续航等多个维度带来显著升级。 爆料数据显示,OPPO Reno15 Pro将搭载一块6.78英寸1.5K分辨率直屏,采用全球最窄的1.15mm四等边设计,配合金属中…

2025-11-13

华为专利收入45亿!超27亿设备获5G授权
在全球科技竞争日益激烈的背景下,华为凭借持续的高强度研发投入,在专利领域取得了令人瞩目的成就。这家中国科技巨头不仅在国内技术积累和专利创新方面遥遥领先,更在国际舞台上与苹果、三星等国际知名企业同台竞技,甚至通过专利授权获得了可观的收入。

2025-11-13

DRAM内存颗粒价格反超同容量模组 未来短期内现货市场模组价或快速上升
IT之家 11 月 12 日消息,TrendForce 集邦咨询今日表示,在极度罕见的市场环境下,DRAM 内存颗粒 (Die)的报价已经超越相同容量的内存条(模组,Module)报价,且价差巨大。 过去七…

2025-11-13