智能日报
业界资讯 智能手机 电脑硬件 平板电脑 智能手表 智能家电 耳机音频 笔记本 热点资讯

英伟达Blackwell平台适配DeepSeek-V4系列模型 助力开发者高效部署与推理

2026-04-25来源:互联网编辑:瑞雪

英伟达近日宣布,其NVIDIA Blackwell平台已完成对DeepSeek-V4-Pro与DeepSeek-V4-Flash两款大模型的适配工作。开发者可通过NVIDIA NIM微服务直接下载部署,或基于SGLang、vLLM框架实现定制化推理,为AI应用开发提供更灵活的技术路径。

在模型参数配置上,DeepSeek-V4-Pro以1.6万亿总参数量与490亿激活参数的组合,专注于复杂推理场景;而DeepSeek-V4-Flash则采用2840亿总参数量与130亿激活参数的轻量化设计,主打高速响应需求。两款模型均支持百万级Token上下文窗口与最高38.4万Token的输出能力,可覆盖长文档分析、代码生成等核心应用场景,并采用MIT开源协议保障技术共享。

性能测试显示,DeepSeek-V4-Pro在NVIDIA GB200 NVL72集群上实现每用户每秒150个token的基准性能,通过vLLM框架的Day 0优化方案,可在Blackwell B300架构上快速完成部署。随着Dynamo编译器、NVFP4量化技术及CUDA内核的持续优化,模型推理效率有望进一步提升。

在部署生态构建方面,SGLang框架提供低延迟、均衡负载及最大吞吐量三种优化模式,满足不同场景的性能需求;vLLM框架则支持跨100个以上GPU节点的分布式推理,并集成工具调用与推测解码功能,为大规模AI服务提供技术支撑。这种多框架兼容的设计,显著降低了开发者将模型落地至生产环境的门槛。

MacBook Ultra或2027年初亮相 六大技术革新引领笔电新潮流
据了解,MacBook Ultra预计将搭载六项关键性的技术创新与硬件配置。相关供应链信息透露,MacBook Ultra在升级显示面板材质的同时,还将打破常规加入触控功能。在核心性能层面,该设备大概率将搭…

2026-04-25

一加Buds Ace 3耳机4月28日登场,FPS专属音效+超低延迟成亮点
IT之家 4 月 25 日消息,一加今日官宣一加 Buds Ace 3 耳机将于 4 月 28 日 19:00发布,提供星际黑、钛空银两款配色。 预热海报显示,这款新品配备FPS 游戏专属音效,脚步声清晰可…

2026-04-25

时隔四年华丽回归!华为WATCH Buds2二合一设计,健康监测与便捷体验双在线
华为WATCH Buds2内置410mAH电池,整机综合续航时间为3天,支持无线充电功能。 综上所述,华为WATCH Buds2适合出门不喜欢带东西,但是在一些场景下对蓝牙耳机有刚需的小伙伴,目前采用这种组合…

2026-04-25

DeepSeek-V4官宣上线:百万字上下文加持,运行华为昇腾芯片再突破
据DeepSeek微信公众号公布消息,DeepSeek-V4拥有百万字超长上下文,在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。DeepSeek此次并未给英伟达或AMD提供提前优化适配的…

2026-04-25

DeepSeek-V4开源登场 国产算力芯片与大模型协同开启发展新篇
【CNMO科技消息】DeepSeek官方今日宣布,其全新系列模型DeepSeek-V4的预览版本正式上线并同步开源。 值得注意的是,今年4月初的公开报道显示,DeepSeek-V4已实现与华为昇腾等国产芯片的…

2026-04-25