智能日报
业界资讯 智能手机 电脑硬件 平板电脑 智能手表 智能家电 耳机音频 笔记本 热点资讯

DeepSeek联合北大发布DSpark框架:突破推理瓶颈 速度提升最高达85%

2026-06-28来源:互联网编辑:瑞雪

DeepSeek团队与北京大学联合攻关,在提升大语言模型推理效率领域取得重大突破。研究团队提出的DSpark技术框架,通过创新性的解码机制,成功破解了高并发场景下模型响应速度与生成质量难以兼顾的行业难题。实测数据显示,该技术使单用户文本生成速度较现有主流方案提升最高达85%,相关成果已发表于最新研究论文。

传统自回归模型在生成文本时,每个新token的产出都需要完整的前向计算过程,这种串行工作模式导致推理延迟随输出长度线性增加。特别是在实时对话等交互场景中,过长的响应时间不仅损害用户体验,更造成GPU算力的闲置浪费。研究团队指出,现有推测解码技术虽尝试通过草稿模型加速,但存在明显缺陷:串行草稿模型生成延迟随候选长度攀升,并行草稿模型则因缺乏token间依赖关系导致大量无效计算。

DSpark框架的核心创新在于构建了"并行生成+顺序校验"的混合架构。其半自回归生成机制在并行生成主干上嵌入轻量级顺序模块,该模块通过两种实现方式——马尔可夫头与RNN头,动态注入前缀依赖信息。实验表明,仅需两层Transformer结构的DSpark模型,在候选token接受长度指标上已超越五层结构的DFlash模型。这种设计既保持了并行生成的高效性,又通过顺序校验确保了生成质量。

针对传统验证机制算力浪费的问题,研究团队开发了置信度调度验证系统。该系统通过硬件感知前缀调度器,实时评估每个请求的成功概率与系统负载,动态调整验证长度。具体而言,模型在每个候选位置输出置信度分数,调度器据此为不同请求分配差异化算力资源,优先处理预期回报高的token。在线上系统测试中,该机制使推理速度提升60%-85%,同时将高并发场景下的吞吐损耗控制在合理范围。

目前,DSpark技术已深度集成至DeepSeek-V4系列模型,在真实线上流量中验证了其有效性。研究团队同步开源了模型检查点与训练框架DeepSpec,该代码库包含Eagle3、DFlash和DSpark等推测解码训练模块,为学术界和产业界提供了完整的技术解决方案。值得注意的是,DeepSeek创始人梁文锋作为核心成员参与了该项研究,其技术积累为项目突破提供了重要支撑。

览邦Watch Ultra深度评测:多场景适配的智能手表新标杆
在智能穿戴设备市场蓬勃发展的当下,智能手表已不再仅仅是看时间的工具,它承载着独立通信、健康监测、娱乐等诸多功能。 综上所述,览邦Watch Ultra在外观设计、核心功能、性能配置、续航能力等方面都有着出色的…

2026-06-28

WPS回应C盘占用难题:新版本将增自定义安装与存储管理 助用户自主管理空间
WPS表示,缓存与备份默认存放在C盘、占用情况不够直观,确实给部分高频用户造成了困扰,此次优化的核心逻辑是"安装有选择、使用可管理",让用户从安装到使用的每个环节中,都能清楚了解本地占用了多少、哪些可以清理…

2026-06-27

vivo X Fold6重磅登场:性能影像续航全面升级,7999元起售引关注
在充电和续航上,vivo X Fold6这款智能手机的电池容量为7000mAh,采用双电池并联设计,首发第五代硅负极技术搭配第三代半固态技术,并且,这款折叠屏手机还支持80W有线快充和40W无线快充,包装内…

2026-06-27

苹果Vision Pro及智能眼镜项目负责人保罗·米德下周离职 加盟OpenAI硬件部门
米德将于下周离开苹果并加入 OpenAI 硬件部门,参与 AI 设备研发工作。现任 Vision Pro 与智能眼镜产品设计负责人弗莱彻 ·罗斯科夫(IT之家注:Fletcher Rothkopf)将接手…

2026-06-27

OpenAI再升级默认模型:不拼智商拼“懂你”,ChatGPT要成生活好帮手?
【新智元导读】人人都等下一个能力跃迁,OpenAI却把数亿人天天用的那个默认模型换了新版,不靠跑分,主打一个更懂你。这个设计思路很周到,但有个细节OpenAI 自己也认了:记忆来源,并不会展示塑造一条答案…

2026-06-27

苹果Mac、iPad已涨价,iPhone为何按兵不动?背后藏着这些考量
这轮涨价的核心原因,并不是苹果突然想多赚钱,而是AI产业快速发展带动内存和存储芯片价格持续上涨,苹果官方也表示,零部件成本上涨已经给产品带来较大压力。 Mac和iPad率先涨价,本质上是成本压力已经传导到了…

2026-06-27