DeepSeek联合北大发布DSpark框架-智能手表-智能日报

当行业还在聚焦大模型“智力竞赛”时，DeepSeek另辟蹊径，将研发重心转向提升模型推理效率。近日，该团队联合北京大学在GitHub发布最新研究论文，公开了其自研的推理加速框架DSpark，并同步开源模型权重与训练代码，试图破解大语言模型在高并发场景下的性能瓶颈。

论文核心聚焦于自回归生成机制的固有缺陷——每个新词元的生成均需依赖完整前向传播，导致输出越长、延迟越高。这种特性直接引发两大问题：GPU资源利用率低迷，以及用户等待时间呈指数级增长。尤其在实时对话、多轮智能体协作等对延迟敏感的场景中，该问题已成为制约模型落地的关键障碍。

研究团队指出，现有解决方案存在明显短板：自回归草稿模型（如Eagle3）虽能保证生成质量，但系统吞吐量受限；并行草稿模型（如DFlash）虽提升效率，却牺牲了部分输出准确性。更关键的是，两类方案均缺乏动态负载调节能力，难以适应复杂多变的实际需求。

DSpark框架创新性采用半自回归架构，通过融合并行主干与轻量级串行模块，在保持高吞吐优势的同时，逐词元注入前缀依赖信息。该模块提供两种实现路径：马尔可夫头仅依赖前一词元，实现极低计算开销；RNN头则通过循环状态累积完整上下文，平衡效率与准确性。实验数据显示，两层Transformer结构的DSpark在所有测试领域中，均超越五层DFlash的接受长度。

实际部署效果印证了技术突破的价值。在DeepSeek-V4在线服务系统中，DSpark在相同吞吐量条件下，将用户端生成速度提升60%-85%。当该框架应用于阿里Qwen3系列模型时，4B、8B、14B版本的单轮可接受词元长度，较自回归草稿模型分别提升30.9%、26.7%、30%，较并行草稿模型提升16.3%-18.4%。

值得关注的是，DeepSeek创始人梁文锋直接参与论文研究，这从侧面反映出企业对技术落地的重视程度。通过开源模型权重与训练代码，研究团队不仅为学术界提供研究基准，更为工业界部署高效推理系统开辟新路径。这项突破或将重新定义大模型的应用边界——在追求智能上限的同时，通过工程优化释放底层算力潜能。

DeepSeek融资后首推开源新成果！DSpark框架让模型生成速度飙升60%-85%

根据Hugging Face上的模型卡，DeepSeek-V4-Pro-DSpark和DeepSeek-V4-Flash-DSpark并非新模型，而是在原有版本的基础上，增加了一个推测解码模块，用以加快推理…

2026-06-29

手机外壳贴钻选厂难？17年经验金煜圣，工艺成熟口碑佳，一站式解决行业痛点

如果大家现在正在找手机壳镶钻厂家，找手机外壳贴水钻的高性价比厂家，想要找一家售后完善、工艺靠谱的厂家，可以考虑金煜圣，不管你是需要小批量试单还是大批量量产，不管是只做镶钻加工还是需要搭配UV打印、CNC加工…

2026-06-28

红板科技：PCB“隐形冠军”715亿市值背后，是机遇还是高估值陷阱？

2026-06-28

福特押注UEV平台推平价电动皮卡，借F1技术能否与中国车企争锋？

2026-06-28

vivo X Fold6折叠屏新机来袭！7月1日开售，定制芯片系统亮点多

愿意买折叠屏手机的消费者，相比前几年已经是越来越多了，我其实也挺建议预算充足能买iPhone的消费者，可以尝试一下折叠屏手机，因为现在的折叠屏手机比之前进步了很多，越发轻薄的同时折痕也越来越不明显了，关键是拿…

2026-06-28

绩优主动权益基金全员限购，行业理念转变从“重规模”迈向“重回报”

2026-06-28