智能日报
业界资讯 智能手机 电脑硬件 平板电脑 智能手表 智能家电 耳机音频 笔记本 游戏机

DeepSeek开源V3.2-Exp实验版模型 架构创新或成国产AI发展新动力

2025-09-30来源:快讯编辑:瑞雪

DeepSeek近日宣布开源其最新实验模型DeepSeek-V3.2-Exp,首次引入DeepSeek Sparse Attention(DSA)稀疏注意力机制,在保持模型输出质量的同时显著提升长文本处理效率。这一技术突破被定义为"迈向新一代架构的关键中间步骤",标志着大模型优化方向的重要转变。

据技术报告披露,DSA机制通过"闪电索引器"和动态token选择技术,将传统注意力计算的复杂度从二次方降至近似线性。在H800 GPU实测中,该模型使长序列推理成本降低40%以上,同时保持与前代模型相当的任务完成质量。这种效率提升直接反映在API定价策略上——输出100万token的费用降至3元,仅为V3.1系列的四分之一。

产业界的响应速度超出预期。华为云在模型发布后6小时内完成部署,采用CloudMatrix 384超节点提供服务;寒武纪通过Triton算子开发实现4分钟极速适配,开源vLLM-MLU推理引擎;海光信息宣布其DCU处理器完成Day 0级优化,确保算力"零等待"部署。截至发稿时,已有华为、寒武纪、海光等12家芯片厂商完成适配,覆盖从云端到边缘的多元计算场景。

开发者社区的实测反馈呈现两极分化。在编程任务测试中,V3.2-Exp生成的代码量较前代减少35%,但某动画生成案例出现逻辑错误,显示模型在复杂场景下的稳定性仍需优化。信息检索任务测试表明,新模型响应速度提升28%,但推荐结果的精准度下降12%,特别是在需要多条件约束的场景中表现明显。

技术团队在GitHub披露的细节显示,该模型采用"继续预训练+混合强化学习"的双阶段优化策略。预训练阶段通过稠密模式初始化索引器参数,再逐步引入稀疏选择机制;后训练阶段结合领域专家蒸馏和统一强化学习框架,在保持模型通用性的同时强化特定领域能力。这种训练范式使模型在数学推理、代码生成等任务上的表现与前代持平,但工作记忆容量指标下降15%。

开源社区的热烈讨论揭示出技术演进的新方向。HuggingFace平台数据显示,模型发布首日即获得超过2.3万次下载,社区贡献者已提交47个优化补丁。值得注意的是,某开发者通过修改索引器阈值参数,成功将推理延迟再降低18%,这为后续技术迭代提供了重要参考。

当前,DeepSeek-V3.2-Exp已在App、网页端及小程序全面上线,同时保留V3.1-Terminus的API接口供对比测试。技术团队强调,作为实验性版本,该模型需要在真实业务场景中接受更严苛的考验,特别是在高并发、长序列处理等极端条件下验证其稳定性。随着更多企业和研究机构参与协同优化,这项突破性技术有望在年内实现产业化落地。

上市72小时即交付,全新问界M7交付现场竟然她们也来了!
文 / 小林美编 / 顾青青出品 / 电动新物种9月26日的问界M7交付现场,来了一群特殊的客人。中国国家艺术体操队的姑娘们穿着训练服,好奇地打量着眼前这台刚刚上市就火爆全网的新车。她们伸手触摸车身线条,就像在赛场

2025-09-30

特斯拉苹果或引入玻璃基板,为AI芯片与数据中心性能提升“加码”
IT之家 9 月 29 日消息,据韩媒 Etnews 今天报道,特斯拉和苹果正探索引入玻璃基板,以提升半导体芯片和数据中心的性能。 业内人士透露,这两家公司近期分别会见了研发玻璃基板的制造商,听取相关技术介绍…

2025-09-30

商汤Seko“创编一体”新模式,10万创作者借力开启AI短片创作新篇
商汤Seko行业首发“创编一体”模式,以“真·Agent”重构视频生产的智能工作流,一站式解决“如何高效制作一个完整、连贯、专业的AI视频”的需求。 Seko不仅让创意保质输出,也能让成本骤降,视频团队、自…

2025-09-29

贾跃亭公布FX品牌第二款车型FX 4产品计划 目标AIEV时代下RAV4颠覆者
9月29日,Faraday Future(FF)创始人、联席CEO贾跃亭公布了FX品牌第二款车型FX 4产品计划,目标是打造AIEV时代下RAV4的颠覆者;同时宣布在10月28日举行FX Super One中东Final Launch发布会,并计划11月率先在中东市场

2025-09-29

今年11.11购物节定档10月9日开启!现货开卖、官方直降成主流
今年11.11购物节,正式定档10月9日开启!9月29日,京东宣布,今年京东11.11将于10月9日晚8点现货开卖。在汇集海量热销爆款好物的同时,将提供“官方直降 低至1折”的优惠福利,为消费者带来又好又便宜的消费体验!京东

2025-09-29

英特尔或明年推出Jaguar Shores与“低功耗”AI GPU,低功耗成新突破方向
其采用了Intel18A工艺制造,包括RibbonFET和背面供电技术等,另外还将采用SK海力士的HBM4。低功耗似乎成为了英特尔瞄准的细分市场,或许是AI设备市场的一个突破口,类似于高通提供的Cloud …

2025-09-28

一加15全渠道预约开启!骁龙8至尊版+ColorOS 16,游戏续航外观全面升级
官方消息显示,一加15的原色沙丘配色历经多道复杂工序精心淬炼,拥有比钛金属更轻盈、更耐磨,散热更出色的金属中框和相机Deco。这样的工艺和材质,不仅提升了手机的耐用性和散热性能,还让手机在外观上更具质感和高…

2025-09-28

智能网联科技参观活动闭幕,产业融合与创新成果引关注
9月24日,第五届沈阳智能网联汽车大会智能网联科技参观活动在沈阳智能网联大厦顺利落幕。作为大会的重要组成部分,本次参观活动历时两天,集中呈现了智能网联汽车领域的最新技术成果与创新应用,成功搭建了产业交流

2025-09-28

声启未来新章 BANG & OLUFSEN 铂傲 推出全新Beo grace耳机
近日,全球奢华生活方式视听品牌 BangOlufsen 铂傲(以下简称 BO)宣布推出全新 Beo Grace 无线耳机。Beo Grace 将纤薄铝材机身与卓越音质表现融为一体,尽释 BO 坚持在声学创新、恒久设计与精湛工艺之间的充分融合。B

2025-09-27

第五代骁龙8至尊版来袭:性能AI双飞跃,多品牌旗舰手机将搭载
据悉,在去年的骁龙8至尊版中配备了定制高通Oryon CPU,在Adreno GPU、Hexagon NPU、Spectra ISP和骁龙X系列调制解调器之外,补齐了整个平台内部集成定制核心的最后一块拼图。…

2025-09-26