智能日报
业界资讯 智能手机 电脑硬件 平板电脑 智能手表 智能家电 耳机音频 笔记本 热点资讯

豆包Seeduplex上线:告别机械对话,开启AI语音交互自然流畅新时代

2026-04-09来源:快讯编辑:瑞雪

字节跳动旗下Seed团队近日推出原生全双工语音大模型Seeduplex,并已在豆包App实现全量上线。这项突破性技术标志着语音交互从“回合制问答”向“实时自然对话”的跨越,用户无需等待AI逐句响应,即可体验边听边说、动态交互的流畅对话模式。

在咖啡厅嘈杂环境中测试时,Seeduplex展现出精准抗干扰能力。当用户突然转向服务员点单时,模型不仅未将无关对话误认为指令,还能在环境噪音中保持静默等待,待用户结束点单后无缝衔接原有话题。这种能力源于模型对原始音频信号的直接解析,通过声学特征提取区分目标语音与环境声,而非传统语音助手依赖的“降噪-转写-理解”流水线模式。

面对用户故意卡壳的英文面试场景,模型通过动态判停技术展现出人性化交互。当测试者连续使用“um”“uh”等填充词时,Seeduplex未像传统系统那样急于抢答,而是结合语义停顿与声学特征,准确判断用户处于思考状态。这种基于语音节奏、呼吸模式与语义完整性的综合判断机制,使模型抢话比例较前代系统降低40%,对话流畅度评分提升12%。

在飞花令极限测试中,模型展现出惊人的响应速度与上下文记忆能力。当用户连续说出多句带“月”诗句后,Seeduplex几乎同步给出应答,且能识别用户试图重复已用诗句的“套娃”行为并即时提醒。官方数据显示,全双工模式较半双工时延缩短250毫秒,打断响应延迟减少300毫秒,复杂场景下误回复率降低50%。

技术实现层面,Seed团队重构了传统语音交互架构。新系统摒弃ASR(语音识别)、LLM(大语言模型)、TTS(语音合成)的串联模式,构建端到端原生架构,使模型直接学习语音与语义的一体化表达。通过海量语音数据预训练与多任务后训练,系统同步优化对话智能、超低延迟、节奏控制等五项核心能力,并采用投机采样、量化等技术平衡推理性能与成本。

产业观察人士指出,这项技术突破将重塑多个应用场景。在车载领域,系统能在复杂路况与多人对话中稳定识别驾驶员指令;教育场景中,口语陪练可感知学生犹豫状态并调整教学节奏;客服系统则能在多人插话、情绪波动中维持对话连贯性。相较于行业主流语音通话功能,Seeduplex在判停准确率、打断响应稳定性等核心指标上已形成代际优势。

测试数据显示,在模拟真人对话的基准测试中,Seeduplex的响应稳定性甚至超越部分人类对话者。当用户突然打断对话要求记录信息时,模型能立即停止播报并主动询问是否需要重复要点,这种“被打断-收声-等待-继续”的完整闭环,此前仅在真人通话中可见。技术团队透露,未来将持续优化模型对情感语调、微表情等非语言信号的感知能力,推动语音交互向多模态自然交流演进。

戴森HushJet Mini Cool无叶风扇来袭,无叶安全设计,首发价99美元
所有活动部件都被安全地隐藏在内,这一点至关重要,因为和戴森吹风机一样,这款产品是为手持使用而设计的。 HushJet Mini Cool搭载一颗 65000 转 / 分钟的无刷直流电机,可产生最高 55 英…

2026-04-09

三星Galaxy S25 Ultra解锁海洋模式,水下摄影色彩校正与清晰度双提升
IT之家注:Ocean Mode 最初于 2025 年初随 Galaxy S24 Ultra亮相,专为协助海洋学家进行珊瑚礁修复研究而开发,主要解决水下摄影面临的色彩偏差与清晰度难题。Galaxy S25…

2026-04-09

谷歌AlphaEvolve助力Substrate:X射线光刻计算提速降本,12nm技术达新高度
IT之家 4 月 9 日消息,Substrate 是一家以 X 射线为光源的光刻技术初创企业,在当地时间本月 7 日的博客中,这家公司表示谷歌DeepMind 的 AlphaEvolve 编程智能体极大程度…

2026-04-09

苹果折叠屏手机或年内亮相 先进玻璃基板推进AI布局 多股跟涨
消息方面,知情人士透露,苹果公司首款折叠屏手机有望在今年晚些时候公司常规iPhone发布期面世,这缓解了对制造方面遇阻的担忧。因相关计划尚未公布而要求匿名的知情人士称,该公司计划在9月与iPhone18 …

2026-04-09