智能日报
业界资讯 智能手机 电脑硬件 平板电脑 智能手表 智能家电 耳机音频 笔记本 热点资讯

Soul开源SoulX-FlashTalk:14B模型助力数字人亚秒级生成与全场景应用

2026-05-21来源:天脉网编辑:瑞雪

近日,Soul App旗下的AI团队Soul AI Lab宣布正式开源其自主研发的实时数字人生成模型——SoulX-FlashTalk。这一模型凭借140亿参数的强大算力,在生成速度、画面流畅度以及视频稳定性方面实现了显著突破,为行业提供了可商业化的实时生成式数字人解决方案。该模型的推出,不仅解决了传统数字人技术在实时交互中的延迟问题,还为电商直播、短视频制作、AI教育等多个领域带来了新的可能性。

SoulX-FlashTalk的核心优势在于其超低的生成延迟和高效的画面输出能力。据测试,该模型的首帧视频输出延迟仅为0.87秒,达到了亚秒级水平,同时支持每秒32帧的高帧率输出。这一性能使得数字人在视频通话、直播弹幕互动以及智能客服等场景中能够实现即时响应,彻底消除了传统大模型生成过程中的滞后感。模型搭载的14B超大DiT架构经过深度优化,推理吞吐量远超直播所需的25fps标准,确保了画面的丝滑流畅。

针对数字人长视频生成中常见的面部不一致和画质下降问题,SoulX-FlashTalk引入了独家自纠正双向蒸馏技术。该技术通过多步回溯自纠正机制,实时修正长序列生成中的误差,实现了无感纠错且画质无损。同时,模型保留了双向注意力机制,使得每一帧的生成都能参考过去和未来的上下文信息,从而有效抑制身份漂移,确保数字人在超长直播中的口型、面部细节以及背景保持高度一致。该模型还突破了传统数字人仅面部对口型的局限,支持音频驱动的全身动作生成,能够精准呈现手部细节,动作灵动且身份一致性高达99.22%。

在技术实现上,SoulX-FlashTalk采用了两阶段训练策略以平衡生成质量与速度。第一阶段为延迟感知时空适配,通过动态长宽比分桶微调优化模型性能;第二阶段为自纠正双向蒸馏,利用DMD框架压缩采样步数并移除CFG,同时结合多步回溯自纠正与随机截断策略,高效优化显存使用。团队还打造了全栈加速引擎,通过混合序列并行、算子级优化以及3D VAE并行化等技术,大幅提升了推理速度,最终实现了亚秒级延迟。这一系列技术创新使得SoulX-FlashTalk在保持高效运行的同时,能够生成高质量的数字人视频。

在TalkBench-Short与TalkBench-Long数据集的测试中,SoulX-FlashTalk的表现全面领先行业主流模型。在短视频评测中,其ASE评分达到3.51,IQA评分达到4.79,口型同步Sync-C为1.47;在长视频生成中,Sync-C评分提升至1.61,且长短视频均能稳定维持32fps的高帧率输出。基于这些优异性能,SoulX-FlashTalk可广泛应用于电商7×24小时AI直播、短视频制作、AI教育、NPC交互以及AI客服等场景,有效解决传统数字人直播中画质模糊、口型错位等问题,同时降低运营成本。

值得一提的是,此次开源并非Soul AI Lab的首次尝试。此前,该团队曾开源语音合成模型SoulX-Podcast,并在HuggingFace TTS趋势榜上登顶,GitHub星标数超过3100。此次SoulX-FlashTalk的开源,标志着Soul在AI技术开源领域迈入了新的阶段。未来,Soul AI Lab将继续推进技术开源,与全球开发者共同构建AI+社交的生态系统。

谷歌Android 17“接续流转”功能将至 安卓设备任务切换更便捷高效
谷歌还以谷歌文档和邮箱做了实操演示:其一,在手机打开谷歌文档,切换至平板后可在同一页面、保持原有编辑状态继续编辑;其二,手机端安卓版谷歌邮箱的邮件会话,可无缝流转到大屏设备的网页版邮箱,直接打开同一封邮件对…

2026-05-21

第13届ASC世界大学生超算竞赛落幕,北大清华斩获冠亚军展现中国青年科技实力
IT之家 5 月 20 日消息,据央视新闻报道,第 13 届 ASC世界大学生超级计算机竞赛总决赛今日在江苏省无锡市落下帷幕。本届赛事共吸引全球 25 支高校大学生队伍参与,参赛队伍在量子计算、人工智能等前…

2026-05-21

未来智能新品来袭:智能体耳机落地,开启职场AI Agent全新时代
将AI Agent真正装进耳机,需要跨越三重门槛:一是足够规模的、真实职场场景下的高密度交互数据,用以训练智能体对复杂任务的上下文理解能力;二是长期沉淀的行业用户粘性,让AI能跟随个体工作流持续进化;三是软…

2026-05-21

哈博森黑鹰4号无人机亮相:16km图传搭配4K拍摄 续航达28分钟
IT之家 5 月 21 日消息,哈博森今日宣布新品黑鹰 4 号无人机通过民航 UOM RID 合规认证,并公布了新品的配置信息。 黑鹰 4号是一款航拍无人机新品,支持 16km 数字图传;搭载第四代三轴无刷…

2026-05-21

科创AIETF博时588790午盘微涨0.30% 成交额达2.84亿 重仓股表现分化
来源:新浪基金∞工作室 5月20日,截止午间收盘,科创AIETF博时(588790)涨0.30%,报1.017元,成交额2.84亿元。科创AIETF博时(588790)重仓股方面,芯原股份截止午盘跌2.04%…

2026-05-21

家电ETF易方达(159328)午间收跌0.89% 成交额342.70万 重仓股表现分化
来源:新浪基金∞工作室 5月20日,截止午间收盘,家电ETF易方达(159328)跌0.89%,报1.117元,成交额342.70万元。家电ETF易方达(159328)重仓股方面,美的集团截止午盘涨0.68%…

2026-05-21

华为HarmonyOS 6.1上线毕业季水印:个性化定制专属青春,7月15日前可体验
PChome 5月20日消息,近日华为面向HarmonyOS 6.1用户上线了一款充满仪式感的“毕业季限时水印”功能,为即将毕业的学生群体记录了青春时刻提供专属的影像纪念。据悉该限时水印功能仅在7月15日前生…

2026-05-21