智能日报
业界资讯 智能手机 电脑硬件 平板电脑 智能手表 智能家电 耳机音频 笔记本 热点资讯

英伟达PiD图像生成技术亮相:消费级显卡秒级解码高分辨率图像

2026-05-27来源:快讯编辑:瑞雪

英伟达团队近日宣布推出一项名为PiD(Pixel Diffusion Decoder,像素扩散解码器)的图像生成技术,该技术能够在消费级显卡上实现超高分辨率图像的快速生成与放大。实验数据显示,在单张RTX 5090显卡上,PiD可将512×512分辨率的图像潜变量直接解码并放大至2048×2048像素,峰值显存占用仅为13GB,处理时间不足1秒;若使用GB200 GPU,最快仅需210毫秒。

传统高分辨率图像生成流程通常分为两步:首先在潜在空间生成低分辨率图像,再通过解码器恢复为清晰图像。潜在空间是模型对原始图像进行压缩后的数值表示,虽保留了主体结构与语义信息,但舍弃了大量像素级细节,从而降低了计算成本。然而,传统解码器主要承担“复原”任务,面对百万像素级图像时,其速度与质量均存在显著瓶颈。

PiD的创新之处在于将潜在解码重新定义为条件式像素扩散过程,并将解码与上采样整合至同一生成模块中。这一设计使模型能够在输出阶段主动补足纹理、结构及局部细节。条件式像素扩散通过参考额外输入(如低分辨率图像或语义信息)来约束生成结果,而非完全随机生成,从而提升了可控性与生成质量。

技术实现层面,PiD基于PixelDiT架构构建,并引入轻量级ControlNet风格适配器。该适配器将含噪的潜在表示注入模型,并通过与西格玛相关的门控机制,根据噪声强度动态调整对潜在信息的依赖程度。为进一步优化推理速度,研究团队采用DMD2蒸馏技术,将推理步数压缩至4步,同时配合早停机制,在保证输出质量的前提下显著降低延迟。

PiD的另一大优势是其通用性。该技术不仅支持传统VAE(变分自编码器)生成的潜变量,还可兼容RAE(重建自编码器)路线常用的语义潜变量,如SigLIP和DINOv2。这一特性使其能够适配多种图像生成框架,拓展了应用场景。

与级联式扩散超分方案相比,PiD在端到端延迟上表现优异,最高可提升5.9倍(约6倍),同时视觉保真度更优。实验结果表明,PiD在保持细节丰富度的同时,有效减少了生成过程中的伪影与模糊现象,为高分辨率图像生成领域提供了新的解决方案。

苹果iPhone新功能“未雨绸缪”:检测被抢即刻锁定,守护用户隐私财产安全
【环球网科技综合报道】5月27日消息,据9to5mac报道称,针对智能手机的“抢夺式盗窃”场景,苹果公司正在积极研发一项全新的安全功能。据最新曝光的代码细节显示,当系统检测到iPhone被人从用户手中突然抢…

2026-05-27

三星电子工会初步薪资协议获73.7%支持通过
三星电子工会近日宣布,一项涉及员工绩效奖金的初步协议已顺利通过投票。根据工会公布的投票结果,在当地时间上午10时结束的投票中,支持率高达73.7%,共有46,142人投出赞成票,使得协议得以正式生效。

2026-05-27

联想海外发布Legion 7a 15ASH11游戏本,至高64GB内存+165Hz OLED屏实力几何?
IT之家 5 月 26 日消息,联想现已在海外市场发布 Legion 7a 15ASH11 游戏笔记本,新品搭载 AMD Strix Halo平台,集成 Radeon 8060S GPU、165Hz OLE…

2026-05-27

小米REDMI K90至尊版或入网 100W有线充加持 性能机新选择引期待
博主 @数码闲聊站 对此表示:REDMI K90至尊版疑似入网,支持 100W有线充,你们对这台性能机有何期待?高刷新率大直屏?激进性能释放?大电池? 该博主还表示,官方定位 K90 至尊版<K90 Ma…

2026-05-27