智能日报
业界资讯 智能手机 电脑硬件 平板电脑 智能手表 智能家电 耳机音频 笔记本 游戏机

OpenAI新突破:多媒体生成速度飙升50倍,如何实现?

2024-10-24来源:ITBEAR编辑:瑞雪

OpenAI近期在人工智能领域取得了重大突破,其研究人员程璐和杨松发表了一篇关于新型连续时间一致性模型(sCM)的论文。这一模型在生成图像、视频和音频等多媒体内容方面,速度相较于传统扩散模型提升了50倍,仅需十分之一秒即可生成高质量图像。

sCM模型通过仅两个采样步骤,就能实现与传统扩散模型相当的样本质量,显著降低了计算成本和时间。这一创新使得实时生成AI应用变得更加可行,为多媒体内容的快速生成提供了新的解决方案。

扩散模型虽在生成逼真多媒体内容方面表现出色,但其采样效率低下,限制了实时应用。而sCM模型则克服了这一挑战,实现了速度与质量的双重提升。

sCM模型在ImageNet 512×512上进行了训练,可扩展至15亿个参数,同时保持了与最佳扩散模型相媲美的样本质量。基准测试显示,sCM模型在减少计算开销的同时,仍能提供顶级结果。

随着sCM模型规模的扩大,样本质量的差距进一步缩小。这一模型的成功还得益于其能够随着从中提炼知识的教师传播模型按比例扩展,使得采样步骤数的增加会进一步缩小质量差异。

sCM模型的快速采样和可扩展性为实时生成AI开辟了新的可能性,从图像生成到音频和视频合成,为需要快速、高质量输出的应用程序提供了实用解决方案。

特斯拉Q3财报亮眼:营收252亿,净利22亿,股价飙升12%
2024年第三季度,特斯拉总营收为251.8亿美元,其中汽车营收为200.2亿美元。该公司还公布了2024年第三季度的GAAP净收入为22亿美元,非GAAP净收入为25亿美元。根据2024年第三季度更新信,特…

2024-10-24

郭明錤预测:特斯拉Model Y更新版明年Q1量产,新车或下半年亮相
10月24日消息,北京时间今天凌晨,天风国际分析师郭明錤在X(推特)更新自己对特斯拉的调查与预测。更便宜的新款车型(有些人称为Model2)可能最快要到2025年下半年才会量产。ModelY更新版预计…

2024-10-24

苹果iOS 18.2开发者预览版Beta,新功能抢先看!
10 月 24 日消息,苹果今日向 iPhone 用户推送了 iOS 18.2 开发者预览版 Beta更新(内部版本号:22C5109p),本次更新距离上次发布 Beta/RC 间隔 2 天。 本…

2024-10-24