智能日报
业界资讯 智能手机 电脑硬件 平板电脑 智能手表 智能家电 耳机音频 笔记本 热点资讯

阿里新专利:图生视频技术,智能化端到端生成无需预设运动参数

2025-02-07来源:ITBEAR编辑:瑞雪

近日,阿里巴巴(中国)有限公司在视频生成技术领域取得了新进展,一项名为“一种图生视频方法和装置”的专利被正式公布。据天眼查知识产权信息显示,这项专利的公布标志着阿里巴巴在智能化视频生成方面迈出了重要一步。

该专利的核心在于,通过一种创新的实施例,实现了从静态图像到动态视频的智能化转换。具体而言,该方法首先将包含目标对象的源图像输入到一个精心设计的第一视频生成模型中,从而生成一个基础的素材视频。接下来,根据这个素材视频,系统会自动确定一个帧间变换矩阵序列,这个序列用于描述视频中帧与帧之间的变换关系。

在获取了帧间变换矩阵序列后,系统会进一步从源图像中提取出目标对象对应的对象掩码图像。这个掩码图像相当于一个“模板”,用于在后续步骤中准确地识别和提取目标对象。随后,将帧间变换矩阵序列应用于这个对象掩码图像,生成一系列掩码图像,组成掩码图像序列。同时,将帧间变换矩阵序列也应用于源图像,生成一系列目标对象图像,组成目标对象图像序列。

有了这些基础数据后,系统会根据源图像、掩码图像序列和目标对象图像序列,确定一个目标输入数据。这个数据被输入到一个支持局部重绘的第二视频生成模型中。这个模型能够利用前面的数据,生成一个与目标对象高度匹配、且运动轨迹多样的目标视频。

这种方法实现了智能化端到端的图生视频生成,无需预先设定运动参数。这意味着,系统能够自动地根据源图像中的目标对象,生成具有丰富运动轨迹的视频,同时保持目标对象在视频中的清晰度和连贯性,避免了目标对象的扩散问题。

阿里巴巴的这项专利,无疑为视频生成技术带来了新的突破。随着智能化技术的不断发展,这种图生视频方法将在各个领域发挥越来越重要的作用,为人们的生活和工作带来更多便利和乐趣。

孟晚舟新年致辞:2025拼搏奋进,2026战略聚焦以质开启新程
华为2025年业务聚焦5G-A、鸿蒙生态、乾崑智驾及行业数智化等方向取得进展。我们助力运营商建设5G-A网络,为6000万用户提供极速网络联接体验; 在生态伙伴的支持下,鸿蒙生态体验加速从“可用”到“好用…

2025-12-30

英伟达Feynman GPU或集成LPU技术 3D堆叠设计能否引领AI推理新潮流?
根据这一构想,主计算裸片(compute die,包含 Tensor 单元与控制逻辑)将采用台积电最先进的A16(1.6nm)工艺制造,而包含大规模 SRAM(静态随机存取存储器)存储库的 LPU 单元则…

2025-12-30

影像新标杆来袭!2025年拍照实力派手机大比拼,谁更胜一筹?
综合来看,在这些"目前最强拍照手机"候选者中,荣耀500凭借2亿像素超清主摄、全能实况体验和业界领先的防抖性能脱颖而出,成为追求极致影像体验用户的首选。其2亿像素主摄带来的细节表现、创新的实况拍摄功能以及强…

2025-12-30

OPPOFindX9Pro成新宠:性能影像续航全面升级,老款Ultra不香了
OPPOFindX8Pro不仅发布时间更新,而且系统、影像算法和能效调校都更成熟,关键是还比老款Ultra更便宜。 整体来看,在新旧机型价格倒挂、用户更看重长期体验的当下,OPPOFindX9Pro所呈现出的…

2025-12-30

2025高性价比手机怎么选?荣耀WIN系列等多款机型适配多元需求
现如今,不同消费群体对手机的核心诉求差异显著,学生党看重续航与网络稳定性,职场人关注快充与综合体验,全能用户则追求性能与功能的全面覆盖。185Hz超高刷电竞屏、3500Hz瞬时触控采样率,搭配5920Hz P…

2025-12-30