智能日报
业界资讯 智能手机 电脑硬件 平板电脑 智能手表 智能家电 耳机音频 笔记本 游戏机

B站开源AniSora模型:动漫视频一键生成,多样风格随心创

2025-05-18来源:ITBEAR编辑:瑞雪

B站团队近期宣布了一项重大技术突破,于5月12日正式开源了名为AniSora的动漫视频生成模型。这一举措标志着在动漫内容创作领域,AI技术迈出了重要一步。

B站团队指出,尽管当前已有诸如Sora、Kling、CogVideoX等先进的自然视频生成模型,但这些模型在动漫视频生成方面仍存在一定的局限性。动漫的独特艺术风格、夸张的运动表现以及对物理规律的打破,给模型的训练和评测带来了巨大挑战。

为了克服这些挑战,B站团队精心打造了AniSora系统。该系统涵盖了数据处理流水线、可控生成模型以及评测数据集等多个方面。其中,数据处理流水线整合了超过1000万份高质量数据,为模型的训练提供了坚实的基础。可控生成模型则引入了时空掩码模块,支持图生视频、帧插值、局部图像引导等关键动画制作功能,使得生成的动漫视频更加生动和逼真。

为了评估AniSora模型的性能,B站团队还收集了948段多样化动画视频,并配套进行了双盲人评实验及VBench测试。测试结果显示,AniSora模型在人物一致性与运动一致性方面均达到了业界领先水平。

为了让大家更直观地感受AniSora模型的魅力,B站团队还提供了多个图生视频示例。在示例中,可以看到各种动漫风格的场景和角色,如坐在汽车里向后挥手的人物、身穿红色婚服走向远方的人物、金发人物伸手触摸跪着的人物的头部等。这些场景和角色的动作流畅自然,充满了动漫特有的夸张和想象力。

AniSora模型的开源,无疑将激发更多动漫创作者的热情,推动动漫产业的创新发展。同时,这一技术也将为AI在动漫领域的应用开辟更广阔的空间。

对于对动漫创作感兴趣的读者来说,不妨前往AniSora的开源地址,亲自体验这一技术的神奇魅力。相信在不久的将来,我们将看到更多由AniSora模型生成的精彩动漫作品。