B站团队开源动漫视频生成模型AniSora,一键创建不同风格片段

🤖 由 文心大模型 生成的文章摘要

在人工智能与动漫创作深度融合的时代浪潮下,B站团队于5月12日重磅开源动漫视频生成模型AniSora,为动漫创作者与爱好者带来全新的创作工具与可能。AniSora具备强大的一键式创作能力,能够轻松创建多种动漫风格的视频片段,其覆盖范围极为广泛,不仅涉及系列剧集、中国原创动画、漫画改编作品等传统动漫类型,还延伸至VTuber内容、动漫PV以及鬼畜动画等新兴且极具特色的领域。​

B站团队坦言,随着动漫产业的蓬勃发展,动画内容在当今影视行业中的地位愈发重要,吸引了大量观众的目光与喜爱。当下,尽管Sora、Kling、CogVideoX等先进模型在自然视频生成领域展现出卓越性能,能逼真地模拟现实世界中的场景与动作,但面对风格迥异、充满想象力的动漫视频创作时,却难以达到理想效果。动漫独特的艺术风格,从夸张的人物造型、绚丽的色彩运用,到极具表现力的分镜设计;夸张的运动,如超现实的打斗特效、天马行空的飞行场景;以及对物理规律的大胆突破,都使得动漫视频的生成与评测成为行业内的一大难题。​

而此次开源的AniSora项目,堪称动漫视频生成领域的系统性解决方案。在数据处理方面,AniSora拥有超过1000万条高质量数据构成的处理流水线,这些数据经过精心筛选与处理,涵盖了海量动漫作品的画面、情节、角色等信息,为模型的训练提供了坚实的数据基础,确保模型能够充分学习动漫创作的各种规律与风格特点。​

在生成模型上,AniSora的可控性令人瞩目。它创新性地引入时空掩码模块,该模块如同一位“智能导演”,精准把控视频生成过程中的时间与空间维度。通过这一模块,AniSora支持图生视频功能,创作者仅需上传一张静态图片,模型便能围绕图片主题,自动生成连贯流畅的动态视频;帧插值功能可在已有视频帧的基础上,智能补充中间帧,让视频动作更加顺滑自然;局部图像引导功能则允许创作者指定视频中的某些区域或元素,对其进行特定风格或动作的生成,极大地提升了创作的灵活性与自由度,满足了动漫制作过程中的各种关键需求。​

「93913原创内容,转载请注明出处」