快手可灵AI首部AI单元剧首映,商业化显著但技术存挑战

🤖 由 文心大模型 生成的文章摘要

6月25日,快手科技旗下的可灵AI与星芒短剧携手,共同为全球观众带来了一场别开生面的视觉盛宴——全球首部AI单元故事集《新世界加载中》的首映礼隆重举行。这部融合了科幻、历史、奇幻、荒诞喜剧等多元题材的作品,自筹备之初便备受瞩目,其借助可灵AI强大的技术支撑,将不同风格的故事巧妙融合,为观众呈现了一个充满想象力与创造力的“新世界”。​

首映礼现场气氛热烈非凡,各界嘉宾、媒体以及AI与影视领域的专业人士齐聚一堂。在观看完整部作品后,不少观众对其创新性给予了高度评价。剧中通过详细动作脚本与首尾帧技术,成功攻克了快速连续打斗动作难以流畅衔接的难题,使得动作场面紧张刺激且行云流水,为观众带来了震撼的视觉冲击。然而,不可忽视的是,这部作品也暴露出一些当下AI创作难以避免的问题,如人物一致性不足,部分角色在不同场景下外貌特征出现细微偏差;人物情感情绪表达欠缺,使得角色形象不够丰满立体;群像画面中人脸崩坏现象偶有发生,一定程度上影响了整体观影体验。​

可灵AI在商业化方面取得的成绩令人瞩目。此前官方披露的ARR(年度经常性收入)数据显示,其已成功突破1亿美元大关。高盛更是乐观预测,可灵AI在2025年的收入规模有望超过1.2亿美元。这一斐然成绩的背后,是可灵AI精准的市场定位与多元化的商业策略。可灵AI依托快手庞大的内容生态与创作者资源,从诞生之初便明确了降低视频创作门槛、赋能内容生产者的核心定位。其推出的面向C端用户的会员收费模式以及面向B端企业的API订阅模式,吸引了大量具有付费能力的专业创作者群体。

数据显示,约70%的营收来自Prosumer(专业消费者)的订阅付费,这类用户兼具个人创作需求和商业变现诉求,形成了稳定的付费基本盘。同时,可灵AI与网易《逆水寒》等游戏的深度合作,通过定制化角色动画生成功能,不仅拓展了应用场景,更验证了垂直领域付费的可行性。​

但在技术表现层面,可灵AI产品及运营负责人李杨坦言,可灵AI在稳定性、运动表现、清晰度等方面仍存在一定问题。在实际使用中,视频生成效果的不确定性较为突出,即便是专业创作者,也需要通过反复编写和调整prompt(提示词),多次尝试生成视频,这一过程被形象地称为“抽卡”。目前,可灵AI在生成较长视频时,容易出现内容断层、情节不连贯的现象,严重影响视频的质量与观赏性。在运动表现方面,人物或物体的运动速度、质量、美感以及自然度,与真实场景下的运动规律仍存在差距,使得生成的视频在动作呈现上显得生硬、不真实。清晰度方面,虽然可灵AI支持1080P高清视频输出,但在复杂场景或细节较多的画面中,仍会出现模糊、噪点等问题。​

面对这些技术挑战,可灵AI团队正全力以赴进行优化与完善。目前,团队将重点聚焦于语义遵从、运动表现等方面。在语义遵从方面,通过持续优化算法模型,提升AI对用户输入提示词的理解能力,确保生成的视频内容能够精准贴合用户的创作意图。在运动表现优化上,深入研究物理运动规律,引入先进的模拟技术,力求使人物和物体的运动更加自然流畅,符合真实世界的运动逻辑。同时,在提升清晰度方面,加大对图像渲染技术的研发投入,提高视频画面的细节还原度,减少模糊和噪点现象。​

尽管存在技术短板,但可灵AI自发布以来,凭借其强大的技术实力和创新的产品理念,在视频模型行业中始终占据头部位置。根据Artificial Analysis视频生成榜单,谷歌Veo系列和快手可灵系列分别在文生视频、图生视频领域位列一二位,东方证券分析师更是将二者的技术实力评定为T0梯队。

今年5月,谷歌发布的Veo3视频大模型新品,凭借更强的音视频同步生成、参考图视频生成、相机控制视频生成等功能,在创作者群体中引发广泛热议。对此,李杨对谷歌Veo3的技术能力表示认可,她指出,谷歌Veo3的音视频同步生成功能确实令人眼前一亮,但可灵AI有着自己独特的发展路径。可灵AI更侧重于技术落地与产品体验,例如Veo3的音效同步生成功能虽然便捷,但由于音效很难通过prompt保持一致,容易导致音色不可控。而可灵AI选择尽早与用户群体进行交互,深入了解用户需求,并据此进行针对性的迭代更新,不断优化产品功能与体验。

「93913原创内容,转载请注明出处」