首页 / 开源数据市场 / 正文

悉尼大学联合发布全球首个草图引导长视频生成数据集SketchLongVideo 破解AIGC长视频可控性痛点

五号数据雷达开源数据市场2026-05-26 05:3414

2026年5月22日，悉尼大学联合查尔斯·斯特尔特大学研究团队在预印本平台arXiv首发全球首个面向草图引导文本到长视频生成的专用数据集SketchLongVideo，可为故事板驱动的可控长视频生成提供核心数据支撑，填补了AIGC长视频创作领域的垂类数据空白。

随着AIGC技术在视频创作领域的快速落地，短时长文生视频的生成效果已趋近实用，但长视频生成普遍存在可控性弱、叙事连贯性差、难以匹配创作者个性化结构需求的痛点。而草图（故事板）作为影视、动画、广告等内容创作领域的通用前期规划工具，是实现创作者导向可控长视频生成的核心入口，但此前行业始终缺乏对应场景的专用训练数据集，成为制约技术落地的核心瓶颈。

2026年5月22日，悉尼大学联合查尔斯·斯特尔特大学的研究团队正式发布SketchLongVideo数据集，这也是全球首个面向草图引导文本到长视频生成场景的专用数据集。据介绍，该数据集整合了公开在线动画视频、AnimeShooter数据集衍生的动画内容以及AI生成的关键帧序列，通过标准化的镜头检测、关键帧提取、结构化视觉语言识别和草图转换等流程，将原始视频转化为两两对齐的（草图、外观提示、运动提示）三元组数据，覆盖了不同风格、不同叙事逻辑的长视频创作场景需求。

值得关注的是，SketchLongVideo的构建过程采用了非学习性的确定性草图转换方法，避免了AI生成草图可能存在的结构偏差问题，既保证了数据集中草图与原视频结构约束的1:1对齐，也确保了数据集构建逻辑的可复现性和大规模处理能力，能够为故事板驱动的可控长视频生成模型训练提供高质量标注数据，针对性解决导演导向创作中稀疏草图控制与长视频叙事一致性结合的行业共性挑战。

从应用场景来看，SketchLongVideo的落地价值覆盖了数字内容创作的多个核心赛道：在影视动画前期创作环节，基于该数据集训练的模型可直接响应导演绘制的故事板草图，快速生成对应分镜的长视频小样，大幅降低前期试错的人力与时间成本；在UGC内容创作领域，普通创作者仅需绘制简单的关键帧草图搭配文字提示，即可生成符合自身叙事逻辑的长视频内容，有效降低长视频创作的技术门槛；在数字内容工业化生产场景中，广告、教育课件、虚拟场景内容等批量生产需求可通过草图实现统一的结构管控，保障批量产出内容的叙事一致性；此外，该数据集也可作为AIGC长视频模型的通用测试基准，为行业评估不同模型的结构可控性、叙事连贯性能力提供统一的评判依据。

作为AIGC长视频赛道的核心垂类数据资产，SketchLongVideo的发布填补了草图引导可控长视频生成领域的专用数据空白，也为数据要素赋能AIGC产业落地提供了典型样本——垂类场景的专用数据集正在成为细分赛道技术突破的核心底座，有望加速推动AIGC长视频从“可生成”向“可控制、可定制、工业化生产”的阶段升级。

查看SketchLongVideo

详情页内容：

社区讨论

近期热门