five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

【五号雷达-数据快讯】MiraData - 包含长时间和结构化字幕的大规模视频数据集

五号雷达开源数据市场2024-04-15 13:4861
该数据集不仅为长视频生成任务提供了宝贵的资源,也为视频内容理解与生成领域的研究者提供了新的挑战与机遇。

MiraData(Mini-Sora Data)是腾讯公司针对长视频生成任务构建的一个大规模视频数据集。该数据集的特点是拥有较长的视频时长和精心设计的字幕,每个视频片段时长介于1至2分钟之间,均配有结构化字幕。当前版本的MiraData包含57,803个视频片段,累积时长达1,754小时,覆盖了游戏体验和城市/景观探索两种情景。为了收集MiraData,研究人员首先手动筛选了不同情景下的YouTube频道,然后下载并使用PySceneDetect工具对频道中的视频进行分割,最后利用GPT-4V为视频片段添加了结构化字幕。该数据集不仅为长视频生成任务提供了宝贵的资源,也为视频内容理解与生成领域的研究者提供了新的挑战与机遇。

详情请参见五号雷达:https://www.5radar.com/result?key=MiraData 

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们