five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

【五号雷达-数据快讯】Open-Sora-Dataset项目视频数据集

五号雷达开源数据市场2024-04-11 14:0387
该数据集为训练Open-Sora以及其它文生视频大模型提供了一个高质量的数据集。

Open-Sora-Plan项目,由北大-兔展AIGC联合实验室共同发起,旨在复现Sora,而Open-Sora-Dataset作为Open-Sora-Plan项目的一部分,旨在为开源世界构建一个高质量的视频数据集,并详细阐述其收集和处理过程。该数据集包含40258个视频资源,总时长约274小时。视频数据主要来源于 Mixkit、Pexels 和 Pixabay 三个平台,研究人员遵循CC0许可爬取,这些视频都是高质量、无水印的,其中风景类视频占比 60%。该数据集为训练Open-Sora以及其它文生视频大模型提供了一个高质量的数据集。

详情请参见五号雷达:https://www.5radar.com/result?key=Open-Sora-Dataset

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们