Cosmos World Foundation 本次发布的数据集 Video Training Dataset, 该数据集是一个精心筛选的视频训练集,涵盖了包括驾驶、人体运动、自然动态等多个物理人工智能应用类别。该数据集包含了不同长度和分辨率的视频(从720p到4k),并经过多步骤的精选过程,以提高数据质量,更好地服务于模型训练。该数据集规模约为2000万小时的原始视频,其中约1亿个视频片段用于预训练,1000万个视频片段用于微调。其任务是训练物理人工智能模型。
README 内容:
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)