上海人工智能实验室 本次发布的数据集 SEKAI, SEKAI是一个高质量的、以第一人称视角记录的世界范围视频数据集,专为世界探索而设计。该数据集包含超过5000小时的视频,覆盖了101个国家和地区的750多个城市,以步行或无人机视角拍摄。所有视频都配有丰富的标注,包括位置、场景、天气、人群密度、字幕和相机轨迹。数据集的开发经历了视频收集、预处理、标注和采样等过程,旨在为视频生成和世界探索领域提供支持。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)