NVIDIA本次发布的数据集ffs_stereo4d,FFS Stereo4D是一个用于立体匹配任务的视差图数据集,基于Stereo4D数据集并通过FoundationStereo生成。数据集包含784×784分辨率的3通道uint8 PNG格式视差图像,编码方式为`disp = (R * 255*255 + G * 255 + B) / 1000.0`。数据规模在10万到100万之间,以zip文件形式组织,每个zip包含50,000张图像。数据集还提供了metadata.csv文件,链接每张视差图像到其来源的YouTube视频,包含视频ID、时间戳、帧索引等元数据。由于版权限制,数据集仅包含视差图,用户需自行下载原始RGB帧。该数据集适用于立体匹配、深度估计等计算机视觉任务,并提供了详细的相机参数和深度计算公式。
关于NVIDIA,英伟达是一家专注于图形处理器开发的全球知名技术公司。
关于HuggingFace,Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)