BioDT 本次发布的数据集 BioCube, 该数据集名为BioCube,是一个多模态、细粒度的全球生态与生物多样性研究数据集,它融合了通过图像、音频记录、环境DNA以及各种环境指标进行的物种观测。数据以Apache Parquet格式存储,这种格式特别优化了输入输出操作。数据集包含了图像和音频的时空匹配,并为每个样本分配了一个独特的标识符以避免重复。该数据集涵盖了超过40,000个物种,旨在支持生物多样性研究和生态系统动态研究任务。
Dataset card 内容:
Files and versions 内容:
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)