本次发布的数据集 LUMA, 该数据集名为LUMA,是一个基准数据集,它包含了来自50个类别的音频、图像和文本数据,用于从不确定和多模态数据中学习。LUMA数据集在CIFAR-10/100数据集的基础上扩展,加入了音频样本和利用大型语言模型生成的文本数据。该数据集允许可控地注入各种类型和程度的不确定性,并包含一个Python包,用于生成多种变体。数据规模方面,包含了25,200张图像作为训练和测试数据,以及3,859张图像作为OOD(Out-of-Distribution)数据。其研究任务定位于不确定和多模态数据学习。
Dataset card 内容:
Files and versions 内容:
关于 , 国庆学校是一所位于中国的教育机构,专注于提供基础教育服务。学校致力于培养学生的综合素质,注重学术与品德的全面发展。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)