西北工业大学 本次发布的数据集 ubGen, ubGen是一个无偏见的通用标注数据集生成框架,旨在通过生成无偏见的图像来增强预训练骨干网络的跨类别和跨领域泛化能力。该数据集利用多模态基础模型(如CLIP)生成与语言定义的无偏语义空间对齐的图像,避免了手动收集的高成本和潜在偏见。数据集包含1000个类别,通过双层语义对齐损失和质量保证损失进行生成和优化。ubGen数据集主要应用于计算机视觉任务中,特别是在手动标注样本稀缺的情况下,提升模型的泛化能力。
关于 西北工业大学 , 西北工业大学位于中国陕西省西安市,是一所以工为主,工、理、管、文、经、法、教育、艺术等多学科协调发展的全国重点大学,是中国唯一一所以同时发展航空、航天、航海工程教育和科学研究为特色的大学。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)