巴塞尔大学 本次发布的数据集 CleanPatrick, CleanPatrick是一个大型图像数据清洗基准,基于公开可用的Fitzpatrick17k皮肤病数据集构建。它收集了933名医疗众包工作者的496,377个二元标注,识别了离题样本、近似重复样本和标签错误,并采用了一种受项目反应理论启发的聚合模型,随后进行专家审查,以获得高质量的地面真实数据。CleanPatrick将问题检测正式化为排序任务,并采用典型的排序指标,以反映实际的审计工作流程。通过发布数据集和评估框架,CleanPatrick使图像清洗策略的系统比较成为可能,并为更可靠的数据为中心的人工智能铺平了道路。
Dataset card 内容:
Files and versions 内容:
关于 巴塞尔大学 , 巴塞尔大学是位于瑞士巴塞尔的一所综合性大学,成立于1460年,是瑞士最古老的大学之一,提供多样化的本科和研究生教育,并在生命科学、医学、法学、人文社会科学等领域拥有卓越的研究成果。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)