five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

巴塞尔大学 发布 CleanPatrick 数据集, 应用在 医学图像分析、数据清洗 领域

五号数据雷达开源数据市场2025-05-20 11:0836
CleanPatrick 是 巴塞尔大学 发布的数据集,于 2025-05-16 首发在 arXiv 应用于 医学图像分析、数据清洗 领域

巴塞尔大学 本次发布的数据集 CleanPatrick, CleanPatrick是一个大型图像数据清洗基准,基于公开可用的Fitzpatrick17k皮肤病数据集构建。它收集了933名医疗众包工作者的496,377个二元标注,识别了离题样本、近似重复样本和标签错误,并采用了一种受项目反应理论启发的聚合模型,随后进行专家审查,以获得高质量的地面真实数据。CleanPatrick将问题检测正式化为排序任务,并采用典型的排序指标,以反映实际的审计工作流程。通过发布数据集和评估框架,CleanPatrick使图像清洗策略的系统比较成为可能,并为更可靠的数据为中心的人工智能铺平了道路。

查看CleanPatrick

Dataset card 内容: 

 

Files and versions 内容: 

 

关于 巴塞尔大学 , 巴塞尔大学是位于瑞士巴塞尔的一所综合性大学,成立于1460年,是瑞士最古老的大学之一,提供多样化的本科和研究生教育,并在生命科学、医学、法学、人文社会科学等领域拥有卓越的研究成果。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们