华南理工大学 本次发布的数据集 CXRTrek, CXRTrek 是一个用于胸部 X 射线解释的多阶段视觉问答 (VQA) 数据集,它模拟了放射科医生在实际临床环境中使用的诊断推理过程。该数据集涵盖了 8 个连续的诊断阶段,包括 428,966 个样本和超过 1,100 万个问答 (Q&A) 对,每个样本平均有 26.29 个 Q&A 对。数据集的构建基于 MIMIC-CXR 和 CheXpert-plus 两个大型数据集,并通过专家知识和机器学习模型相结合的方式进行标注。CXRTrek 数据集旨在解决现有医学 AI 模型在临床推理方面的不足,通过模拟放射科医生的诊断推理流程,为医学影像分析提供更深入的语义理解和可追溯的决策支持。
README 内容:
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)