哈佛医学院生物医学信息学系 本次发布的数据集 ReXGroundingCT, ReXGroundingCT数据集是第一个公开可用的将自由文本放射学发现与3D胸部CT扫描中的像素级分割相链接的手工注释数据集。该数据集包含3,142个非对比胸部CT扫描,并与来自CT-RATE数据集的标准放射学报告配对。使用系统化的三阶段流程,GPT-4被用于提取阳性肺和胸膜发现,然后由专家注释者手动分割。总共注释了8,028个发现,跨越16,301个实体,并由有执业资格的放射科医生进行质量控制。大约79%的发现是焦点异常,而21%是非焦点异常。训练集包括每个发现的最多三个代表性分割,而验证集和测试集包含每个发现实体的详尽标签。ReXGroundingCT为开发和研究胸部CT中的句子级接地和自由文本医学分割模型建立了新的基准。
Dataset card 内容:
Files and versions 内容:
关于 哈佛医学院生物医学信息学系 , 哈佛医学院生物医学信息学系专注于生物医学信息学的研究与教育,涉及医学、计算机科学和生物信息学的交叉领域,旨在通过数据分析改进医疗保健。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)