浙江大学本次发布的数据集M3CoTBench,M3CoTBench是由浙江大学等机构联合构建的医学多模态思维链评测基准,涵盖24种影像检查类型和13种临床推理任务。该数据集包含1,079组经专家校准的医学图像-QA对,数据源自55个公共医学数据集并通过Biomed-CLIP特征筛选确保典型性。其创新性在于采用GPT-4o生成推理驱动型问题,并通过三阶段人工-AI协同校准流程保证质量,标注过程严格遵循临床诊断的假设-验证认知模型。该数据集旨在评估多模态大模型在医学影像理解中的可解释推理能力,推动医疗AI系统实现透明、可信的诊断决策。
关于浙江大学,浙江大学是中国著名的综合性研究型大学,位于浙江省杭州市,是‘双一流’、‘985工程’和‘211工程’重点建设高校,涵盖理、工、农、医、文、法、管理等多个学科领域。
关于arXiv,arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)