布鲁诺·凯斯勒基金会本次发布的数据集SGB-crf-italian,该数据集由布鲁诺·凯斯勒基金会等机构联合构建,包含290份来自意大利急诊科的临床笔记,每条笔记标注了134项CRF字段。数据涵盖7种临床文档类型,平均每条笔记标注5.7个项目,主要记录病史采集和临床检查信息。数据集通过严格匿名化处理,采用专业临床医生标注,旨在推动基于大语言模型的病例报告表自动填充研究,解决临床信息结构化提取的难题。
关于布鲁诺·凯斯勒基金会,布鲁诺·凯斯勒基金会(Fondazione Bruno Kessler)是意大利一家专注于科技研究的非营利组织,位于特伦托,主要从事信息与通信技术、材料与微系统、核物理等领域的研究。
关于arXiv,arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)