five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

本古里安大学 发布 CUPCase 数据集, 应用在 医学案例、自然语言处理 领域

五号数据雷达开源数据市场2025-03-13 11:3929
CUPCase 是 本古里安大学 发布的数据集,于 2025-03-08 首发在 arXiv 应用于 医学案例、自然语言处理 领域

本古里安大学 本次发布的数据集 CUPCase, CUPCase数据集是基于BMC医学案例报告期刊的3562个真实世界案例报告构建的,旨在评估大型语言模型在医学知识提取、诊断、总结等方面的能力。该数据集包含以开放文本格式呈现的诊断和多项选择题形式的案例,涵盖了从oncology(肿瘤学)到obstetrics and gynecology(妇产科)等多种医学学科。数据集的构建过程包括从案例报告中提取案例介绍,移除关于最终诊断的明确提及,并将诊断转化为向量形式以便于模型学习。

查看CUPCase

关于 本古里安大学 , 本古里安大学是以色列的一所重要研究型大学,专注于科学、工程、医学和人文社会科学的研究与教育。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们