five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

发布Liberty-Disease数据集,应用在自然语言处理、医疗文本分类领域

五号数据雷达开源数据市场2026-01-10 08:5749
Liberty-Disease是发布的数据集,于2026-01-09首发在HuggingFace应用于自然语言处理、医疗文本分类领域

本次发布的数据集Liberty-Disease,LIBERTy-Disease数据集是LIBERTy基准测试的一部分,旨在评估NLP模型的概念解释方法。该数据集是一个多类文本分类任务,输入为患者症状描述,目标标签为三种疾病:偏头痛(0)、鼻窦炎(1)和流感(2)。数据集包含训练、测试、基线和反事实四个分割,每个分割用于不同的目的。数据集中的症状概念以三级序数尺度编码(0-不存在,1-轻度,2-强烈),并且这些概念在数据生成过程中被视为因果变量。数据集的主要用途包括评估概念解释方法、研究NLP模型中概念的因果效应以及在受控干预下比较解释方法。需要注意的是,所有数据都是合成的,不对应真实个体。

查看Liberty-Disease

Dataset card内容:

 

Files and versions内容:

 

关于,国庆学校是一所位于中国的教育机构,专注于提供基础教育服务。学校致力于培养学生的综合素质,注重学术与品德的全面发展。

关于HuggingFace,Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们