five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

弗劳恩霍夫协会发布MADE数据集,应用在医疗文本分类、医疗器械不良事件领域

五号数据雷达开源数据市场2026-04-19 05:1717
MADE是弗劳恩霍夫协会发布的数据集,于2026-04-17首发在arXiv应用于医疗文本分类、医疗器械不良事件领域

弗劳恩霍夫协会本次发布的数据集MADE,MADE是由弗劳恩霍夫协会构建的动态多标签医疗文本分类基准,基于美国FDA发布的医疗器械不良事件报告构建,包含48.8万条事件描述及1154个层次化标签。数据集通过时间划分(2015-2023训练/2024验证/2024-2025测试)确保评估纯净性,平均每条数据含370个token和8.79个标签,具有显著的长尾分布特征。其创新性体现在持续更新的动态基准机制,通过季度新增报告避免模型预训练数据污染,主要应用于医疗安全监测领域,为不确定性量化研究提供标准测试平台。

查看MADE

关于弗劳恩霍夫协会,弗劳恩霍夫协会是欧洲最大的应用科学研究机构,总部位于德国,专注于面向工业应用的技术研发和成果转化。

关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们