Nordic Casemix Centre 本次发布的数据集 NordDRG-AI-Benchmark, 该数据集是首个公开的测试平台,它完整捕捉了诊断相关分组(DRG)的规则集,并评估了大型语言模型(LLM)在多语言诊断、程序和收费标准逻辑推理方面的能力。该数据集包含了定义表、专家手册、变更日志模板以及包含14个病例组合任务的提示包。规模上,它涵盖了20个相互关联的表格,涉及DRG逻辑、国际疾病分类(ICD)和国家临床程序规范(NCSP)代码的各个方面。任务方面,该数据集专注于利用大型语言模型进行临床编码和决策支持。
README 内容:
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)