密苏里大学 本次发布的数据集 GPT-4 API生成的医疗合成数据集, 本数据集由密苏里大学数据科学与信息学院Polycarp Nalela教授领导的研究团队创建,旨在为医疗保健领域的人工智能训练提供高质量的合成数据。数据集包含患者入院信息、医疗保健提供商详细信息、医院部门、病房、床位分配、患者人口统计、紧急联系人、生命体征、疫苗接种、过敏史、医疗史、预约、住院、实验室测试、诊断、治疗计划、药物、临床笔记、访问日志、出院摘要和转诊等。通过GPT-4 API进行提示工程生成数据,并使用BERT、GPT-2、RoBERTa等模型进行数据验证,确保数据质量和完整性。该数据集已集成到PostgreSQL数据库中,用于电子健康记录(EHR)应用的数据管理系统。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)