艾默里大学 本次发布的数据集 Glucose-ML, Glucose-ML是一个包含10个公开可用的糖尿病数据集的集合,这些数据集在过去的7年内(即2018年至2025年)发布。该集合包含超过300,000天的连续血糖监测(CGM)数据,共收集了来自4个国家2500多人的3800万个血糖样本。参与者包括患有1型糖尿病、2型糖尿病、糖尿病前期和无糖尿病的人。为了支持研究者和创新者使用这个丰富的糖尿病数据集集合,我们进行了一个比较分析,以指导算法开发者在选择数据集时做出决策。此外,我们还进行了一个关于血糖预测的案例研究,这是该领域最常见的人工智能任务之一。通过这个案例研究,我们为所有10个公开可用的糖尿病数据集提供了短期血糖预测的基准。我们展示了同一个算法在不同的数据集上开发/评估时,预测结果可能存在显著差异。本研究的结果被用于为糖尿病或更广泛的健康领域开发鲁棒的AI解决方案提供建议。我们提供了Glucose-ML集合中每个纵向糖尿病数据集的直接链接,并公开提供我们的代码。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)