本次发布的数据集 GSE12771, 该数据集包含了来自参与流行病学研究,如欧洲癌症与营养前瞻性调查(EPIC)的吸烟者的血液样本,以及来自德国科隆的Cosmos和BC试验的样本。这些样本均来自患者,他们要么在EPIC试验中被诊断为新发病例,要么在Cosmos和BC试验中为现患病例。此外,该数据集包含了一种基于血液的标志物,用以区分肺癌患者和未受影响的吸烟者。任务是对肺癌进行二元分类预测。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)