Central South University 本次发布的数据集 PathGene-CSU, 该数据集名为PathGene-CSU,包含了1576名肺癌患者,其中大部分被诊断为腺癌或腺鳞癌。所有患者都接受了下一代测序(NGS)检查,从而为每位患者生成了驱动基因突变状态、突变亚型和外显子级别变异位置的标签。该数据集重点关注五个预测任务,包括TP53、EGFR、KRAS和ALK的二元突变状态,并包含了详细的亚型和外显子信息。数据规模涉及1576名患者,任务包括预测驱动基因突变状态、突变亚型、外显子位置以及肿瘤突变负担(TMB)状态。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)