抽象的:
动机:癌症是全世界死亡的主要原因,需要早期诊断来掌握有利预后。组织学检查是癌症鉴定的金标准;然而,组织学诊断中存在大量观察者间变异性。许多研究表明,癌症成因伴随着患者的有害突变的积累'基因组,增强基于基因组信息的癌症鉴定。我们提出了一种方法,GDL(基因组深度学习),研究基于深神经网络的基因组变化与特征的关系多个隐藏层和非线性变换。
结果:我们分析了从TCGA获得的12种癌症类型的6,083个样品(癌症基因组图集)来自1000个基因组项目的1,991个健康样品
(Genomes Project,等。,2010年)
。我们构建了12种特定模型,以区分某些类型的癌症和健康组织,一种可以鉴定健康与患病组织的特定模型,以及一种基于GDL的所有12种癌症的混合物模型。我们在基于基因组变异应用于癌症的挑战性问题时,展示了GDL获得的成功,并证明了癌症鉴定的最新结果(97%,70.08%和94.70%)。混合物模型实现了可比性。随着新的分子和测序技术的发展,我们现在可以从血液中收集循环肿瘤DNA(CTDNA),实时监测癌症风险,并使用我们的模型,我们还可以针对未来可能发展的癌症组织。我们基于基于基因组信息制定了一种新的和高效的方法,可根据基因组信息识别疾病诊断,同时提供基于该信息的新方法来预测性状。