日记名称:GydF4y2Ba中国生物医学研究与评论杂志GydF4y2Ba
文章类型:GydF4y2Ba研究GydF4y2Ba
收到的日期:GydF4y2Ba2月21日,2020年2月21日GydF4y2Ba
接受日期:GydF4y2Ba2020年3月11日GydF4y2Ba
发布日期:GydF4y2Ba2021-03-21GydF4y2Ba
引文:GydF4y2BaLee M(2020)调查预后基因综合mRNA表达水平对各种类型癌症患者存活的影响。J Biomed Res Rev Vol:3,ISSU:1(18-21)。GydF4y2Ba
版权:GydF4y2Ba©2020 Lee M.这是在创意公约归因许可的条款下分发的开放式文章,其允许在任何媒体中不受限制地使用,分发和再现,只要原始作者和来源被记入。GydF4y2Ba
抽象的GydF4y2Ba
本研究旨在根据最有害或保护性基因的综合mRNA表达水平与患者存活之间的综合mRNA表达水平之间的关系等级。使用包括RNA测序和临床数据的癌症基因组数据集,我们不仅研究了特异性预后可用性,而且还研究了Cox系数值过滤的预后基因的全面预后可用性,并使用专门设计的预后指示剂排名癌症。使用Kaplan-Meier Plots,我们发现癌症在其预后基因的影响力的强度变化,并且可以根据这一发现排序。存在通过使用减少或增加生物标志物的表达水平的方法开发的治疗的高可能性,对于排名在底部的癌症不会有效。该研究的结果可用作同一科学证据。GydF4y2Ba
关键词GydF4y2Ba
生物信息学,基因组学,TCGA,COX模型。GydF4y2Ba
抽象的GydF4y2Ba
本研究旨在根据最有害或保护性基因的综合mRNA表达水平与患者存活之间的综合mRNA表达水平之间的关系等级。使用包括RNA测序和临床数据的癌症基因组数据集,我们不仅研究了特异性预后可用性,而且还研究了Cox系数值过滤的预后基因的全面预后可用性,并使用专门设计的预后指示剂排名癌症。使用Kaplan-Meier Plots,我们发现癌症在其预后基因的影响力的强度变化,并且可以根据这一发现排序。存在通过使用减少或增加生物标志物的表达水平的方法开发的治疗的高可能性,对于排名在底部的癌症不会有效。该研究的结果可用作同一科学证据。GydF4y2Ba
关键词GydF4y2Ba
生物信息学,基因组学,TCGA,COX模型。GydF4y2Ba
介绍GydF4y2Ba
要执行的最全面的研究成为可能,我们使用了癌症基因组图谱(TCGA)数据集包括临床,全基因组测序,基因组测序,RNA测序(RNA测序),小RNA测序,亚硫酸氢盐序列,和反相阵列信息,以识别途径在不同癌症[1-11]通常改变。GydF4y2Ba
癌症疗法有各种方法,如手术,放疗,免疫疗法和化疗。通常,大多数化学治疗方法减少或增加与患者存活相关的蛋白质或基因的表达水平。然而,很少有生物标志物可以有效地用于治疗一些癌症。本研究提供了临床结果与某些类型癌症预后基因的综合性关系之间具有重要关系的科学证据。在这项研究中,我们制定了称为预后分数的指标。该研究的结果可用作一些癌症治愈的导向。GydF4y2Ba
材料和方法GydF4y2Ba
代码和文件GydF4y2Ba
为本研究生成的所有文件和R代码,包括数字和表格,可以从作者的GitHub页面下载GydF4y2Ba(https://github.com/minhyeong-1022/tcga_mrna-expression_survival_corelelation_research)GydF4y2Ba。该脚本在三星笔记本电脑9上运行,使用I5处理器和8 GB RAM,在Windows 10上运行R 3.5.1。GydF4y2Ba
预后指标模型的构建GydF4y2Ba
要将RNA-SEQ和临床数据转换为R源代码,我们将来自RTCGATOOLBOOR的R库中的GetFirehosedata函数从9月中拉动来自https://tcga-data.nci.nih.gov/tcga/的TCGA数据2019年。从每种癌症的“临床”文件中提取所有临床后续信息,并且只有临床事件的患者信息均包含在该分析中。TCGA数据集提供从两种方法,RNA-SEQ和RNA-SEQV2获得的mRNA表达数据。我们使用了RNA-SEQV2,因为它是最近的版本。“rnaseq2genorm”文件由RSEM形成,这是一种报告mRNA表达水平的方法,并由RSEM软件输出[12]。对于每种癌症,基因,具有大于1的表达值大于1。从平方回归(R2)值确定预后分数,并且从COX模型的每个项产生具有小于或等于0.01的p值的基因的比率。为每种癌症产生R 2值,即R1值的Cox系数和Pearson相关系数值。为每个基因产生每个基因的患者特异性生存日的Pearson相关系数(对每种基因的mRNA表达值(RSEM)的Pearson相关系数(RSEM)的R1值。来自TCGA数据集的信息,包括使用从COX模型产生的P值选择的基因数量在表1中表示。每种癌症也产生了预后评分。 The formula used to generate the comprehensive prognostic indicator is represented below.
R.GydF4y2Ba1GydF4y2Ba= Pearson Cor(mRNA表达值,日死日)GydF4y2Ba
R.GydF4y2Ba2GydF4y2Ba= Pearson Cor(Cox系数,RGydF4y2Ba1GydF4y2Ba)GydF4y2Ba
表格1:GydF4y2BaTCGA数据集的特征和某些基因的调查数字。GydF4y2Ba
癌症类型GydF4y2Ba | 患者数量GydF4y2Ba | 总的基因数GydF4y2Ba | 选定基因的数量GydF4y2Ba (原始P值<0.01)GydF4y2Ba |
---|---|---|---|
OV.GydF4y2Ba | 591.GydF4y2Ba | 16923GydF4y2Ba | 115.GydF4y2Ba |
BRCA.GydF4y2Ba | 1097.GydF4y2Ba | 16632GydF4y2Ba | 695.GydF4y2Ba |
coGydF4y2Ba | 458.GydF4y2Ba | 16408GydF4y2Ba | 963.GydF4y2Ba |
BLCAGydF4y2Ba | 412.GydF4y2Ba | 16367.GydF4y2Ba | 1557.GydF4y2Ba |
KIRPGydF4y2Ba | 291.GydF4y2Ba | 16429.GydF4y2Ba | 3305.GydF4y2Ba |
CESCGydF4y2Ba | 307.GydF4y2Ba | 16359.GydF4y2Ba | 951.GydF4y2Ba |
拉德GydF4y2Ba | 522.GydF4y2Ba | 16777GydF4y2Ba | 2028.GydF4y2Ba |
塔GydF4y2Ba | 443.GydF4y2Ba | 16914GydF4y2Ba | 852.GydF4y2Ba |
HNSC.GydF4y2Ba | 528.GydF4y2Ba | 16642GydF4y2Ba | 832.GydF4y2Ba |
Lusc.GydF4y2Ba | 504.GydF4y2Ba | 16972GydF4y2Ba | 180.GydF4y2Ba |
兰尔GydF4y2Ba | 200.GydF4y2Ba | 15251.GydF4y2Ba | 599.GydF4y2Ba |
skcm.GydF4y2Ba | 470.GydF4y2Ba | 16058GydF4y2Ba | 2400.GydF4y2Ba |
lihc.GydF4y2Ba | 377.GydF4y2Ba | 15850.GydF4y2Ba | 1766GydF4y2Ba |
KIRCGydF4y2Ba | 537.GydF4y2Ba | 16665.GydF4y2Ba | 5447.GydF4y2Ba |
多变量Cox模型的信息用于分析GydF4y2Ba
在弗吉尼亚大学的Jordan Anaya发表的前一项研究中,在前一项研究中产生了16种癌症的基因特异性Cox系数值和P值[13,14]。我们使用了数据文件“所有基因,P值,每个癌症的Cox系数”,它可以在线下载GydF4y2Ba(https://peerj.com/articles/1499/#supp-1)GydF4y2Ba。GydF4y2Ba
结果GydF4y2Ba
我们分析了一些患者的RNA-Seq的数据TCGA数据和成熟的临床随访资料。十四癌症,包括急性髓性白血病(AML),膀胱移行细胞癌(BLCA),乳腺癌浸润性癌(BRCA),结肠腺癌(COAD),头和颈部鳞状细胞癌(HNSC),肾透明细胞肾细胞癌(KIRC),肺腺癌(LUAD),肺鳞状细胞癌(LUSC),卵巢浆液性囊腺癌(OV),宫颈鳞状细胞癌和宫颈腺癌(CESC),肾乳头状肾细胞癌(KIRP),肝肝细胞癌(LIHC),皮肤皮肤黑素瘤(SKCM),和胃腺癌(STAD)进行了研究。GydF4y2Ba
这项研究旨在排名癌症的基础上,癌症对自己的预后基因的表达水平的灵敏度,采用特殊配方的指标叫做预后评分。为了实现这一点,多变量Cox比例风险模型[15],这是研究的临床数据[16-19]标准回归方法,使用。在先前的研究[13,14],其中包括16种癌基因特异性的考克斯系数值和p值的数据表,而使用。GydF4y2Ba
在先前的研究中,用于从Cox模型的每个术语提供的Cox系数值和p值用于分析每个基因对患者存活的mRNA表达水平的影响。基于具有极端Cox系数值的基因的表达水平,患者存活模式存在显着偏差,并且我们检查了所有癌症的Kaplan-Meier Plots(图1D-G)检查了这些偏差。某些类型癌症中的患者存活受到基因表达水平的显着影响。然而,这不是其他类型的癌症的情况,因为癌症的敏感性对预后基因的表达水平不同。我们计算了本研究中所有类型癌症的预后分数。患者存活率不仅受R 2值的影响,而且影响所选基因的比例。癌症在其预后分数中不同,并且显示癌症排名的条形图显示在图1中。顶部排名癌的预后基因的表达水平影响了患者的临床结果超过了那些表达水平底部排名癌症。GydF4y2Ba
图1:GydF4y2Ba预后分数的生存模式差异。GydF4y2Ba
(一)柱形图显示癌症的预后由分数秩。预后分数主要由R2是COX系数和的患者特异性存活天数死亡和mRNA表达为每个基因的Pearson相关系数(R1)的平方回归确定。有关KIRC的R2其中排名顶部在条形图和(c)的OV R2其中在柱形图排名底部(B)散点图。(d),(E),(F),(G)的Kaplan-Meier曲线比较KIRC的存活天数,以OV患者的100个最保护性基因的存活天数和用于100个最有害的基因。GydF4y2Ba
对于所有的本研究中使用14种癌症,总基因的数量和由小于或等于0.01的原始p值选择基因的数字被表示在上面的表中。这两者的比率将是预后指标的因素。GydF4y2Ba
KIRC的R2值,其中有14种癌症中最高的预后评分,(图1b)比OV(图1c),其在底部排的更显著。KIRC和OV明显不同在他们的患者存活的图案,使用其预后基因的表达水平而获得。如图1所示,KIRC,不像OV,被认为是基因表达非常敏感。所述其他癌症其预后基因的表达水平的预后灵敏度遵循排序(图1a)。补充材料,包括采用Kaplan-Meier曲线和其他癌症的散点图,可以从GitHub的页面下载。GydF4y2Ba
讨论GydF4y2Ba
的保护性或有害的基因的mRNA表达水平,由考克斯系数值过滤,在不同类型的癌症的不同影响的患者存活。排名癌症的基础上,对临床结果的预后基因的表达水平的影响,特别配方的指标叫做在本研究中所用的预后评分。总之,它被成功地用于预测排名的不同类型的癌症。这项研究的结果可以通过考虑癌症的其预后基因的表达水平的灵敏度可以作为科学证据治愈不同类型的癌症的发展。例如,如图1所示,有一个高概率治疗OV开发与减少或增加的mRNA表达和蛋白水平将不会有效的化学治疗方法。然而,开发治疗KIRC化疗方法可能是成功的。GydF4y2Ba
利益冲突GydF4y2Ba
报告了与本条有关的潜在利益冲突。GydF4y2Ba
没有参考GydF4y2Ba