TCGA癌症临床数据资源全面介绍源泉癌症研究领域的全谱!

2021-11-15 01:40 来源:深圳妇科医院

2006年,肿肿症线粒体平面图谱(The Cancer Genome Atlas, TCGA)著手以多形功能性胶质母细胞膜肿(GBM)、肾鳞状细胞膜肿肿(LUSC)和卵巢浆液功能性囊腺肿肿(OV)开始为时3年的试点单项,2009年~2015年全面展开。到单项截止,TCGA网络研究者工作者已描绘了33种肿肿症特功能性10,000余举例病变的大分子特质,并判别了很多大分子共通点。TCGA包含的均科关键功能性特质代请注意泛化的数据资料搜集。为必需恰当采行这些具线粒体特质的海量均科数据资料,取值得注意TCGA启动一批重大成果,发请注意在CellPress母公司的学术期刊。

本文对4月底5日发请注意Cell上的一文展开编译。文章阐述以OS(总穴居期)、PFI(无困难重重时有隔)、DFI(无病时有隔)和DSS(病症方面存活)为四个主要均科结果往南的TCGA泛肿肿症均科数据资料资源(TCGA-CDR)规范化索引,并所述了了每种肿肿症特功能性的往南采行促请。TCGA均科数据资料可从线粒体数据资料总计享空时有(GDC)网络版下载,所有的大分子数据资料在下载。均科数据资料和大分子数据资料采行同样的条码形态,便于病变的均科参考资料和取样大分子数据资料构建。

TCGA泛肿肿索引函数调用特质

平面图1A为均科数据资料构建和一原理原理及4个主要均科往南衍生和分析的一个系统,对33份初始登记和97份后续数据资料文件,总计33种肿肿症特功能性111,60举例肿肿症病变的参考资料展开了处理过程。请注意1为每个TCGA函数调用的基本特质。按原发取样根据大分子特质被选为每个函数调用,请注意皮黑色素肿(SKCM)的原发和重取而代之分配南村两种特功能性都有,其它极少数的原发与重取而代之分配特功能性也有研究者。

平面图1. 均科数据资料构建和一原理原理及4个主要均科往南衍生和分析一个系统

请注意1. TCGA 泛肿肿函数调用特质

均科结果往南OS、PFI、DFI和DSS

总穴居期(OS)很极为重要,优点是判别OS政治事件时模糊功能性最少。但采行OS作往南无论如何压制均科研究者,因为非肿肿尸检不一定能看出出遗传学、首当其冲功能性或对病人缓解。采行OS或只需更是长的随访短时时有;很多均科试验中会,并不一定采行相比之下随访短时时有较短的DFI或PFI。针对既有TCGA均科数据资料,要确信短时均科随访时有隔在首当其冲功能性肿肿症特功能性结果的效用,因为无论如何几年内就检视到均科政治事件,在被害在此之前已出现病情中风或困难重重。对首当其冲功能性较弱的肿肿症特功能性,病变在数十乃至几十年后中风,随访期时有无论如何无法检视能够政治事件以赞成确实结果供判断。该一原理的目的是核查TCGA泛肿肿均科检测的相比之下优势和不足以,指导今后的一原理和避免随访时有隔短时时有不足以等不足以之处。

一原理全部TCGA均科数据资料后,论证如下:在数据资料可获得时,OS、PFI及DFI相比之下恰当,但多数情况下必需估计取值DSS。平面图1B为33种不尽相异肿肿症特功能性的OS K-M直线。尽管穴居一原理不是TCGA主要能够,多数肿肿症特功能性穴居直线与从前分析相异穴居往南的统一研究者基本相异,GBM、OV(2008, 2011)和低级别胶质肿(LGG)(2015)的TCGA结果就是不错举例证。PFI、DFI和DSS的K-M直线见平面图1C–1E。

平面图1 B-E均科数据资料一原理

基于每种肿肿症特功能性4个往南的检视短时时有计算平均随访短时时有及政治事件或核查的中会位短时时有(请注意2)。所有的中会位随访短时时有为22.1个月底,但不尽相异特功能性肿肿症该短时时有相似之处很大;GBM和急功能性髓系乳肿肿(LAML)最短分之一12个月底,而肾嫌色细胞膜肿肿(KICH)最长分之一48个月底。

请注意2 总体中会位随访短时时有及4个往南的政治事件与检视中会位短时时有

提拔采行的均科结果往南

均科结果往南并不只需要取决于研究者能够、政治事件数目、函数调用大小和结果数据资料质量。将这些原理和合作开发的其它原理作为对单个病症索引的测试和补充核查,所述了在每种病症特功能性中会采行每个结果往南的促请及因素(请注意3)。每种肿肿症特功能性的穴居往南能够据估计取值通过一个主要测试和补充核查才被不感兴趣。33种肿肿中会的13种采行全部4个往南:膀胱尿路上皮肿肿(BLCA)、宫颈鳞状细胞膜肿肿(CESC)、结肠肿肿(COAD)、食管肿肿(ESCA)、细弱鳞状细胞膜肿肿(HNSC)、肾状细胞膜肿肿(KIRP)、肾腺肿肿(LUAD)、LUSC、OV、胰腺肿肿(PAAD)、肉肿(SARC)、胃腺肿肿(STAD)和子宫内膜肿肿(UCEC)。显然,很难一个往南的有嗜铬细胞膜肿和副轴突肿(PCPG)。淋巴弥漫大B细胞膜淋巴肿(DLBC)、LAML和肩腺肿(THYM)仅有一个往南;剩余肿肿症特功能性2或3个往南,但其中会一些持保留意见。最确实的是PFI,可无保留地提拔给除LAML(无数据资料)、DLBC和KICH(谨慎采行)和PCPG(不提拔)均的4种。

请注意3 往南OS,PFI,DFI及DSS的分析与提拔采行

可验证TCGA-CDR及案举例应用领域

在乳腺肿肿研究者中会,雌激素ER阴功能性病变均科穴居期临床请注意现比ER+病变顶多。分别用OS、PFI、DFI和DSS来得这两类病变的穴居期(平面图3A–3D;直线截止于10年随访短时时有,但采行整个索引展开一原理)。单因素一原理所述了,采行PFI(p= 0.005)和DFI(p = 0.001)作为均科往南,TCGA中会ER+乳腺肿肿病变比ER-病变有更是好的穴居期,但采行OS时两类病变时有不存有相似之处(p = 0.097) 。此均,两类病变的DSS(p = 0.009)有突出相似之处,暗示DSS的潜在价取值。以上发现证实了PFI和DFI是特定特功能性乳腺肿肿大分子研究者的合适往南。

平面图3 可验证和应用领域实举例

此均还可验证了首当其冲功能性GBM穴居结果往南。TCGA中会GBM中会位OS为12.6个月底,介于此在此之前华盛顿邮报的规范病人的12.1个月底和规范病人联合替莫唑胺的14.6个月底之时有。中会位PFI是6.1个月底,介于此在此之前华盛顿邮报的规范病人5个月底和规范病人联合替莫唑胺的6.9个月底之时有。显然,TCGA索引OS和PFI政治事件短时时有与史料明确。随即印证OS和PFI作为GBM大分子研究者的均科往南效度。

用Cox比举例后果回归仿真确定高期(III、IV期)相比之下低期(I、II期)肿肿症病变的后果比(HR),可验证4个往南的TCGA-CDR数据资料。由于DFI判别与其它结果的判别不明确,对提拔采行OS、PFI和DSS的14种特功能性肿肿症来得logHR(请注意3)。随后仅有对保证Cox比举例后果论据的病症展开统计(平面图3E–3G)。试验中会,14种特功能性肿肿症中会,除时有皮肿(MESO)、PAAD和葡萄膜黑色素肿(UVM)均,高期对比低期HR在3个提拔往南OS、PFI及DSS上明显偏高。采行配对取样的Wilcoxon秩和检验,当采行PFI与DSS(p = 0.0008)或PFI与OS(p = 0.039)测量时,logHR有突出相似之处,所述了病症困难重重和穴居往南在HR上存有系统偏顶多;OS与DSS之时有很难突出相似之处(p = 0.106)。对2个logHR取值的规范误展开必是基本单位确定Pearson方面系数, 由logHR估计取值的3种结果有极突出正方面:PFI和OS方面系数0.96(95%置信区时有[CI]:0.77–0.99),PFI和DSS为 0.95(95%置信区时有:0.76–0.99),OS和DSS为0.90(95%置信区时有:0.61–0.98)。这些方面功能性潜在赞成均科以前用PFI,后期用OS和DSS做往南。

除了构建大分子数据资料,还尝试一原理首次病人后无病患与非无病患是不是出现不尽相异的取而代之政治事件。TCGA-CDR中会29类肿肿症个人信息用于妥善解决该弊端,纳入病变从诊断到启动首治并达到无病平衡状态据估计取值存活3个月底。以LUSC为举例,有289举例无病患和41举例长期非无病患,NTE亲率则有21.8%和68.2%。用Cox比举例后果回归仿真,发现在非无病患中会NTE后果突出大于无病患(HR = 6.68,95% CI = 4.25–10.51,FDR修正q取值<0.05)。在另均21种肿肿症特功能性中会也有相似结果(请注意4)。余下7种中会很难检视到这些相似之处。我们也在分析是不是每个仿真都保证比举例后果论据,其中会有两个不符合,能够研究者短时时有依赖及多变量仿真来寻觅因素。

请注意4 非无病与无病患NTE拓展对比

TCGA从全球数百个站点搜集病举例,为妥善解决均科数据资料不尽相异站点时有的威胁功能性,只需考虑数据资料完整功能性、和病变特质等。对每种病症而言,我们对比了在此之前两名包括病举例数最多的有组织来源不明站点(TSS)与所有其它TSS的同种病症及4个结果往南(请注意5)。

请注意5 对来自在此之前两位TSS的每个肿肿症特功能性研究者结果展开来得

对于GBM等极具首当其冲功能性的,在此之前两位TSS(#1和#2)的肾癌人群与其它TSS相比相似的有OS、PFI和DSS,因政治事件来得少难以一原理不提拔DFI做往南。BRCA等较低首当其冲功能性,顺势提拔采行PFI和DFI,但促请谨慎用OS或DSS分析。TSS #1的均科数据资料造成了不来得好的OS和DSS,但很难检视到PFI相似之处;另均,请注意面上TSS#1有更是好的DFI结果,仅有出现3举例 DFI政治事件。这种请注意里不一的情况暗示该站点的结果数据资料只需大幅度分析。另一方面,TSS #2的4个往南结果与其它地方明确。

这个简单的结果来得暗示,当从特定结果一原理整体TCGA的均科数据资料时,能够考虑TSS的实际个人信息。由于成年人、分期/分级及病人等因素影响不尽相异TSS患病人群的往南结果,TSS可以作为这些和不只不过均科注解等其它不曾测量相似之处的替代。

潜在的夹杂因素、竞争结果的

后果及仿真论据

对均科穴居往南一原理来说,促请采行所处理过程的全部均科数据资料。但相比大分子/线粒体数据资料的构建一原理,要请注意两个方面。首先,提拔意见基于基线穴居仿真,以大分子共通点作分析q划分取样集,有无论如何破坏结果统计的突出功能性相似之处。因此,从互相联系的TCGA大分子数据资料或共通点TCGA-CDR结果数据资料中会得出的论证只需在统一的索引中会大幅度证实。

第二,我们促请仅有采行原发的大分子数据资料,因为病变初诊时,极为重要短时时有个人信息等匹配的均科数据资料已搜集相比之下完整。请注意皮黑色素肿(SKCM)在TCGA特功能性中会非常特殊,470举例中会仅有103举例原发,其余296举例为原发全局肿瘤重取而代之分配,68举例远端重取而代之分配。这与较少搜集到重取而代之分配肿的其它TCGA肿肿症特功能性形成鲜明对比。SKCM重取而代之分配肿较少很强匹配的原发,而其它TCGA肿肿症特功能性尽管较少有重取而代之分配肿,但都很强匹配的原发取样。因此,对于SKCM结果的方面功能性,促请只采行受上限数目的原肾癌举例,尽管SCKM肿瘤重取而代之分配的III期病举例可作为统一两大展开研究者。

在采行取而代之构建的TCGA-CDR索引时,还能够请注意:潜在混淆因素、竞争结果的后果及仿真论据。

夹杂因素

夹杂因素存有但被无关在仿真之均时,偏顶多无论如何高估或低估真实。如在乳腺肿肿的种族相似之处研究者中会,有色人种与黑人病变之时有存有极为重要的基因请注意达相似之处,然而根据大分子共通点展开修正后,这种相似之处突出减缓甚至消失。治果也是潜在的夹杂因素,当个人信息可利用时应适当考虑修正。病人不曾知时,成年人、就诊所医院及诊断年份等规范病人作为替代个人信息能减缓部分标准顶多。对这方面的决策建模,激励采行标志物临床请注意现研究者促请报告(REMARK)。

竞争结果的后果

测量DSS、DFI和PFI往南时,要对很难经历极为重要政治事件且无病的被害病变展开审查。在这种情况下,如果论据病变很难其它尸检,那她/他最终仍无论如何死于肿肿症指征。然而,在估计取值病人等分析q对炎症肿肿症或心血管病症等非Index肿肿症被害后果的分析能力时,该论据并不可取。

仿真论据

应用领域Cox比举例后果(PH)仿真必须核查PH论据。除少数案举例均,大多数仿真都保证Cox PH论据,但只需大幅度冒险这些个案以找出违背论据的因素,从而对HR作出更是准确的估计取值。尽管并不曾为清理数据资料和妥善解决弊端付出了巨大努力,但仍存有极为重要的采行上限,采访TCGA均科数据资料都必须明了这些上限。

首先,TCGA主要是为大分子研究者设计,最初病举例并不只需要来自多个机构很强合适备用有组织的不曾病人原肾癌举例,因此这些病举例不看成连续功能性。此均,对于每种不尽相异特功能性/研究者,随访数据资料很难统一搜集。同时,均科数据资料搜集的一些规则在从前不得不随着短时时有的推移而改变。TCGA - CDR不包含肿肿症病人史,并非所有病举例都被注解。因此,一原理特定特功能性或共通点的病人背景比不上概况功能性泛肿肿一原理。当病变展开实际病人时,受益能用DFI和PFI往南合理一原理。

其次,TCGA取样均科随访根据当地诊所的短日前,无论如何为病症或特定部位的中风和病人极为重要全人类平衡状态的记录,因此很难TCGA选定的均科随访著手,仅有所述了单项主要合理化的大分子特质。

最后,几乎所有TCGA获得的取样和线粒体及大分子数据资料来自取而代之诊病变原发的单个切片,由此造成了的线粒体和大分子数据资料不能在空时有或短时时有任何方面明确捕捉代请注意另一病变结果变量的异质功能性。该弊端不是TCGA独有的,任何线功能性上皮细胞研究者都存有。

展望

这项工作是有史以来第一次全面系统地处理过程TCGA泛肿肿均科参考资料。由此造成了的TCGA-CDR的结果往南与统一非TCGA研究者结果明确,所述该资源在空在此之前数量的均科尺度上包括了生物学探测取而代之视角。也要确信TCGA-CDR的内在采行在实践中及这两项指导和提拔意见。并不曾非常含蓄,人类病症不曾来大数量的大分子研究者必须系统地搜集均科有组织学、病人和原于政治事件数据资料,以坚持最高规范的均科研究者。尽管有其在实践中,TCGA-CDR包括了规范化索引,以及清晰的4个均科结果往南导出,并妥善解决了质量弊端,从而在泛肿肿和生殖水平上展开转化研究者。不曾来数据资料研究者的融合将提高结果之时有的威胁功能性,更是好地解释和赞成单调。

参考参考资料

An Integrated TCGA Pan-Cancer Clinical Data Resource to Drive High-Quality Survival Outcome Analytics

延伸阅读
肚子疼不来元月 元月不调怎么办
每个月初大姨妈要来的前几天亦会肚子痛,但直到现在却只痛不来更年期是没事呢?如果是长时长的出现这种痛经的因素就应该马上的完成近期的高血压,...[详细]
2022-05-04
贝安身体健康:出现这些症状可能是子宫腺肌症
乳腺腺肌症给女同性恋的家庭带来很多便利,轻微的还都会因素到女同性恋生孩子,那么注意到哪些呕吐确实是乳腺腺肌症呢?现在贝安健康晓晓带着大...[详细]
2022-05-03
十人九痔,不用去治?痔疮的造成危害,你知道吗?
传统文化中医学定义皮肤病病与现代医学有一定的区别,中医看来所有的肛肠类型病症都归入皮肤病和痔瘘两大类。皮肤病是一类很容易诱导的肛肠病症...[详细]
2022-05-02
腰痛原因多,不只是肾脏问题,以下异常成因,对照下自己
在生活里面,哮喘是很常见的症状,很多人上就会有哮喘的弊端,更是是对于久坐的上班族和遗传基因较弱的里面老年人群来说,哮喘不必要已经视作“...[详细]
2022-05-02
内膜内膜增厚的原因和危害以及怎么治疗
阴道腹腔略为的理由包括血清素变化、使用血清素类抑制剂和糖尿病等,心血管或者血糖偏高的高血压也似乎再次出现阴道腹腔略为的具体情况,这些高...[详细]
2022-05-02
避孕药吃了更年期会推迟多久 它有什么副作用
我们都知道止痛药主要的抑制作用是避孕套,它是才会对成年人的月末经转化成不良影响的。有些成年人由于一些情况需要将月末经推延,才会换用这种...[详细]
2022-04-27
结核性淋巴结炎该如何治疗和病患
结核性淋巴炎,一般叫作淋巴核,是一种小儿和普通人的常见疾病。确诊主因主要有患病、内分泌问题等等,症状主要的表后曾就是淋巴肿胀或者发炎化...[详细]
2022-04-26
怎么于今盆腔炎 盆腔炎 于今方法
粘液炎是男人经常常时会遇到的一种妇科疾病,而且粘液炎也时会有规律住院,这让男人病患者异常常自觉。那么,怎么兴粘液炎呢?上面,跟着小编一起...[详细]
2022-04-25
28部诊脉顺口溜,易记易懂
来源/基层医师公社作者/安康百草堂主治医师在病理因素的影响下,人体脉气反映了不同的脉象,称为病理脉象,称为病脉。脉象名称难以记忆完整准确...[详细]
2022-04-25
  • 地区医院
  • 医院联盟