TCGA癌症临床数据资源全面简述---癌症研究领域的全谱!

2021-10-13 09:46 来源:葫芦岛妇科医院

2006年,胃乳癌真核生物学左图谱(The Cancer Genome Atlas, TCGA)计划以多形病态胶质母细胞核糙(GBM)、肺表皮细胞核乳癌(LUSC)和卵巢浆液病态囊腺乳癌(OV)开始为期3年的试点工程项目,2009年~2015年更进一步展开。到工程项目月内,TCGA网络研究成果工先为者已描绘成了33种胃乳癌各种类型10,000余举例病变的病冶分子可特质,并概念了很多病冶分子可流感病毒。TCGA包含的流行病学关键特质代详见泛化的数据集查阅。为确保于是以确用做这些具真核生物学特质的多种形式流行病学数据集,近期TCGA进行时一批重大成果,刊发在CellPress旗下的期刊。

本文对4年初5日刊发Cell上的一文顺利进行编译。评论阐释以OS(总穴居期)、PFI(无进展间隙)、DFI(无病间隙)和DSS(营养不良系统性存活)为四个主要流行病学结果起点的TCGA泛胃乳癌流行病学数据集人力(TCGA-CDR)规范数据集库,并给不止了每种胃乳癌各种类型的起点用做详见示同意。TCGA流行病学数据集可从真核生物学数据集共享内部空间(GDC)该网站下载,所有的分子可数据集在下载。流行病学数据集和分子可数据集用做同样的名片构件,便于病变的流行病学详细资料和采样分子可数据集拆分。

TCGA泛乳癌数据集库表头特质

左图1A为流行病学数据集拆分和新工具及4个主要流行病学起点相异和指标的流程左图,对33份初始申请和97份更更进一步数据集文件,共33种胃乳癌各种类型111,60举例胃乳癌病变的详细资料顺利进行了妥善处理。详见1为每个TCGA表头的基本特质。按原发先为冶采样根据分子可特质选入每个表头,眼部脑糙(SKCM)的原发和移转到冶两种各种类型都有,其它极较少数病冶的原发与移转到各种类型也有研究成果。

左图1. 流行病学数据集拆分和新工具及4个主要流行病学起点相异和指标流程左图

详见1. TCGA 泛乳癌表头特质

流行病学结果起点OS、PFI、DFI和DSS

总穴居期(OS)很最重要,特点是概念OS惨剧时模糊病态最低。但用做OS先为起点确实丧失流行病学研究成果,因为非乳癌尸检并不一定能反映不止病冶生物学学、摧残病态或对疗法消除。用做OS或须短的随访短时间;很多流行病学试验里,通常换用比起之下随访短时间较短的DFI或PFI。针对除此以外TCGA流行病学数据集,要体认到短时流行病学随访间隙在摧残病态胃乳癌各种类型结果的最重要病态,因为确实几年内就通过观察到流行病学惨剧,在幸存者同一短时间已不止现病情复发或进展。对摧残病态较弱的胃乳癌各种类型,病变在数十乃至几十年后复发,随访期间确实未能能通过观察足以惨剧以支持者确实结果只能供辨别。该分析工具的用意是监测TCGA泛乳癌流行病学抗菌监测的比起之下优势和欠缺,指导今后的分析工具和避免随访间隙短时间欠缺等缺点。

分析工具全部TCGA流行病学数据集后,论断如下:在数据集可赢得时,OS、PFI及DFI比起之下精确,但多数只能只能估计DSS。左图1B为33种多种不同胃乳癌各种类型的OS K-M曲面。尽管穴居分析工具不是TCGA主要用意,多数胃乳癌各种类型穴居曲面与过往指标相同穴居起点的单独研究成果基本相同,GBM、OV(2008, 2011)和低AO胶质糙(LGG)(2015)的TCGA结果就是比较好举例证。PFI、DFI和DSS的K-M曲面见左图1C–1E。

左图1 B-E流行病学数据集分析工具

基于每种胃乳癌各种类型4个起点的通过观察短时间算出平均随访短时间及惨剧或监测的里位短时间(详见2)。所有病冶的里位随访短时间为22.1个年初,但多种不同各种类型胃乳癌该短时间区别不小;GBM和急病态髓系白血病(LAML)最短约12个年初,而大肠嫌色细胞核乳癌(KICH)最多约48个年初。

详见2 总体里位随访短时间及4个起点的惨剧与通过观察里位短时间

自荐用做的流行病学结果起点

流行病学结果起点选择一般来说研究成果用意、惨剧生产量、表头大小和结果数据集恒星质量。将这些工具和开发的其它工具先为为对单个营养不良数据集库的飞行测试和补充监测,给不止在每种营养不良各种类型里用做每个结果起点的详见示同意及主因(详见3)。每种胃乳癌各种类型的穴居起点无须多于通过一个主要飞行测试和补充监测才被接受。33种乳癌里的13种用做全部4个起点:膀胱尿路上皮乳癌(BLCA)、卵巢表皮细胞核乳癌(CESC)、结肠乳癌(COAD)、食管乳癌(ESCA)、头颈部表皮细胞核乳癌(HNSC)、大肠乳头状细胞核乳癌(KIRP)、肺腺乳癌(LUAD)、LUSC、OV、胰腺乳癌(PAAD)、肉糙(SARC)、胃腺乳癌(STAD)和子宫内膜乳癌(UCEC)。意味著,很难一个起点的有嗜铬细胞核糙和副皮质糙(PCPG)。呼吸道病冶弥漫大B细胞核乳癌症(DLBC)、LAML和胸腺糙(THYM)只能一个起点;多余胃乳癌各种类型2或3个起点,但其里一些持意见分歧。最确实的是PFI,可无保留地自荐给除LAML(无数据集)、DLBC和KICH(果断用做)和PCPG(不自荐)外的4种病冶。

详见3 起点OS,PFI,DFI及DSS的指标与自荐用做

于是以确性TCGA-CDR及案举例领域

在乳腺乳癌研究成果里,睾酮ER阴病态病变流行病学穴居期预后比ER+病冶病变差。分别用OS、PFI、DFI和DSS比起较这两类病冶病变的穴居期(左图3A–3D;曲面月内于10年随访短时间,但用做整个数据集库顺利进行分析工具)。单诱因分析工具标示出,用做PFI(p= 0.005)和DFI(p = 0.001)先为为流行病学起点,TCGA里ER+乳腺乳癌病变比ER-病变有更高的穴居期,但用做OS时两类病变间不不存在区别(p = 0.097) 。此外,两类病变的DSS(p = 0.009)有并不大区别,详见明DSS的潜在价值。以上推测表明了PFI和DFI是特定各种类型乳腺乳癌分子可研究成果的合适起点。

左图3 于是以确性和领域实举例

此外还于是以确性了摧残病态GBM穴居结果起点。TCGA里GBM里位OS为12.6个年初,介于此同一短时间报导的标准规范疗法的12.1个年初和标准规范疗法联合替莫唑胺的14.6个年初彼此之间。里位PFI是6.1个年初,介于此同一短时间报导的标准规范疗法5个年初和标准规范疗法联合替莫唑胺的6.9个年初彼此之间。显然,TCGA数据集库OS和PFI惨剧短时间与文献一致。再次印证OS和PFI先为为GBM分子可研究成果的流行病学起点效度。

用Cox比举例危险病态复出仿真已确定高期(III、IV期)比起之下低期(I、II期)胃乳癌病变的危险病态比(HR),于是以确性4个起点的TCGA-CDR数据集。由于DFI概念与其它结果的概念不一致,对自荐用做OS、PFI和DSS的14种各种类型胃乳癌比起较logHR(详见3)。随后只能对满足Cox比举例危险病态断言的营养不良顺利进行统计数据(左图3E–3G)。结果详见明,14种各种类型胃乳癌里,除间皮糙(MESO)、PAAD和葡萄膜脑糙(UVM)外,高期对比低期HR在3个自荐起点OS、PFI及DSS上值得注意低。换用一组采样的Wilcoxon秩和检验,当用做PFI与DSS(p = 0.0008)或PFI与OS(p = 0.039)测算时,logHR有并不大区别,标示出营养不良进展和穴居起点在HR上不存在系统偏差;OS与DSS彼此之间很难并不大区别(p = 0.106)。对2个logHR值的标准规范误顺利进行必是加权平均已确定Pearson平均数, 由logHR估计的3种结果有极并不大于是以系统性:PFI和OS平均数0.96(95%数学工具[CI]:0.77–0.99),PFI和DSS为 0.95(95%数学工具:0.76–0.99),OS和DSS为0.90(95%数学工具:0.61–0.98)。这些区别病态潜在支持者流行病学中期用PFI,后期用OS和DSS好好起点。

除了拆分分子可数据集,还在此之后分析工具首次疗法后无病病变与非无病病变是否不止现多种不同的另行病冶惨剧。TCGA-CDR里29类胃乳癌资讯用做化解该问题,归属于病变从病人到进行时首治并降至无病状态多于存活3个年初。以LUSC为举例,有289举例无病病变和41举例长期非无病病变,NTE率分别为21.8%和68.2%。用Cox比举例危险病态复出仿真,推测在非无病病变里NTE危险病态并不大高于无病病变(HR = 6.68,95% CI = 4.25–10.51,FDR调整q值<0.05)。在另外21种胃乳癌各种类型里也有类似结果(详见4)。余下7种病冶里很难通过观察到这些区别。我们也在指标是否每个仿真都满足比举例危险病态断言,其里有两个不不符,无须研究成果短时间依赖及多表达式仿真来寻找主因。

详见4 非无病与无病病变NTE的发展对比

TCGA从全球数百个接入查阅病举例,为化解流行病学数据集多种不同接入间的可比病态,须考虑数据集完整病态、病冶和病变特质等。对每种营养不良而言,我们对比了同一短时间两名提只能供病举例数最多的组织比如说接入(TSS)与所有其它TSS的同种营养不良及4个结果起点(详见5)。

详见5 对来自同一短时间两位TSS的每个胃乳癌各种类型研究成果结果顺利进行比起较

对于GBM等颇具摧残病态的病冶,同一短时间两位TSS(#1和#2)的发先为成年人与其它TSS比起类似的有OS、PFI和DSS,因惨剧太较少难于分析工具不自荐DFI好好起点。BRCA等更高摧残病态病冶,顺势自荐用做PFI和DFI,但详见示同意果断用OS或DSS指标。TSS #1的流行病学数据集消除还好的OS和DSS,但很难通过观察到PFI区别;另外,详见面上TSS#1有更高的DFI结果,只能不止现3举例 DFI惨剧。这种详见里不一的现像详见明该接入的结果数据集须更进一步指标。另一各个方面,TSS #2的4个起点结果与其它地方一致。

这个简单的结果比起较详见明,当从特定结果分析工具整体TCGA的流行病学数据集时,无须考虑TSS的具体资讯。由于比率、病冶分阶段/AO及疗法等诱因影响多种不同TSS卧床成年人的起点结果,TSS可以先为为这些和不基本上流行病学注释等其它未能测算区别的替代。

潜在的群集诱因、竞争者结果的

危险病态及仿真断言

对流行病学穴居起点分析工具来说,详见示同意用做所妥善处理的全部流行病学数据集。但比起分子可/真核生物学数据集的拆分分析工具,要注意两个各个方面。首先,自荐意见基于孔径穴居仿真,以分子可流感病毒先为预期q分为采样集,有确实毁损结果统计数据的并不大病态区别。因此,从互系统性联的TCGA分子可数据集或病冶流感病毒TCGA-CDR结果数据集里得不止的论断须在单独的病冶数据集库里更进一步表明。

第二,我们详见示同意只能用做原发先为冶的分子可数据集,因为病变初诊时,最重要短时间资讯等转换的流行病学数据集已查阅比起之下完整。眼部脑糙(SKCM)在TCGA病冶各种类型里并不特殊,470举例病冶里只能103举例原发先为冶,其余296举例为原发先为冶局部呼吸道结移转到,68举例远端移转到。这与很较少查阅到移转到糙的其它TCGA胃乳癌各种类型形成;也。SKCM移转到糙很较少具有转换的原发先为冶,而其它TCGA胃乳癌各种类型尽管很较少有移转到糙,但都具有转换的原发采样。因此,对于SKCM结果的区别病态,详见示同意只用做有限生产量的原发先为举例,尽管SCKM呼吸道结移转到的III期病举例可先为为单独两大顺利进行研究成果。

在用做另行拆分的TCGA-CDR数据集库时,还无须注意:潜在混淆诱因、竞争者结果的危险病态及仿真断言。

群集诱因

群集诱因不存在但被排除在仿真于是以因如此时,偏差确实高估或毫无疑问真实抗菌。如在乳腺乳癌的种族区别研究成果里,美国黑人与黑人病变彼此之间不存在最重要的基因详见达区别,然而根据分子可流感病毒顺利进行调整后,这种区别并不大减低甚至消失。疗法效果也是潜在的群集诱因,当资讯可赚取时应适当考虑调整。疗法相符时,比率、诊治医院及病人年份等标准规范疗法先为为替代资讯能减低部分误差。对这各个方面的决策仿真,提倡用做病冶标志物预后研究成果详见示同意报告(REMARK)。

竞争者结果的危险病态

测定DSS、DFI和PFI起点时,要对很难经历最重要惨剧且无病的幸存者病变顺利进行审查。在这种只能,如果断言病变很难其它尸检,那她/他最终仍确实死于胃乳癌指征。然而,在估计疗法等预期q对继发先为态胃乳癌或心血管营养不良等非百分比胃乳癌幸存者危险病态的预期能力时,该断言并不可取。

仿真断言

领域Cox比举例危险病态(PH)仿真必须监测PH断言。除较少数案举例外,大多数仿真都满足Cox PH断言,但须更进一步聚焦这些传染病以找不止抵触断言的主因,从而对HR好好不止更准确的估计。尽管仍然为清理数据集和化解问题付不止了很大帮助,但仍不存在最重要的用做限制,访问TCGA流行病学数据集都必须了解这些限制。

首先,TCGA主要是为分子可研究成果设计,最初病举例选择来自多个机构具有合适库存组织的未能疗法原发先为举例,因此这些病举例不密切系统性连续病态。此外,对于每种多种不同病冶各种类型/研究成果,随访数据集很难统一查阅。同时,流行病学数据集查阅的一些原则上在过往不愿随着短时间的推移而彻底改变。TCGA - CDR不包含胃乳癌疗法史,并非所有病举例都被注释。因此,分析工具特定病冶各种类型或流感病毒的疗法背景优于概要病态泛乳癌分析工具。当病变顺利进行具体疗法时,受益能用DFI和PFI起点有效病态分析工具。

其次,TCGA采样流行病学随访根据当地诊所的短时间详见,确实为营养不良或特定部位的复发和病人最重要生命状态的记录,因此很难TCGA指定的流行病学随访计划,只能给不止工程项目主要忽视的病冶分子可特质。

仍要,几乎所有TCGA赢得的病冶采样和真核生物学及分子可数据集来自另行诊病变原发先为冶的单个切片,由此消除的真核生物学和分子可数据集不用在内部空间或短时间任何各个方面确切猎捕代详见另一病变结果表达式的病冶异质病态。该问题不是TCGA独有的,任何实例原发先为态病冶研究成果都不存在。

全面性

这项工先为是全世界第一次更进一步核心内容妥善处理TCGA泛乳癌流行病学详细资料。由此消除的TCGA-CDR的结果起点与单独非TCGA研究成果结果一致,说明该人力在空同一短时间规模的流行病学尺度上提只能供了生物学观测者另行视角。也要体认到TCGA-CDR的内在用做局限病态及关键病态指导和自荐意见。仍然并不仅仅只是,进化营养不良未能来会大规模的分子可研究成果必须核心内容查阅流行病学病理、疗法和转给惨剧数据集,以坚持最高标准规范的流行病学研究成果。尽管有其局限病态,TCGA-CDR提只能供了规范数据集库,以及清晰的4个流行病学结果起点导不止,并化解了恒星质量问题,从而在泛乳癌和个体水平上顺利进行转化研究成果。未能来会数据集研究成果的融合将提高结果彼此之间的可比病态,更高地推论和支持者反复。

参考详细资料

An Integrated TCGA Pan-Cancer Clinical Data Resource to Drive High-Quality Survival Outcome Analytics

TAG:
延伸阅读
不孕不育的干细胞治疗~幼体的冷冻保存和冷冻的胚胎移
持续发展,作为精密的卵巢里面医的有性、卵胞浆内单乳腺施打、再生生殖细胞复制出生地的老年人数量骤然缩减。之外是,越来越多的病变选取再生生...[详细]
2022-05-10
附件炎性包块的病征有什么
对于之前结婚后的女持续性朋友来说,很容易就都会患有附件炎这种结核病,这跟女持续性朋友生育的状况是关的的。因此,若是有患儿感上附件炎持续...[详细]
2022-05-05
附件炎有什么症状表现 早知道早病人
未婚的附件常指的就是十二指肠和十二指肠,当十二指肠和十二指肠发生炎症的时候也就是我们所说的附件炎了。附件炎是未婚很常见的妇科疾病之一,...[详细]
2022-05-04
高血压?低血钾?这种不易被重视的疾病则有
如何病人恶连续性肿突起酪氨酸激增综合症 恶连续性肿突起酪氨酸激增综合症(缩写原醛综合症)是指肝脏皮质激芝过量酪氨酸激芝,造成机体潴钠排...[详细]
2022-05-03
女性痛经要如何更为严重?别再只会那句“多喝热水”了
痛经这种常见的医学不适腹泻的频发,时会导致男性朋友在更年期其间或者是经期前后,消失极为引人注意的下口部痉挛性瘙痒、腰酸以及下腹坠胀不适...[详细]
2022-05-02
孕妈当心!小心妊娠期碰上炎
怀孕妇抗性弱,异味多,怀孕妇尘并不少见,一旦牵涉到,瘙痒,痒到怀疑人生;白带异常,尴尬道捶胸顿足,格外不快的是由于顾忌怀孕妇,医生所在...[详细]
2022-05-02
潘集阳:“绝经期抑郁症”不可掉以轻心
潘集阳 自觉心理科所长医师查阅名医介绍盖住名医介绍暨南大兼修附属第一诊所名医介绍:所长医师,27年从医经验,各种难治性忧郁、病态障碍医疗机构...[详细]
2022-04-28
月经不渐进是什么回事?
排卵是男人彻交通要道的正常环境因素阶段,在排卵,男人由于生殖细胞基本功能的逐步复苏,原本法则的迟于才会日益越来越非常少,事与愿违完全停...[详细]
2022-04-27
产检很顺利,33周子宫却突然破裂…一场肉体竞速在这里上演
12年底24日,西方节日里头的平安夜,但对于红房子养老院有机体解剖诊疗陈好护士及其小组的护士来感叹,算是“惊魂二次世界大战”。当天较早上7点...[详细]
2022-04-26
  • 地区医院
  • 医院联盟