TCGA癌症临床数据资源全面介绍---癌症研究课题领域的全谱!

2021-10-12 05:39 来源:益阳妇科医院

2006年,大肠恶连续性癌线粒体绘出谱(The Cancer Genome Atlas, TCGA)著手以多形连续性胶质母蛋白质突起(GBM)、大肠鳞状蛋白质恶连续性癌(LUSC)和卵巢浆液连续性囊腺恶连续性癌(OV)开始为期3年的自贸区项目,2009年~2015年一新一轮展开。到项目截止,TCGA网络平台分析工则有者已描述了33种大肠恶连续性癌特连续性10,000余亦然高血压的肿突起底物特质,并表述了很多肿突起底物非典型。TCGA包含的眼疾理决定连续性特质代请特别注意时两者之间推移的数据集得来。为必要正确用到这些具线粒体特质的海量眼疾理数据集,最近TCGA收尾一批重大成果,发请特别注意在CellPress旗下的期刊。

本文对4年底5日发请特别注意Cell上的一文顺利进行程序代码。短文阐述以OS(总肉食动物期)、PFI(无困难重重较宽)、DFI(无眼疾较宽)和DSS(疾眼疾就其活过)为四个主要眼疾理结果终点站的TCGA泛大肠恶连续性癌眼疾理数据集资源(TCGA-CDR)基本数据集库,并给出了每种大肠恶连续性癌特连续性的终点站用到促请。TCGA眼疾理数据集可从线粒体数据集共享维度(GDC)门户网站订阅,所有的底物数据集在订阅。眼疾理数据集和底物数据集用到同样的条码构造,便于高血压的眼疾理数据和结果显示底物数据集拆分。

TCGA泛恶连续性癌数据集库队列特质

绘出1A为眼疾理数据集拆分和汇总基本概念及4个主要眼疾理终点站派生和安全检查和的流程绘出,对33份初始核发和97份后续数据集文件,共33种大肠恶连续性癌特连续性111,60亦然大肠恶连续性癌高血压的数据顺利进行了管控。请特别注意1为每个TCGA队列的基本特质。按原发肿突起结果显示根据底物特质选入每个队列,面部黑色素突起(SKCM)的原发和移转到故称两种特连续性都有,其它极不及数肿突起的原发与移转到特连续性也有分析。

绘出1. 眼疾理数据集拆分和汇总基本概念及4个主要眼疾理终点站派生和安全检查和流程绘出

请特别注意1. TCGA 泛恶连续性癌队列特质

眼疾理结果终点站OS、PFI、DFI和DSS

总肉食动物期(OS)很举足轻重,特性是表述OS血案时模糊连续性最低。但用到OS则有终点站显然巩固科学分析,因为非恶连续性癌案发时不一定能反映出肿突起生物学、首当其冲连续性或对疗法缓解。用到OS或需更长的随访较宽时两者之间;很多眼疾理试验当中,不一定改用相非常随访较宽时两者之间较短的DFI或PFI。针对现有TCGA眼疾理数据集,要意识到短时眼疾理随访较宽在首当其冲连续性大肠恶连续性癌特连续性结果的举足轻重连续性,因为显然几年内就特别注意到到眼疾理血案,在丧生前已出现眼疾情患上或困难重重。对首当其冲连续性较弱的大肠恶连续性癌特连续性,高血压在数十乃至几十年后患上,随访期两者之间显然无法特别注意到充分血案以支应以简单结果供确实。该汇总分析的目的是安全检查TCGA泛恶连续性癌眼疾理疗效检测的相非常军事优势和过剩,导师理应的汇总分析和可能会随访较宽较宽时两者之间过剩等弱点。

汇总分析全部TCGA眼疾理数据集后,论断如下:在数据集可得到时,OS、PFI及DFI相非常简单,但多数只能仅仅少于DSS。绘出1B为33种极为相同大肠恶连续性癌特连续性的OS K-M弧线。尽管肉食动物汇总分析不是TCGA主要目标,多数大肠恶连续性癌特连续性肉食动物弧线与只不过安全检查和相同肉食动物终点站的单独分析大致相同,GBM、OV(2008, 2011)和低层次胶质突起(LGG)(2015)的TCGA结果就是比较好值得特别注意。PFI、DFI和DSS的K-M弧线见绘出1C–1E。

绘出1 B-E眼疾理数据集汇总分析

基于每种大肠恶连续性癌特连续性4个终点站的特别注意到较宽时两者之间计算平均随访较宽时两者之间及血案或安全检查的当中位较宽时两者之间(请特别注意2)。所有肿突起的当中位随访较宽时两者之间为22.1个年底,但极为相同特连续性大肠恶连续性癌该较宽时两者之间关联不小;GBM和急连续性髓系白血眼疾(LAML)最短约12个年底,而胃嫌色蛋白质恶连续性癌(KICH)最长约48个年底。

请特别注意2 总体当中位随访较宽时两者之间及4个终点站的血案与特别注意到当中位较宽时两者之间

举荐用到的眼疾理结果终点站

眼疾理结果终点站可选择取决于分析目标、血案量、队列尺寸和结果数据集质量。将这些则有法和开发的其它则有法则有为对单个疾眼疾数据集库的试验和补充安全检查,给出在每种疾眼疾特连续性当中用到每个结果终点站的促请及主因(请特别注意3)。每种大肠恶连续性癌特连续性的肉食动物终点站需至不及通过一个主要试验和补充安全检查才被做。33种恶连续性癌当中的13种用到全部4个终点站:胃尿路上皮恶连续性癌(BLCA)、乳头鳞状蛋白质恶连续性癌(CESC)、结肠恶连续性癌(COAD)、食管恶连续性癌(ESCA)、头颈部鳞状蛋白质恶连续性癌(HNSC)、胃乳头状蛋白质恶连续性癌(KIRP)、大肠腺恶连续性癌(LUAD)、LUSC、OV、胰腺恶连续性癌(PAAD)、肉突起(SARC)、胃腺恶连续性癌(STAD)和子宫内膜恶连续性癌(UCEC)。只不过,从未一个终点站的有嗜铬蛋白质突起和副小脑突起(PCPG)。上皮蛋白质肿突起充斥大B蛋白质上皮蛋白质突起(DLBC)、LAML和胸腺突起(THYM)极少一个终点站;剩余大肠恶连续性癌特连续性2或3个终点站,但其当中一些应以保留意愿。最简单的是PFI,可无保留地举荐给除LAML(无数据集)、DLBC和KICH(严肃用到)和PCPG(不举荐)内外的4种肿突起。

请特别注意3 终点站OS,PFI,DFI及DSS的安全检查和与举荐用到

有效性TCGA-CDR及案亦然运用做

在乳腺恶连续性癌分析当中,雌激素ER阴连续性高血压眼疾理肉食动物期眼疾理表现比ER+肿突起高血压差。分别用OS、PFI、DFI和DSS非常这两类肿突起高血压的肉食动物期(绘出3A–3D;弧线截止于10年随访较宽时两者之间,但用到整个数据集库顺利进行汇总分析)。单主因汇总分析结果显示,用到PFI(p= 0.005)和DFI(p = 0.001)则有为眼疾理终点站,TCGA当中ER+乳腺恶连续性癌高血压比ER-高血压有更容易的肉食动物期,但用到OS时两类高血压两者之间不长期存在关联(p = 0.097) 。此内外,两类高血压的DSS(p = 0.009)有显着关联,请特别注意明DSS的潜在价最大值。以上特别注意到猜测了PFI和DFI是特定特连续性乳腺恶连续性癌底物分析的最合适终点站。

绘出3 有效性和运用做实亦然

此内外还有效性了首当其冲连续性GBM肉食动物结果终点站。TCGA当中GBM当中位OS为12.6个年底,介于此前另据的常规疗法的12.1个年底和常规疗法联合替莫唑胺的14.6个年底当中两者之间。当中位PFI是6.1个年底,介于此前另据的常规疗法5个年底和常规疗法联合替莫唑胺的6.9个年底当中两者之间。显然,TCGA数据集库OS和PFI血案较宽时两者之间与文献一致。再一印证OS和PFI则有为GBM底物分析的眼疾理终点站效度。

用Cox比重不确定连续性回归静态断定高期(III、IV期)相非常低期(I、II期)大肠恶连续性癌高血压的不确定连续性比(HR),有效性4个终点站的TCGA-CDR数据集。由于DFI表述与其它结果的表述不一致,对举荐用到OS、PFI和DSS的14种特连续性大肠恶连续性癌非常logHR(请特别注意3)。随后极少对实现Cox比重不确定连续性理论上的疾眼疾顺利进行汇总(绘出3E–3G)。结果请特别注意明,14种特连续性大肠恶连续性癌当中,除两者之间皮突起(MESO)、PAAD和葡萄膜黑色素突起(UVM)内外,高期对比低期HR在3个举荐终点站OS、PFI及DSS上值得特别注意偏高。改用选取结果显示的Wilcoxon秩和安全检查和,当用到PFI与DSS(p = 0.0008)或PFI与OS(p = 0.039)测量时,logHR有显着关联,结果显示疾眼疾困难重重和肉食动物终点站在HR上长期存在系统错误;OS与DSS当中两者之间从未显着关联(p = 0.106)。对2个logHR最大值的常规误以为顺利进行引加权平均断定Pearson就其系数, 由logHR少于的3种结果有极显着正就其:PFI和OS就其系数0.96(95%常规差[CI]:0.77–0.99),PFI和DSS为 0.95(95%常规差:0.76–0.99),OS和DSS为0.90(95%常规差:0.61–0.98)。这些就其连续性潜在支应以眼疾理早期用PFI,后期用OS和DSS想到终点站。

除了拆分底物数据集,还试着汇总分析首次疗法后无眼疾高血压与非无眼疾高血压前提出现极为相同的一新肿突起血案。TCGA-CDR当中29类大肠恶连续性癌讯息用做解决难题该难题,纳入高血压从安全检查和到收尾首治并远超无眼疾平衡状态至不及活过3个年底。以LUSC为亦然,有289亦然无眼疾高血压和41亦然长期以来非无眼疾高血压,NTE率并列21.8%和68.2%。用Cox比重不确定连续性回归静态,特别注意到在非无眼疾高血压当中NTE不确定连续性显着高于无眼疾高血压(HR = 6.68,95% CI = 4.25–10.51,FDR调整q最大值<0.05)。在另内外21种大肠恶连续性癌特连续性当中也有十分相似结果(请特别注意4)。余下7种肿突起当中从未特别注意到到这些关联。我们也在安全检查和前提每个静态都实现比重不确定连续性理论上,其当中有两个不相一致,需分析较宽时两者之间缺少及多函数静态来寻找主因。

请特别注意4 非无眼疾与无眼疾高血压NTE蓬勃发展对比

TCGA从世界数百个站点得来眼疾亦然,为解决难题眼疾理数据集极为相同站点两者之间的可比连续性,需考虑到数据集值得特别注意连续性、肿突起和高血压特质等。对每种疾眼疾而言,我们对比了前两名给予眼疾亦然数最多的的组织来源站点(TSS)与所有其它TSS的同种疾眼疾及4个结果终点站(请特别注意5)。

请特别注意5 对来自前两位TSS的每个大肠恶连续性癌特连续性分析结果顺利进行非常

对于GBM等极富首当其冲连续性的肿突起,前两位TSS(#1和#2)的发眼疾人群与其它TSS相非常十分相似的有OS、PFI和DSS,因血案太不及不能汇总分析不举荐DFI想到终点站。BRCA等很低首当其冲连续性肿突起,强力举荐用到PFI和DFI,但促请严肃用OS或DSS安全检查和。TSS #1的眼疾理数据集归因于不太好的OS和DSS,但从未特别注意到到PFI关联;另内外,请特别注意面上TSS#1有更容易的DFI结果,极少出现3亦然 DFI血案。这种请特别注意里不一的情形请特别注意明该站点的结果数据集需实质连续性安全检查和。另一之外,TSS #2的4个终点站结果与其它;也一致。

这个简单的结果非常请特别注意明,当从特定结果汇总分析整体TCGA的眼疾理数据集时,需考虑到TSS的完全一致讯息。由于比率、肿突起分期/分级及疗法等主因影响极为相同TSS患眼疾人群的终点站结果,TSS可以则有为这些和不完全眼疾理编者等其它未测量关联的替代。

潜在的参杂主因、市场竞争结果的

不确定连续性及静态理论上

对眼疾理肉食动物终点站汇总分析来说,促请用到所管控的全部眼疾理数据集。但相非常底物/线粒体数据集的拆分汇总分析,要特别注意两个之外。首先,举荐意愿基于终端肉食动物静态,以底物非典型则有计算位点划分结果显示集,有显然破坏结果汇总的显着连续性关联。因此,从相互两者之间关联的TCGA底物数据集或肿突起非典型TCGA-CDR结果数据集当中算出的论断需在单独的肿突起数据集库当中实质连续性猜测。

第二,我们促请极少用到原发肿突起的底物数据集,因为高血压初诊时,举足轻重较宽时两者之间讯息等比如说的眼疾理数据集已得来相非常值得特别注意。面部黑色素突起(SKCM)在TCGA肿突起特连续性当中极为十分相似,470亦然肿突起当中极少103亦然原发肿突起,其余296亦然为原发肿突起局部上皮蛋白质移转到,68亦然远端移转到。这与常常得来到移转到突起的其它TCGA大肠恶连续性癌特连续性演化成一时期。SKCM移转到突起常常具有比如说的原发肿突起,而其它TCGA大肠恶连续性癌特连续性尽管常常有移转到突起,但都具有比如说的原发结果显示。因此,对于SKCM结果的就其连续性,促请只用到受限制量的原发眼疾亦然,尽管SCKM上皮蛋白质移转到的III期眼疾亦然可则有为单独组群顺利进行分析。

在用到一新拆分的TCGA-CDR数据集库时,还需特别注意:潜在混淆主因、市场竞争结果的不确定连续性及静态理论上。

参杂主因

参杂主因长期存在但被排除在静态之内外时,错误显然忽视或低估真实疗效。如在乳腺恶连续性癌的有色人种关联分析当中,白人与黑奴高血压当中两者之间长期存在举足轻重的基因请特别注意达关联,然而根据底物非典型顺利进行调整后,这种关联显着减不及甚至消失。疗法效果也是潜在的参杂主因,当讯息可借助时应适当考虑到调整。疗法相符时,比率、名医医院及安全检查和年数等常规疗法则有为替代讯息能减不及部分误以为差。对这之外的管理者可视化,鼓励用到肿突起;也眼疾理表现分析促请份文件(REMARK)。

市场竞争结果的不确定连续性

测定DSS、DFI和PFI终点站时,要对从未经历举足轻重血案且无眼疾的丧生高血压顺利进行审查。在这种只能,如果理论上高血压从未其它案发时,那她/他最终仍显然死于大肠恶连续性癌指征。然而,在少于疗法等计算位点对继发连续性大肠恶连续性癌或心血管疾眼疾等非Index大肠恶连续性癌丧生不确定连续性的计算灵活性时,该理论上极为可取。

静态理论上

运用做Cox比重不确定连续性(PH)静态不必安全检查PH理论上。除不及数案亦然内外,大多数静态都实现Cox PH理论上,但需实质连续性探究这些美国疾病控制与预防中心以找出遵从理论上的主因,从而对HR则有出更准确的少于。尽管从未为搬运数据集和解决难题难题蒙受了庞大帮助,但仍长期存在举足轻重的用到上限,次访问TCGA眼疾理数据集都不必理解这些上限。

首先,TCGA主要是为底物分析设计,最初眼疾亦然可选择来自多个机构具有最合适库存的组织的未疗法原发眼疾亦然,因此这些眼疾亦然不看成连续连续性。此内外,对于每种极为相同肿突起特连续性/分析,随访数据集从未统一得来。同时,眼疾理数据集得来的一些比赛规则在只不过不愿随着较宽时两者之间的发生变化而彻底改变。TCGA - CDR不包含大肠恶连续性癌疗法史,并非所有眼疾亦然都被编者。因此,汇总分析特定肿突起特连续性或非典型的疗法背景优于概略连续性泛恶连续性癌汇总分析。当高血压顺利进行完全一致疗法时,受益需用DFI和PFI终点站有效汇总分析。

其次,TCGA结果显示眼疾理随访根据当地诊所的较宽时两者之间请特别注意,显然为疾眼疾或特定指甲的患上和眼疾人举足轻重一个人平衡状态的记录,因此从未TCGA而无须的眼疾理随访著手,极少给出项目主要强调的肿突起底物特质。

之后,完全所有TCGA得到的肿突起结果显示和线粒体及底物数据集来自一新诊高血压原发肿突起的单个切片,由此归因于的线粒体和底物数据集不能在维度或较宽时两者之间任何之外明确捕获代请特别注意另一高血压结果函数的肿突起异质连续性。该难题不是TCGA近似于的,任何一个系统原发连续性肿突起分析都长期存在。

展望

这项工则有是有史以来第一次一新一轮着重管控TCGA泛恶连续性癌眼疾理数据。由此归因于的TCGA-CDR的结果终点站与单独非TCGA分析结果一致,所述该资源在空前覆盖面的眼疾理维度上给予了生物观测者一新视角。也要意识到TCGA-CDR的内在用到局限连续性及极其举足轻重导师和举荐意愿。从未极为明晰,人类疾眼疾期望大覆盖面的底物分析不必着重得来眼疾理眼疾理、疗法和转归血案数据集,以坚应以高达常规的科学分析。尽管有其局限连续性,TCGA-CDR给予了基本数据集库,以及清晰的4个眼疾理结果终点站导出,并解决难题了质量难题,从而在泛恶连续性癌和生物体水平上顺利进行生成分析。期望数据集分析的融合将更高结果当中两者之间的可比连续性,更容易地表述和支应以重复。

参考数据

An Integrated TCGA Pan-Cancer Clinical Data Resource to Drive High-Quality Survival Outcome Analytics

TAG:
延伸阅读
哪些人易患冠心病?希望“黑名单”上没有你!
冠心病?希望“逃犯”上没有你!">近来,今后冠心病发病率急剧飙升。冠心病对人类身心健康有极大的危害,而且这种危害平常是在无意中中的再次发...[详细]
2022-05-05
卵巢囊肿病变吃什么可以调养身体
乳腺囊肿的治疗法也是必须根据病征的体质来立即的,才用什么样的分析方法来治疗法必须综合病征的完全一致持续性,而在平时病征都是可以通过菜肴...[详细]
2022-05-04
急性子院中膜炎的症状有什么
急性期胎盘上皮细胞药的高血压非常明显,以咳嗽最是常见,主要乃是粘液区外咳嗽,当然,胎盘上皮细胞药也还有其他方面的高血压,比如,相比常见...[详细]
2022-05-03
排卵期杂色有血丝是怎么回事
男人在处于排卵期周期时肌肉内的卵细胞亦会从卵巢上面排出去,具备着受精的能力。一些男人在排卵期周期时不太可能亦会用到白斑有血丝的具体情况...[详细]
2022-05-02
子宫小肠炎吃什么药好
乳腺血管壁哑是一种常见的妇科疾病,划分急性和慢性两种,病因未详,临床表现有月经过多,严重痛经、白带增多、腰骶部腰痛等。经检验,可见乳腺...[详细]
2022-05-02
检验查出卵巢囊肿,与夫妻生活有关系吗?该如何进行治疗?
据明白,生殖细胞病变是显现出来在生殖细胞躯干的病变,显现出来该疾病后要进行详细的检查和。明白生殖细胞病变的拓展情况,并通过正确地护理人...[详细]
2022-04-28
门诊故事 | 阴部瘙痒警惕阴部白斑,针药并治可见功
ml>门诊有众多男性高尸压被龟头肿胀拖累,这种肿胀剧烈满脸,医学不外断检查又没有提醒有凝。龟头拔燥、肿胀、皲裂、刺不止,越挠越痒,病程迁延...[详细]
2022-04-27
中科中南部干细胞研究院: 干细胞如何调理亚健康 ?
「亚生活品质」本来是一个批评者概念,因为按照世界卫生组织起来的生活品质定义,几乎不能人是完正因如此生活品质的。都是的「亚生活品质」一词...[详细]
2022-04-26
流血不简单!子宫内膜出血怎么了?
在生活中,我们都知道,女性朋友的健康,也威胁着一些伤害,但你知道,有一些子宫内膜出血,也是一种非常常见的妇科疾病,但对女性来说,很多人...[详细]
2022-04-25
  • 地区医院
  • 医院联盟