本文来自作者[admin]投稿,不代表东辰文化立场,如若转载,请注明出处:http://www.mzwhys.cn/wiki/202506-3120.html
没有使用统计方法来预先确定样本量。实验不是随机的,研究人员在实验和结果评估过程中并未对分配视而不见。
组织源位点(TSS)在补充信息S1.1中列出 。在2011年12月1日至2013年12月23日之间,收集了食道肿瘤并运送到中央生物测量核心资源(BCR)。从未接受以前的化疗或放射治疗的患者中获得样品。每个冷冻的原发性肿瘤标本都有一个伴随的正常组织标本(血液或血液成分 ,包括在TSS上提取的DNA) 。还为一部分患者提交了邻近的非肿瘤食道组织。
根据美国癌症第七版联合委员会登台System44,案件进行了案件。对每个肿瘤和邻近的正常组织样品(如果有)进行病理质量控制(如果有的话),以确认肿瘤标本在组织学上与食道癌一致 ,并且相邻的组织标本中没有肿瘤细胞 。肿瘤样品的肿瘤样品肿瘤核和≤20%坏死的肿瘤样品被提取用于核酸提取。
DNA和RNA共隔离,并在中央BCR上评估质量,如前所述(参考文献27中的补充S1.1)。使用定制的序列SNP面板或AmpFististifiler(Applied Biosystems)来验证代表一例病例的肿瘤DNA和生殖线DNA是从同一患者中得出的 。通过RNA6000纳米测定法(Agilent)分析RNA以确定RNA完整性数 ,并且仅包括具有完整性数≥7.0的分析物。仅包括至少产生6.9μg肿瘤DNA,5.15μg的RNA和4.9μg的生殖线DNA的病例。
BCR从总共322例食管癌病例中接受了具有种系对照的肿瘤样品,其中185例根据BCR病理综述和分子特征获得了合格 。案例的分布和质量控制在补充图1.1中显示。在合格的185例病例中 ,有171例用于基因组分析,因为在独立病理审查(在下面的“专家病理学评论”中描述)或发现临床或分子丧失率后,排除了14例。
在171例合格案例中 ,有58例匹配的非肿瘤食管组织可用。提取核酸后用残留肿瘤组织的样品考虑用于蛋白质组学分析 。如果有的话,将10至20毫克的一块与分子测序和表征相邻的较开的肿瘤相邻,以进行反相蛋白阵列分析。我们将这171种食道腺癌与388种类似特征的胃腺癌(补充图1.1)进行了比较。
美国俄亥俄州哥伦布市的全国儿童医院的BCR评估了合格的食管腺癌肿瘤衍生的DNA样品中的微卫星不稳定性(MSI) 。进行了MSI单核苷酸测定法测试了一个四个单核苷酸重复基因座(聚载氨酸片BAT25,BAT26 ,BAT26,BAT40和转化生长因子II型)和三个二核苷酸重复基因座(CA重复序列(D2S123,D5S346和D17S250中))。
该研究中包括的所有癌症的第二次癌症均由专家病理学家委员会审查 ,该委员会由七位经验丰富的胃肠道病理学家(R.O.,S.Mcc。,Z.Z. ,J.K.,J.K.,L.T. ,M.B.P 。和J.W.)进行了审查。使用在全国儿童医院的BCR中容纳的Aperio幻灯片扫描仪建造了集中的虚拟病理审查系统。通常,对本研究提取了所有材料的肿瘤组织两侧的两个冷冻切片,并扫描并审查了另外一个高质量的福尔马林固定石蜡包裹的组织截面 。两名委员会成员在纳入研究之前对所有案件进行了审查。对于有差异结果的案件 ,分配了决胜局审稿人。
根据世界卫生组织的消化系统肿瘤分类,所有食管癌均被归类为鳞状或腺癌,第四版 。在病理审查的基础上排除了9例病例,其中包括四个病例 ,其中质量控制确定了不充分的分析材料,只有观察到非侵入性肿瘤的两个病例,以及两个病例 ,其中肿瘤是根据可供审查的材料无法分类的。作为本综述的一部分,作为该小组最初发表的分析的一部分,尚未经过病理综述的另外77个胃腺癌综述也受到了以前进行的病理重新审查。27。
根据每种肿瘤类型(ESCC或EAC)的标准 ,两名审阅者对临床分期进行了评估44 。T,N和M状态以及肿瘤等级(0、1 、2或3)基于TSS的病理报告。
进一步审查了GEJ附近具有潜在起源的TCGA收集物中的所有腺癌(食道或胃),以完善其解剖位置。病理报告是从TSSS获得的 ,其切除术或内窥镜活检时具有原始的总体病理描述 。两名独立的临床审查员审查了每份TSS病理学报告。根据补充信息S1.2中概述的标准,将肿瘤归类为食道,可能是食管 ,不确定,可能的胃或胃。为了进行下游分析,食管和可能的食管以及胃和可能的胃 。
如前所述46,基于Affymetrix SNP 6.0上的每个肿瘤或种系样品的DNA分析进行分析。作为拷贝数评估和分割过程的一部分 ,通过应用从我们的卵巢癌分析中的TCGA种系样品或该集合中样本中的TCGA种系样品产生的过滤器来消除与种系拷贝数变化相对应的区域。用GISIS 2.0算法22对RECLITHM22进行反复宽和局灶性SCNA的分析,在R中进行聚类,在欧几里得距离的基础上 ,使用Ward的方法,使用Ward的方法在重复的变化峰上使用阈值拷贝数,均以先前报道的27 。使用绝对算法47计算等位基因拷贝数 ,纯度和倍数估计。如果肿瘤至少拥有一个臂级损失(除了18p,18q或21的肿瘤,它们具有高染色体不稳定性 ,即SCNA-HIGH,它们在低和高拷贝数事件的肿瘤中复发),而另外则是SCNA-LOW。如果至少80%的臂丢失或获得了至少0.15的相对log2拷贝比的变化 ,则认为染色体臂被认为改变了(Shih等人,未发表的观测值) 。这种对副本编号不稳定性分类的方法与先前描述的复制名称群集27具有93%的一致性。
基因组DNA(每个样品1μg)进行了基硫酸盐修饰,经过质量控制,并使用Illumina Infinium DNA甲基化平台Human-Methylation450进行了分析 ,如补充信息S2所述。生成的数据文件在补充信息S2.3中列出。
使用DNA甲基化和RNA-Seq数据进行了CDKN2A(也称为P16INK4)表观遗传沉默调用 。根据位于P16INK4启动子CPG岛的探针(CG13601799),在每个样品中评估CDKN2A DNA甲基化状态。P16INK4表达通过其第一个外显子的LOG2(RPKM+1)水平(CHR9:21974403–21975132)确定。如补充信息S2中所述,对每个样品进行表观遗传沉默调用是通过评估散点图 ,显示DNA甲基化和表达之间的反相关性 。
外显子和全覆盖的全基因组测序分配在两个测序中心之间。以胃腺癌(即TSS标记的Stad)为TCGA的样品被送在Broad Institute进行测序。在华盛顿大学测序了标记为食道癌(即ESCA)的样品 。每个中心负责使用其他过滤产生肿瘤和正常DNA样品的BAM文件,以去除测序过程的可能伪像。从这些BAM文件中,四个不同的TCGA分析站点执行了不同的突变和插入/缺失检测程序。这些独特的称呼措施工作的结果被整合在一起以生成一个共同的突变注释文件 ,以进行后续分析 。参见补充部分S3.1。
如前所述,使用Agilent Sureselect Human All Exon V5 Kit进行了从肿瘤中进行0.5至3μgDNA的全异位测序,然后在Illumina HISEQ平台上进行2×76 bp配对的末端测序。对于全基因组测序 ,在同一平台上测序了2×101 bp的读数 。使用以前发布的27年发布的27。首先使用竞赛48对比对进行质量控制,以避免肿瘤和种系DNA样品的错误宣传,或在肿瘤样品之间进行交叉污染。进一步分析了仅估计交叉污染的样品少于5%。
如先前所述 ,使用NimbleGen Seqcap EZ Exome Exome库v3.0与其他120-MER IDT自定义探针相结合的DNA(例如,HPV,EBV,EBV) ,在80%的Illumina Hiss flof of Illumina Hisq 2000的范围中,使用NimbleGen seqcap EZ人类外显库v3.0构建了全外观测序和全基因组光明文库 。外显子。使用BWA V0.5.9对每个车道或子道数据对齐。到GRCH37-LITE +登录目标病毒(ftp://genome.wustl.edu/pub/reference/grch37-lite_wugsc_variant_2/) 。
BAM文件(用于外显子测序)用于四个不同分析中心的突变:华盛顿大学,加利福尼亚大学圣克鲁斯分校和不列颠哥伦比亚癌症局(如补充方法S3.1所述)。
如上所述 ,每个分析中心的过滤呼叫被合并,并过滤并去除了1000个基因组项目报告的种系SNP位点。此外,对于普通种系BAM ,除去了参考等位基因覆盖率小于8倍的推定变体,或大于一个体细胞变体支持读数或1%的体细胞变体等位基因分数 。对于肿瘤BAM,最少需要两个辅助读数和5%的变异等位基因分数。进行了由于8-氧气素伪影引起的推定的虚假突变调用 ,以去除归因于这些测序人工制品的候选突变。进一步过滤的去除的候选突变是通过对非塑性DNA样品的同类测序来鉴定的,以去除替代的人工制品或未经过滤的种系调用 。对于所有其余的新型推定变体生成了读数计数,如果这些变体符合上述最小覆盖率 ,最大覆盖范围和变体等位基因分数要求,则将这些变体纳入最终突变注释文件中。
使用Gencode V18使用Oncotator(http://www.broadinstitute.org/cancer/cga/oncotator)进行突变的功能注释。使用mutsiGCV2.0算法13鉴定出明显的反复突变基因 。
如补充信息S3.2中所述,使用贝叶斯非阴性基质分解算法进行突变签名发现,用于突变签名分析。
使用Covaris E220 Ultrasonicator将基因组DNA(每个样品500-700 ng)剪切到250 bp片段中 ,然后使用卡帕(Kapa)生物试剂盒(Perkinelmer)机器人NGS Suite(Partek Genomics)根据制造商的协议,使用KAPA Bio套件转换为配对的Indermina库。所有图书馆均使用每个车道的一个样品在HISEQ2000上进行了测序,配对端2×51 bp读取长度。肿瘤DNA及其匹配的正常DNA通常在同一流动池上加载 。将原始数据转换为FASTQ格式 ,并使用BWA对齐(TO HG19)如前所述生成BAM文件(参考文献27中的补充S3.6)。使用两种算法,分别是breakdancer50和meerkat51进行结构重排的检测。每个肿瘤样品中的一组结构变体调用通过其匹配的正常DNA的调用过滤,以去除生殖线变体 。然后使用MEERKAT算法对数据进行重新检查 ,该算法必须识别至少两个不一致的读对,其中一对涵盖了实际断点连接。在简单或卫星重复中发现的变化也被排除在外。(该分析中的候选融合基因在补充表7中显示了补充表7中结构变化的列表 。)
如前所述生成mRNA序列数据(参考文献27中的补充S5.1)。为了结合食道,胃和头颈肿瘤的聚类分析 ,北卡罗来纳大学基因组表征中心用其mapsplice/rsem Pipeline 32重新加工了胃腺癌和食道癌数据。如前所述,我们从mRNA序列数据中生成了候选融合事件(参考文献27中的补充S5.4),除了我们使用了Transabyss v1.4.8(http://wwwwwwwww..bcgsc.ca/platform/bioinfo/bioinfo/software/software/trans-abyss/releleass/relealeass/releases/1.4.4.8) 。
为了识别各种队列中的亚型 ,我们使用pheatmap v1.0.2在R中使用层次聚类。在每种情况下,输入是每百万个外显子的读数,每百万个外显子读取映射到转录组(RPKM)数据矩阵的最高25%最多可变基因,该基因的平均值大于10 rpkm。我们通过log10(rpkm+1)将矩阵的每一行转换 ,然后使用pheatmap来缩放行 。我们将Ward.D2用于聚类方法和相关性和欧几里得距离度量分别用于聚类列和行。我们使用未配对的微阵列(SAMR V2.0)的未配对的两类显着性分析鉴定了差异表达的基因,其RPKM输入矩阵和错误的发现率阈值为0.05。
为了比较食管癌的亚型与HNSCC52和肺鳞状细胞(LUSC)肿瘤的既定亚型53,使用质心基因表达曲线用于通过HNSCC批准将90个食管鳞状瘤分为90种食管鳞状瘤;LUSC分类和基础 ,古典,原始和分泌。在HNSCC质心使用的839个基因中,有809个与ESCC数据集中的基因重叠 。此外 ,在用于LUSC预测质心的209个基因中,有202个与ESCC数据集中的基因重叠。然后,我们为每个基因集生成了90个ESCC肿瘤样品的RPKM矩阵。这些矩阵以log2转换并以中值为中心 。最后 ,我们计算了矩阵和HNSCC和LUSC质心中每一列之间的Pearson相关性。
为了评估相对于其他肿瘤类型的食管mRNA表达,我们通过从Stad,ESCA和HNSC同龄人中最大化的RNA测序结合了RNA测序。首先是通过器官 ,然后通过组织学(腺癌或鳞状)订购的样品,然后通过胃癌分类(EBV,MSI,GS或CIN类别)进行订购 ,最后是通过HPV状态 。我们在食管癌样本中选择了前25%最大的基因(按变异系数),平均表达式大于1,000 RSEM归一化计数。我们通过log10(RSEM+1)将矩阵的每一行转换,然后使用pheatmap缩放和群集行。
我们如前所述生成microRNA序列数据(参考文献27中的补充S6.1) 。为了识别我们各个队列中的亚型 ,我们使用pheatmap v1.0.2在R中使用层次聚类。在每种情况下,输入是每个群体中每个人群中最大的方差的303 mirbase v16 5p或3p成熟链的每个读数(rpm)数据矩阵。我们通过log10(rpm+1)将矩阵的每一行转换,然后使用pheatmap来缩放行 。我们将Ward.D2用于聚类方法和相关性和欧几里得距离度量分别用于聚类列和行。为了分析食管与胃癌和头颈癌的分析 ,我们在食管癌样品集中使用了前25%(〜300)最可变的5p或3p成熟的链Microranas54。我们通过log10(rpm+1)将矩阵的每一行转换,然后使用pheatmap来缩放行。为了聚集行,我们使用了ward.d2和欧几里得距离度量 。
从肿瘤中分离出来的蛋白质被用来通过前面描述的方法(参考文献27中的补充S7)制备具有187种经过验证的原代抗体的反相蛋白阵列。将数据标准化 ,并按照补充部分S4进行了群集分析。
我们使用了两种工具来检查整个外观和RNA序列数据,以了解微生物序列:BBT(BiobloomTools,v1.2.4.b1)和PathSeq 。这些分析的详细信息在S5补充节中提供。如前所述 ,使用内部管道分析了microRNA数据(参考文献27中的补充S9.2)。
我们对基因表达进行了途径级分析,以比较EAC和ESCC样品 。作为基因组,途径是从国家癌症研究所的途径相互作用数据库(NCI-PID)获得的55。使用Kruskal – Wallis单向方差分析的P值,将EAC与ESCC进行比较。对于224个途径中的每一个 ,基因级P值是通过基于Fisher的组合统计量来产生途径级复合评分的方法进行对数转换和总结的 。然后,通过对每种NCI-PID途径的10,000个随机生成的途径进行类似评分,并具有匹配的途径大小 ,从经验上估算了该分数的统计显着性。
为了发现哪些肿瘤样品在平台上共享分子特征,使用了以下四种集成聚类方法:ICLUSTER,多个内核学习K-均值(MKL K-Means)(MKL K-均值) ,超级群集和聚类分配的聚类(COCA)。在ICLUSTER方法10,56,57中,通过其表示为联合多元回归中的潜在变量,发现了亚组 。MKL K-均值将K-均值聚类算法与使用编码样品之间相似性的内核来定义用于分类肿瘤的特征。超集群和可口可乐都使用从单个分子平台得出的簇来形成每个样本的总体分类描述 ,但是它们的细节有所不同,例如用于比较这些样品的指标。超级集群进行方差调整,使每个分子平台都具有相同的权重 ,而在此处和以前使用的可口可乐(参考文献27中的补充S10.2)的实现使用了一种加权方法,该方法考虑了每个平台特定类别中分区的粒度。有关这些方法的更多详细信息,请在补充部分S7中给出 。
可以从TCGA手稿出版页面下载(https://tcgaga-data.nci.nih.gov/docs/publications/publications/esca_2016),从TCGA手稿出版页面下载了用于生成此处提供的分析的主要和处理的数据。
赞 (1)
评论列表(4条)
我是东辰文化的签约作者“admin”!
希望本篇文章《食管癌的综合基因组表征》能对你有所帮助!
本站[东辰文化]内容主要涵盖:生活百科,小常识,生活小窍门,知识分享
本文概览: 没有使用统计方法来预先确定样本量。实验不是随机的,研究人员在实验和结果评估过程中并未对分配视而不见。 组织源位点(TSS)在补充信息S1.1中列出。在2011年1...