战。基于新一代测序技术能够无假设、高分辨率地分析基因组,其快速融入肿瘤药物的发现和开发进程也就不足为奇了。 癌症研究概览7:癌症生物学 摘要:
大规模并行测序的出现为我们带来了一个前所未有的工具,让我们有望解开癌症的病因和机制。对整个基因组测序是发现癌症中所有变异的终极方法。假如覆盖度足够深,研究人员可以确定没有突变会被漏掉,而且宝贵的样品也无需在未来重新测序。全基因组测序的数据还能与ChIP-Seq测序数据相整合,大大扩展分析范围。 癌症生物学
大规模并行测序的出现为我们带来了一个前所未有的工具,让我们有望解开癌症的病因和机制。对整个基因组测序是发现癌症中所有变异的终极方法。假如覆盖度足够深,研究人员可以确定没有突变会被漏掉,而且宝贵的样品也无需在未来重新测序。全基因组测序的数据还能与ChIP-Seq测序数据相整合,大大扩展分析范围。mRNA-Seq提供了一种强大的互补技术,以确定遗传改变是否影响关键基因的表达水平,或融合基因是否转录,检测基因融合是一种假设驱动的研究方法,它具有一些独特的优势。首先与全基因组测序相比,mRNA-Seq产生的序列数据要少得多;其次其测序文库不包含许多难以测序的元件,如重复区域和多聚核苷酸序列区域。这种方法也有潜在的不足,即只有抽样时融合基因表达才能被检测到,这对那些受激素刺激的癌症(如乳腺癌)特别重要。在药物靶点的研究发现中,当我们假设只有表达的基因才会影响疾病后果时,这将是一种筛查大量患者的高效经济的方法。
Schweiger, M. R., Kerick M., Timmermann B. and Isau M. (2011) The power of NGS technologies to delineate the genome organization in cancer: from mutations to structural variations and epigenetic alterations. Cancer metastasis reviews 30: 199–210
作者全面回顾了癌症基因组学的现状以及大规模并行测序在肿瘤学中的应用,提出了临床和基础研究的未来前景。作为讨论的基础,研究人员对10位患者多个病变中的206个重排进
行了基因分型。他们在转移开始之前的原发肿瘤中就发现了许多重排,因此重排存在于转移全过程。对于一些患者,有证据表明原发肿瘤中启动转移的细胞存在不断的克隆进化,而其他患者在肿瘤细胞转移中也表现出克隆进化的迹象,为转移中器官特异的突变提供证据。 器官特异的突变有两种解释。第一种,特定的基因型可能驱动转移到特定器官。两位患者的肺部转移与其他的司机突变(MYC或CCNE1的扩增)相关联,表明来自携带有这些重排的亚群的肿瘤细胞更有可能在肺部存活。第二种,转移扩散可能是一个分步的过程,更容易在器官边界发生,而不是器官之间。这些解释并不是互相排斥的。克服障碍移植到某一特定器官可能取决于有着适应性改变的癌细胞亚群,它们一旦出现,就能相对轻松地在整个器官传播。
癌症研究概览8:基因融合 摘要:
基因融合在基因组中非常普遍,也是一些类型癌症的标志。它是由两个不相关的基因融合形成的一种基因产物,具有全新的功能或与两个融合前基因不同的功能。一个强启动子与一个下游功能基因(原癌基因)的融合在某些癌症中是普遍的。目前有几种测序的方法用于研究融合基因,如肿瘤的全基因组测序和mRNA-Seq。 基因融合
基因融合在基因组中非常普遍,也是一些类型癌症的标志。它是由两个不相关的基因融合形成的一种基因产物,具有全新的功能或与两个融合前基因不同的功能。一个强启动子与一个下游功能基因(原癌基因)的融合在某些癌症中是普遍的。创建融合基因的机制与生成基因的功能一样多变。据估计半数的前列腺癌含有TMPRSS2和ETS转录因子家族成员之间的融合。目前有几种测序的方法用于研究融合基因,如肿瘤的全基因组测序和mRNA-Seq。 全基因组测序研究的成功要点:
利用Illumina的测序技术很容易检测基因融合,其中末端配对(PE)测序的应用对成功检测融合基因尤为关键。全基因组测序及末端配对序列是目前检测所有基因融合的最准确、最全面的工具,这些基因融合包括了重复、倒位、覆盖和单碱基插入缺失。
全基因组测序在发现全新的基因融合断裂点方面更胜一筹,测序的深度和更长的测序序列实现了在融合连接单元单碱基的分辨率,为研究产生融合的机制提供了线索。这一能力是测序所独有的。
mRNA-Seq是一种非常高效的方法,能为大量样品的筛查提供一种相对经济高效的途径。mRNA-Seq研究一般基于高表达融合基因将有着最大生物学影响的假设,它对检测高表达
癌基因特别有效,但仅限于有着polyA尾巴的基因,很难获得基因间隔区域和UTR区域上的信息。
大多数RNA-Seq分析比对的算法假设RNA序列中的所有相关序列片段均来自同一个染色体,而基因融合的两个基因往往来自两个不同染色体,例如断裂-融合-桥接循环所产生的基因融合。对于这类情况,传统算法往往无法检测或正确拼接。
许多研究使用培养的细胞系,肿瘤细胞系更是癌症研究的常规工具,但这些细胞系能在多大程度上代表原发肿瘤仍不清楚。天生不稳定的细胞系经过长时间培养后可积累大量突变,而培养过程中种群减少所造成的遗传瓶颈又会大大加速突变的累积。
目前大部分发表的研究所包含的样品数量是非常少的,所以大部分测序研究被认为是假设推导生成的。在测序实验的设计中,许多未解决的问题仍然存在,例如我们还不清楚在测序实验中如何应用多重检验纠正。随着更多的测序信息出现,大部分癌症类型可根据其分子表型划分为几种亚型,这使得实验本身的作用严重降低,而可靠分析所需的样品数量却大大增加。我们预计未来为获得统计学上可靠的的结果,测序实验的样本量会非常大,达到成千上万。 基因组突变
所有癌症在发展过程中都会积累大量体细胞突变,其中司机突变是对癌症发展很关键的体细胞改变,而剩下的就被称为乘客突变。目前研究人员已经编制出一些癌症类型的体细胞突变综合目录。
Berger, M.F., Lawrence M. S., demichelis F., Drier Y., Cibulskis K., et al. (2011) The genomic complexity of primary human prostate cancer. Nature 470: 214 - 220
这篇文章展示了一些原发性人类前列腺癌及其配对正常组织的完整基因组序列。一些肿瘤包含复杂的平衡重排链(拷贝数中性),它们发生在已知癌基因中或附近。一些断裂点发生在基因间区域,可能会被靶定外显子测序的方法错过。在88%的病例中,融合点可定位到单碱基分辨率。最常见的融合类型涉及到一个精确连接,其重排连接处既无重叠也无插入序列。这一结果与乳腺肿瘤中所发现的模式不同,后者最常见的连接涉及到一个2-3 bp的微同源序列,这表明前列腺癌和乳腺癌负责产生这些融合的机制是不同的。这篇文章例证了有些突变只有通过全基因组测序才能检测出来。 癌症研究概览9:染色体碎裂 摘要:
染色体破裂是一个一次性的细胞危机,成百上千个基因组重排在单次事件中发生。这种灾难性事件的后果是复杂的局部重排和拷贝数变异,其范围限制在0-2个拷贝。这种单一灾
难性事件的模式不同于癌症发展逐步积累突变的典型模式。在突变积累的癌症发展模式中,拷贝数无上限,因此通常可看到很大范围的差异。 染色体碎裂
染色体破裂是一个一次性的细胞危机,成百上千个基因组重排在单次事件中发生。这种灾难性事件的后果是复杂的局部重排和拷贝数变异,其范围限制在0-2个拷贝。这种单一灾难性事件的模式不同于癌症发展逐步积累突变的典型模式。在突变积累的癌症发展模式中,拷贝数无上限,因此通常可看到很大范围的差异。据估计,染色体破裂发生在2-3%的癌症的多个亚型中,以及~25%的骨癌中。 实验设计上的注意事项:
染色体重排的复杂性和随机性让它成为一种很难研究的现象。应当使用末端配对和mate-pair(长距离末端配对)技术建库的全基因组深度测序方法。
Rausch, T., Jones D. T., Zapatka M., Stutz A. M., Zichner T., et al. (2012) Genome Sequencing of Pediatric Medulloblastoma Links Catastrophic DNA Rearrangements with TP53 Mutations. Cell 148:59–71
作者报道了一名Sonic-Hedgehog恶性脑肿瘤成神经管细胞瘤(SHH-MB)患者的大量、复杂的染色体重排,该患者带有生殖细胞系TP53突变(Li-Fraumeni综合征)。在对11名Li-Fraumeni综合征患者的进一步筛查中,36%的肿瘤表现出与染色体破裂一致的重排,这比一般肿瘤群体所观察到的2%染色体破裂发生率要高得多。P53生殖细胞系的突变与一些肿瘤中染色体破裂导致凋亡中止的假说是一致的。
Illumina测序技术:GAIIx和HiSeq 2000系统,paired-end和mate-pair方法测序 染色体重排
染色体重排需要DNA双链断裂和一定方式的排列连接。这些事件破坏了基因组的完整性,经常参与形成白血病、淋巴瘤和肉瘤。多个个体中特异基因之间基因融合的反复出现表明,这些基因在细胞周期的某个阶段必定靠得很近。
Hakim, O., Resch W., Yamane A., Klein I., Kieffer - Kwon K. R., et al. (2012) DNA damage defines sites of recurrent chromosomal translocations in B lymphocytes. Nature 作者通过测定了小鼠B淋巴细胞中的相关参数研究了细胞核结构和DNA损伤频率在染色体易位发生中的作用。在缺乏经常性的DNA损伤时,Igh或Myc与其他所有基因之间的易位与它们的接触频率直接相关;相反,与经常性位点指向的DNA损伤相关的易位与DNA断裂形成的速率成正比,这通过损伤位点的复制蛋白An积累就能测定出来。因此,非定向重