简明回顾:人类干细胞中的基因组不稳定
性:目前的情况及将来的挑战
ABSTRACT
人们已经认识到,基因组的不稳定性是基于干细胞的疗法进行扩展的最重要障碍之一。最近几年,不断积累的证据表明人类干细胞在体外培养条件下经历了多种生物学变化程序,包括染色体数量和结构上的异常,点突变端粒长度的变异,以及表观遗传上的不稳定。随着这一领域向前发展,对与人类基因组可塑性有关的风险因素的认识,非常有力地支持将广泛基因组筛查作为质控平台的一部分,以证明基于干细胞产品的安全性。本文中,我们做了一次及时而广泛的回顾,回顾这一领域的现状及正在出现的趋势,最终,强调了采用新调控标准的必要性,这种调控标准可以使治疗性应用的开发途径更为安全有效。
INTRODUCTION
再生医学的广阔天地为使用干细胞和/或其子代来替代被疾病损伤的组织带来了令人兴奋的前景,这种取代要么是通过细胞整合(移植成活)到目标组织中,以及/或者是利用细胞产生可溶性信号分子的能力。干细胞可以源自多种组织,也就是可以来自胚胎组织及成体组织。首先从胚球内侧细胞团中分离出了人类胚胎干细胞(hESCs)[1],已知的是它自我更新的能力以及它的多能性,它可以产生胚胎的三个胚层(内胚层,中胚层,外胚层)能产生的所有细胞类型。hESCs为替换治疗,疾病建模,以及药物筛查带来了巨大的希望,但最近几年人们发现了相当多的关于染色体畸变的令人心烦意乱的数据,这些数据还伴有显著的伦理争议,它们妨碍了对这些细胞的研究及临床应用。2006年Takahashi与Yamanaka揭示了用异位共表达已知的转录因子将体细胞重编程为胚胎样状态的可行性[2]。这种方法避免了子宫外胚胎损伤,对获取这些被称为诱导性多能干细胞(iPSCs)的热情,一定程度上掩盖了与重编程过程相关的高突变率[3]。按现有的了解情况,hESCs和人iPSCs(hiPSCs)在基因,表观遗传,以及转录水平上有微妙的区别。不过,这种区别是意味深长的,或仅仅是,打个比方说,不同培养环境所造成的结果,这个问题还悬而未决。
此外,最近几年里,人类成体干细胞,比如造血干细胞(HSCs),间质干/基质细胞(MSCs),神经干细胞(NSCs),表皮干细胞或皮肤干细胞,在整个成年期的组织里不同的微环境中被发现,为能够支持组织的维持与再生的静止期祖细胞提供了另一种来源。这些多能干细胞中的某些类型,比如HSCs或MSCs,也可在新生组织中发现,比如胎盘或是脐带血。但是,如同在多能干细胞中的那样,不断出现的证据表明这些细胞在体外培养扩张期间,基因异常和转换表现出时间依赖性累积现象。
在这种情况下,非常值得注意的是,不考虑细胞类型,体外扩张期间的质量控制对干细胞治疗方面在临床上更安全地实施十分关键。欧洲药品管理局在其“对基于干细胞药物的反思”一文中强调了与操作步骤及多能细胞和体细胞培养有关的致癌潜能,并做了一份关于进行细胞遗传学分析以及评估参数的建议,这些评估参数包括端粒酶活性,增殖能力,以及衰老状态[4]。关于国际干细胞银行的提议要解决同样的议题[5],它设想建立一个关于标准化优良操作的全球性网络,以便干细胞的存储与分配。在这件事上,美国食品与药品管理局(FDA)的失职情况还在不断恶化,越来越多的诊所往往在没有什么控制力的司法权下进行操作,并用一些未经证明的疗法来应对无数的病理情况(见[6])。在某些例子中,缺乏健全
而可靠的科学追踪,引起了致命的后果[7]。
这里,我们对评估基因完整性的方法做了一个简要总结,然后对已经报道的各种发现做了一个最新的,全面的回顾,因此深入关注了hESCs,hiPSCs以及人类成体干细胞中的基因组不稳定性问题。我们也讨论了研究的瓶颈以及未来的趋势。
评估基因组完整性的常用方法——简要回顾
最常用来评估基因组完整性的技术,从本质上都是基于细胞遗传学分析和DNA分析的。传统的核型被认为是发现非整倍体(异倍体),多倍体,以及其它大型染色体失衡。通常这涉及到对有丝分裂中期静止的染色体进行吉姆萨染色显带,然后可以用普通光镜进行分析。吉姆萨染色的染色体的核型可以根据人类遗传学国际命名体系(ISCN)来描述[8]。尽管已经对传统的核型方法进行了一些优化,但这些步骤仍然十分漫长,需要熟练的人员来进行,受限于较低的平均分辨率(一般>3Mb),这种黑白染色方式难以解析复杂的重组,并且这种方法需要获取数量很多的中期细胞。除此之外,现在已经清楚某些亚核型变异不可忽视,因为从临床角度来看它们可以有严重的含义。综合起来考虑,这些缺点促使,特别是通过使用高分辨率非同位素技术,促使了分子细胞遗传领域的重大进步。一个例子就是原位杂交荧光技术(FISH)。FISH技术出现于20世纪80年代早期[10],从本质上来说它依赖于使用直接或间接探针,通过对有丝分裂中期的染色体(分辨率1~2Mb),间期核(50kb到1Mb),或DNA纤维(10~500kb)进行荧光测量,来发现特定的DNA目标序列。由于其高敏感性,高性价比,以及高度可重复性,FISH在生物和医学中迅速获得了广泛的承认,并证明了其对各种目的而言的巨大价值[11]。其中一些例子包括非分裂细胞中的染色体畸变分析,3D染色体组织研究,基因图谱绘制,DNA复制/重组研究,疾病特征及诊断。但是,FISH有一个主要的缺陷就是只能发现已知的基因畸变,限制了它在基因组范围上的应用,这使得它不能对染色体畸变做广泛的筛查。通过与受到不同标记的DNA探针杂交并成像,使得人们可以观察到人类所有的24条染色体(22条常染色体,X和Y染色体),每条染色体都是一种单独的颜色,并且只用一步完成,这种性质极大地克服了上述的FISH缺陷。这使人们开发出了一些新的基于FISH的技术,比如光谱分型(SKY)[12],以及多重FISH(M-FISH)[13]。这两种技术的成像获取模式都与FISH不同:SKY依赖于通过特制的多频光滤波器来进行单步成像获取,而M-FISH用的是一套荧光染料特异性光滤波器。这些技术的限制包括必须要有中期细胞,一般分辨率较低(大约1~3Mb),不能发现染色体内重组。
另一种很受欢迎的技术是比较基因组杂交(CGH)[14],这项技术近些年在肿瘤学研究和发现胚胎期与新生期基因组畸变方面提供了无与伦比的认识。CGH使用测试基因组和对照基因组,它们用不同的荧光染料标记(比如,测试组染成绿色,对照组染成红色),然后与中期染色体完全杂交。然后对每条染色体,检测测试基因组相对于对照组的荧光率,得到关于基因材料得到DNA区域(绿红比上升)或丢失DNA区域(绿红比下降)的信息。但是,CGH有一些限制,也就是它的分辨率较低(5~10Mb),它无法发现平衡重组,比如倒位,或对等重组(reciprocal),或罗伯逊易位。CGH的原理也与微阵列技术联合(阵列-CGH),利用细菌人造染色体(BACs)(150~200kb大小),cDNAs(0.5~2kb),聚合酶链式反应(PCR)产物(0.1~1.5kb),以及寡核苷酸(25~80bp)充当调查探针[15~18]。阵列-CGH技术的最大分辨率是一个与长度,分布及探针间空位有关的函数,使用BACs的分辨率在50~100kb,使用寡核苷酸探针的分辨率在1~10kb。其它基于阵列的平台使人们可以发现单核苷酸多态性(SNP),并且除了可以提供拷贝数量变异(CNVs)的信息,还有一个好处就是显示杂合性的丧失,或是片段性单亲二倍体。
我们现在处于一个节点,下一代测序技术正在成熟,那将使得人们可以在bp精度上测
绘重组的情况,尽管价格不菲,并且更依赖计算机的力量(见[19]回顾)。在日益扩展的干细胞领域,这些技术的应用已经集中于识别和描述环境获得性异常,并将继续这样下去,揭示出维持基因组所面临的真正巨大的挑战。
hESCs中的基因组不稳定性
hESCs正被越来越多地认为是一种有用的工具,用于替换受损组织,以及广泛种类疾病的潜在治疗。对它们的使用有争议,主要是因为现在要获取hESCs需要,举例来说,从多余的离体授精胚胎中,或是流产胎儿中,破坏人类的胚球。这种引出细胞的方法,加剧了关于植入前胚胎的道德身份方面的激烈观点争论。那些反对破坏胚胎的人,其观点的基础往往是象征或者可能性,他们的依据是植入前的人类胚胎有潜能发育成完整的人,因此应当有相等的权利,利益以及道德上的身份。这种争论的另一方认为,胚球只不过是由一堆未分化细胞组成,没有可识别的神经系统,因此发育阶段还十分不成熟,谈不上有什么利益或是权利。根据这些细胞在治疗上的潜力,研究者,政策制定者以及伦理学专家们应当在不同的观点之间寻找尽可能普遍的基础。
除了伦理学上的考虑,在将干细胞移入临床应用之前,还有其它一些障碍不得不解决。越来越多的证据表明干细胞在离体培养期间出现染色体异常,这催生了一个疑问,即这些细胞应用在人体上有多安全。这种忧虑十分重要,因为正常的核型不仅可以保证离体状态下hESCs特性的维持,也能避免在活体状态下的负面作用。基因上异常的细胞一般在培养适应期间出现,往往表现出生长速率增高,更倾向于获得恶性转变[20]。看起来,hESCs表现出偏倚性倾向,更容易在12号染色体(特别是12p)[20~27],17号染色体(特别是17q)[20,22,23,25,27~30],20号染色体(特别是20q)[20~22,25,27~29,31],以及X染色体[20,22,25,28,32]上形成非整倍体(主要是增多)(Fig.1)。已经发现12号染色体的三倍体能增加hESCs的增殖潜能,促进细胞分裂,伴有多个纺锤体,并引起活体组织中的肿瘤样组织[26]。另一方面,已经知道20q11.21的一段大小从0.5到4.6Mb片段的复制[21,23]能影响诸如ID1和BCL2L1这样的基因,后者编码抗凋亡蛋白BCL-X,最近发现其是这种复制有强烈选择优势的原因[31,34]。20q11.21的获得性突变也常在各种人类肿瘤中发现[35,36]。X染色体的丢失有过报道[28],但获得突变更多见[20]。在近期的报导中,将染色体计数,FISH,以及SKY联合运用揭示出在hESCs(及hiPSCs)中有18~35%的嵌合非整倍体共存,这种现象的培养不依赖于传代数,培养技术,或是实验室[37]。嵌合体似乎是以随机的形式出现,似乎要么引起表型异质性,要么后代产生非整倍体细胞,引起这种细胞丧失多能性,以及致癌性的增高[37]。在另外两项研究中,使用了诸如CGH或SNP阵列这样的高分辨方法,确定了不同染色体中大小从20kb到3Mb的大量拷贝数变异,这些拷贝数变异影响肿瘤相关基因,并引起基因表达分布情况的变化[22,38]。那些基因上异常的细胞似乎也迅速出现了分化,这意味着发现突变的工作应当继续,不止在多能状态中进行[39]。
有趣的是,某些hESC细胞系似乎比其它细胞天然地更容易获得突变。这种偏倚突变的易感性似乎与胚胎来源或是与这些细胞暴露的环境条件有关[24]。后者包括使用的饲养层类型,培养基的组成,用于细胞传代,以及冻融的技术[30,40,41]。用物理上的缺氧环境(~2%)来取代大气含氧环境(21%,叫做正常氧含量),也与基因异常数量减少有关[42]。另外,在微载体上扩张的hESCs密度很高,已经显示出能保持其多能性与正常核型达数月之久[43,44]。在这一点上,寻找一个可靠的能识别老化与基因异常hESCs的生物标志物,能够推动培养条件的进步,并确认这种进步,因为它可以减少细胞遗传分析的工作量。在这种尝试中,Herzfeld等人[45]识别出了肿瘤坏死因子CD30是一个合适的候选标志物,因为它在核型异常的hESCs中,相对于在正常的培养细胞中,是过度表达的。之后,两项独立的研究对这个数据的解释
提出了挑战,因为其从本质上显示了存在于敲除血清替代物(KnockOut Serum Replacement, Invitrogen, Carlsbad,CA)培养基中的抗坏血酸是诱导CD30表达的唯一因子,它通过增强CpG启动子的去甲基化实现这一点[46,47]。在这些例子中,CD30的表达引起凋亡受抑制,增强了生长,并可参与支持那些累积了基因损害的细胞生存下去[47]
线粒体基因组的完整性,以及同质与异质点突变和大规模突变对线粒体在生物能量方面的影响,到目前来说关注较少。但是,这两者之间正在表现出越来越多的相关性。据报道,在9个晚代(late-passage)hESC细胞系中,大约22%携带有异质性突变,其中大部分不是同义突变,并且位于线粒体基因组的编码区域[29]。在另一项研究中,受筛检的16个hESC细胞系,全部有大规模线粒体DNA(mtDNA)删除,平均突变负荷为23%,这种突变出现得很快,传3~6代即可发现,终末分化后也可发现[48]。
从临床上hESCs的应用前景来看,上述的这些发现强调了定时而全面的基因分析的必要性,这种分析能深化我们对这类细胞的现有生物学知识,并帮助我们改进培养条件。尽管有本节提出来的这些障碍,hESCs还是在缓慢地走向临床应用。在Geron公司于2011年11月停止目标为hESC源性少突细胞祖细胞对脊髓损伤治疗安全性的一期临床试验后[50],进步的细胞技术目前正在引导FDA-批准的使用hESCs的临床实验(见49)。上次实验停止2年后,生物技术公司BioTime的子公司Asterias Biotherapeutics获得了Geron的资产,看起来似乎这家公司会在接下来数年内进一步推进hESC基础性实验[51]。
iPSCs中的基因不稳定性
在2006年和2007年Yamanaka的团队作出的开创性贡献中,他们通过异位共表达四种转录因子[2,52],将体细胞重编程到类hESC状态。但是,旨在探索hiPSCs和hESCs之间相似性问题的大量后续文章很快发现要想实现一种完全安全,有效,以及成熟的治疗用产物还需要时间,因为人们发现了两者之间大量的差异。
hiPSC细胞系中细胞遗传失衡的出现,似乎独立于重编程的步骤,其干细胞相关性基因和肿瘤相关基因没有富集,但失衡的类型和频率与hESC培养中发现的情况类似[53]。与hESCs中的方式一样,在hiPSCs中12和20q染色体的三倍体也是主要的异常,但与前者不同的是,17和X染色体的三倍体很少见到[53~55](Fig.1B)。另一项研究显示与中代hiPSCs,成纤维细胞以及hESCs相比,在早代hiPSCs中从头产生了CNVs并且数量很多[56]。这些CNVs大部分是不利的,在培养过程中随时间而被淘汰掉,小部分会留存下来。观察也发现在每个iPS细胞外显子组中大约有6个点突变,特别是在肿瘤相关基因中,提示需要引入全外显子组或基因组测序来充当重编程后一种有效的质控程序,以确保不存在有害的点突变[57]。hiPSCs的全部点突变负荷都来自亲代细胞中已有的突变(19%),离体传代时出现的突变(7%),以及源自细胞重编程过程本身(74%)[3]。与这些发现一致的是,hiPSCs似乎也会很快形成畸胎瘤,侵袭性比hESCs更高,无视其培养的位置或是移植成活的位置[58]。两项新的研究观察到在重编程和传代早期,通过向生长基质中添加抗氧化剂来降低氧化压力,可以减少hiPSCs中的基因组不稳定性[59,60]。
监视重编程期间mtDNA突变的发生也十分重要。在近期的工作中,一些hiPSCs细胞系被发现藏有同质性和异质性突变,这些突变在其亲代细胞中未被发现,其中非同义突变与同义突变之比等于或大于1[61]。尽管这些变化的大部分是单倍群特异性(haplogroup-specific),还是有一小部分突变被发现与癌症有关,或是之前专业数据库中没有识别出来的[61]。有趣的是,人们也发现甚至是在那些藏有染色体畸变的,较老的重编程细胞中,线粒体超微结构也是可以重建的[62]。
与上述的基因异常不同,从定向细胞诱导而来的hiPSCs也与一种有缺陷的表观遗传回