人类线粒体基因组 : 从基础生物学到临床
作者简介
原著者:Giuseppe Gasparre(1979 年—),意大利博洛尼亚大学医学遗传学教授和 S. Orsola医院应用生物医学研究中心主任。Anna Maria Porcelli(1972 年—),意大利博洛尼亚大学生物化学教授。主译:曹云霞,医学博士,主任医师,二级教授,博士研究生导师。安徽医科大学妇产科学系主任,国家卫生健康委配子及生殖道异常研究重点实验室主任;纪冬梅,医学博士,安徽医科大学第一附属医院妇产科副主任医师、副教授,硕士研究生导师,博士后合作导师。
内容简介
第1章 线粒体 DNA 的复制、维持与拟核的组成 mtDNA replication, maintenance, and nucleoid organization Mara Doimo Annika Pfeiffer Paulina H. Wanrooij Sjoerd Wanrooij 著 曹云霞 胡 超 译 一、人类线粒体 DNA (一)线粒体 DNA 的特征 人们首次观察到线粒体脱氧核糖核酸(mitochondrial deoxyribonucleic acid,mtDNA)可以追溯到 20 世纪 60 年代初,当时在鸡胚线粒体基质中首次观察到具有 DNA 特征的纤维 [1, 2]。人类线粒体基因组是一个封闭的环状双链 DNA 分子,长约 5μm [3, 4]。mtDNA 大多以单体形式存在,但通常也能以二聚体形式的链状圆环存在 [4-6]。 由于其体积小,mtDNA 只占动物细胞总 DNA的不到 1/100 [7]。早期的统计表明,单个动物的线粒体含有 2~10 个 mtDNA 基因组 [8]。并且由于每个细胞都有多个线粒体,因此人类细胞中的 mtDNA 分子根据细胞类型的不同,数目一般从数百到数万个 [9-12]。然而,并不是所有细胞的mtDNA 拷贝数均在这个范围内,如人类卵母细胞中包含数十万个 mtDNA 拷贝 [13-15]。 人类 mtDNA 具有母系遗传特征 [16]。mtDNA的多拷贝性质决定其具备一个关键特征,即细胞可以包含 1 个及以上的 mtDNA 基因组,这种特征被称为异质性 [17]。异质性比例的水平,也就是突变 mtDNA 分子群体的比例,可以决定 mtDNA 突变引起的线粒体疾病症状的严重程度 [18]。mtDNA基因组不同于核基因组的另一个特征是 mtDNA 偶尔会少量嵌入核糖核酸(ribonucleic acid,RNA)的组成单位——核糖核苷酸 [19, 20]。 (二)人类线粒体基因组的组成 人类线粒体基因组是首个被完全测序的线粒体基因组 [21]。它的长度为 16.5 千碱基对(kilo base pairs,kbp),编码 2 个核糖体 RNA(rRNA)、22 个转移 RNA(tRNA)和 13 个蛋白质,相邻基因之间不含或含有很少非编码序列(图 1-1A) [21]。 这 13 个蛋白编码基因编码 ATP 产生体系 -氧 化 磷 酸 化(oxidative phosphorylation system,OXPHOS)的重要亚基 [21-26]。核苷酸序列中 GT/CA 比例的差异,导致 mtDNA 两条链在碱性氯化铯中浮力密度不同,由此将 mtDNA 双链分别称为重链(也称 H 链,H-strand)和轻链(也称 L 链,L-strand) [27]。在所有的编码蛋白中,12 个蛋白质编码基因、12S rRBA 和 16S rRNA,以及 14 个tRNA 基因均位于 H 链,而 L 链只包含 1 个蛋白质编码基因和 8 个 tRNA 基因 [21]。H 链富含 G 碱基,因此其链上含有多个序列模块,有可能形成二级 DNA 结构,称为 G- 四链体(G-quadruplexe,G4) [28, 29]。这些模块通常与 mtDNA 缺失断点重合 [29],可能会阻碍 mtDNA 的复制过程。 一个大约 1100bp 长的非编码区(noncoding region,NCR),也称为控制区,位于 tRNAPro 和tRNAPhe 基因之间 [21]。NCR 包含 H 链合成的复制起点(OH) [21, 30],以及用于转录每条 mtDNA 链的 H 链启动子(HSP)和 L 链启动子(LSP) [31]。 虽然传统意义上认为 OH 位于第 191 位核苷酸 [21],但事实上 H 链复制起始于 LSP,即在 OH 上游约 200 个核苷酸的位置 [32]。因此我们将使用术语“OH 区域”来指同时包含 LSP 和 OH 的区域 [33]。 NCR 还包含 3 个 高保 守 序 列 区 块(conserved sequence block,CSB 1~3),这些区块被认为具有调节复制的功能 [34],并且在 3 个 CSB 下游区域有一个单终止相关序列(termination-associated sequence,TAS) [35]。在小鼠 [36-38] 与之后人类细胞 [39] 的研究中,mtDNA 的早期特征显示其含有一个很短的三链 DNA 区域,即围绕 OH 区域的D-loop 区(displacement loop)。D-loop 区是由一个约含 600nt 的长 DNA 延伸片段(即 7S DNA)合成。7S DNA 与 L 链互补,其合成是在 OH 区启动复制、在 TAS 区域提前终止 [35, 40, 41]。作为mtDNA 的第二个复制起点,OL 指导 L 链的合成。OL 位于 NCR 之外、距离 OH 约 2/3 基因组处的 5个 tRNA 基因簇中 [42]。 二、线粒体 DNA 的复制 (一)复制机制 与核 DNA 的复制过程相比,人类线粒体复制的机制和所涉及的蛋白质不同。线粒体复制叉蛋白通过非对称的机制复制线粒体的 DNA,这两条链在线粒体中都是不断合成的 [43]。这种被称为 mtDNA 复制链置换模型基于早期的脉冲和脉冲追踪标记实验、电子显微镜和 5? 末端实 验 [7, 44],以及最近使用重组蛋白在体外对mtDNA 复制进行的生化重建 [45, 46]。这种 DNA 的复制方式与哺乳动物细胞核 DNA 有明显不同,但在生物学上并不独特,因为它与 ColE1 质粒DNA 的复制相似 [47]。 mtDNA 的复制起始于 OH 区的 H 链(主链)。当 mtDNA 复制机器合成新生的 H 链时,亲代 H链被置换,形成了三链 D-loop 结构(图 1-2)。由于未知的原因,mtDNA 的复制通常在 TAS 区域终止,只有少数新生的 H 链延伸过这一区域。 在 H 链复制延伸过 TAS 区域的情况下,它继续单向延伸亲代 H 链,直到 OL 区。在 OL 区解开DNA 双链,形成一个发夹特征的结构,引导这一区域的激活 [48]。L 链(滞后链)复制从 OL 起始延与 H 链合成相反方向进行,直到新合成的两条链形成完整环形。 基于二维琼脂糖凝胶电泳实验,复制的链置换模式的另一种解释被提出。然而,这两个模式非常相似,主要区别在于这种所谓的 bootlace/RITOLS 模式中,置换的 H 链被预先形成的 RNA所包被 [49, 50],这与链置换模式中认为的线粒体单链 DNA 结 合 蛋 白(mitochondrial single-stranded DNA-binding protein,mtSSB)不同 [51, 52]。两种模式都认为 mtDNA 复制导致大量的 ssDNA 复制中间体,这确实是在分裂细胞中观察到的主要复制中间体[53]。然而,在非分裂细胞中,大多数 mtDNA 复制中间体在自然状态下是双链的 [53]。 这可能是由于 L 链复制的过度的、与 OL 无关的启动导致的结果 [54],或者正如他人所提出的 [55],这是由一组尚未识别的蛋白质进行的双向置换复制模式的结果。 (二)起始 DNA 复制的第一步是合成 RNA 引物,该引物随后可以被 mtDNA聚合酶 γ(polymerase γ,POLγ)延长。早在 1985 年,研究者就从人类线粒体中分离出一种线粒体引物活性酶 [56, 57],但当时并未阐明该蛋白的身份。随后的研究表明,在两个复制起点上的引物,实际上是由线粒体RNA 聚合酶(POLRMT)合成的,该酶与 T 奇数(T-odd)噬菌体 RNA 聚合酶有关 [58]。 前导链复制的引物在 LSP 处有一个 5? 末端,而该位点同样是 L 链转录起始点 [32]。因此,通过 POLRMT 从 LSP 处进行的转录不仅产生了接近基因组长度的转录物,这些转录物被加工后用于释放 tRNA 和 mRNA [59],而且还产生了用于前导链合成更短的引物(图 1-1B)。在 CSB2 处形成的 G4 结构导致转录在 LSP 下游约 120nt 处提前终止 [60, 61]。这种过早终止的转录物仍然稳定地与 DNA 模板杂交形成 RNA-DNA 杂合体,被称为 R-loop [62, 63],并被推测为 H 链复制引物。为了支持这种 H 链启动模型,RNA 到 DNA 的转换位点已被映射到 CSB 区域 [32, 60, 64, 65]。 本书不仅回顾了人类线粒体DNA生物学、线粒体DNA的进化和利用、线粒体DNA的突变及其相关疾病等领域的基础知识与前沿进展,还对线粒体基因组的基本特征、遗传与分离机制、哺乳动物细胞间线粒体运动等做了详细阐述,为从事线粒体基因组研究的临床医生及研究人员提供了系统总结与回顾,并描绘了线粒体基因组领域未来的发展方向。