表观遗传与长链非编码RNA
表观遗传学长链非编码表观遗传学长链非编码RNARNA的研究进展的研究进展 摘要自从功能基因组学的飞速发展,人们越来越多地将目光集中在表观遗传学功能的研摘要自从功能基因组学的飞速发展,人们越来越多地将目光集中在表观遗传学功能的研 究。表观遗传学是一门研究基因表达发生了可遗传的改变,而究。表观遗传学是一门研究基因表达发生了可遗传的改变,而DNADNA 序列不发生改变的遗传序列不发生改变的遗传 分支学科。表观遗传学的主要机制包括分支学科。表观遗传学的主要机制包括 DNA DNA甲基化、组蛋白修饰及新近发现的非编码甲基化、组蛋白修饰及新近发现的非编码RNARNA。。 非编码非编码RNARNA是指基因组转录而来却不翻译的是指基因组转录而来却不翻译的RNARNA,主要包括小干涉,主要包括小干涉 RNA RNA、、miRNAmiRNA、、piRNApiRNA 以及以及 长链非编码长链非编码RNARNA。近年来,随着。近年来,随着 miRNA miRNA 的研究逐渐加深,长链非编码的研究逐渐加深,长链非编码RNARNA也慢慢引起研究者也慢慢引起研究者 的重视,并且很快显示出其在表观遗传学的重要作用,迅速成为一个研究热点。的重视,并且很快显示出其在表观遗传学的重要作用,迅速成为一个研究热点。 表观遗传学是研究基因表达发生了可遗传的改变, 而DNA 序列不发生改变的一门生物学 分支。而由其发生改变导致的变异即表观遗传变异,表观遗传变异 Epigenetic variation 是指在基因的DNA序列在没有发生改变的情况下,基因功能发生了可遗传的变化,并最终导 致了表型的变化。它是一种不符合孟德尔遗传规律的核内遗传。因此, 可以看出,个体的性 状是由细胞内两种遗传信息所共同决定的,一种是DNA序列所提供的遗传信息,而另外一种 可以看作是由表观遗传学信息。其中,表观遗传学信息主要是在DNA序列信息上的调控,即 调控DNA序列何时、何地、通过何种方式表达。表观遗传学的主要机制包括 DNA甲基化、组 蛋白修饰及非编码RNA。 DNA 甲基化DNA methylation是在 DNA 甲基转移酶DNA-methyltransferases,DNMTs 的催化下,CpG 二核苷酸中的胞嘧啶被选择性地添加甲基,形成 5-甲基胞嘧啶。甲基化是 基因组 DNA 的一种主要表观遗传修饰形式, 是调节基因组功能的重要手段。 体内甲基化状态 有 3 种持续的低甲基化状态, 如持家基因;诱导的去甲基化状态,如发育阶段中的一些基 因;高度甲基化状态,如女性的一条缢缩的x 染色体。DNA 甲基化主要是通过 DNA 甲基转移 酶家族来催化。在细胞分化的过程中,基因的甲基化状态将遗传给后代细胞。 组蛋白修饰Histone modifications 是指组蛋白的基础氨基末端尾部突出于核小体, 常在转录后发生变化。主要包括组蛋白甲基化、乙酰化与去乙酰化、泛素化、磷酸化和ADP 核糖基化等。其中甲基化是组蛋白重要的修饰方式,多发生于组蛋白 H3、H4 的赖氨酸K 和精氨酸A 残基上,组蛋白赖氨酸甲基化既可以导致激活, 也可以导致抑制,通常取决于 它所位于的残基情况。有染色质免疫沉淀分析证明, H3 Lys9 的甲基化与失活基因的启动 子有关,而 Lys4 的甲基化则与 x 染色体的活性基因有关。这表明H 3 氨基末端不同位点的 甲基化分别与基因的失活与激活相关。 非编码RNA在基因表达中发挥重要作用, 按照它们的大小可分为长链非编码RNA和短链非 编码RNA。短链RNA在基因组水平对基因表达进行调控, 其可介导mRNA的降解,诱导染色质结 构的改变,决定着细胞的分化命运,还对外源的核酸有降解作用以保护本身的基因组。在 miRNA的研究成熟后, 研究者将目光转向长链非编码RNA, 发现其在基因簇以至于整个染色体 水平发挥重要的顺式调节作用。本文将重点综述长链非编码RNA在表观遗传学中的调控机制 及其作用。 1 1长非编码长非编码RNARNA的简介的简介 在某些特定情况下的细胞中,哺乳动物的常染色体中几乎每一对核苷酸对都会发生转录 现象。能够稳定存在的转录产物中信使RNAmessenger RNA, mRNA不超过2,其余绝大 部分为非编码RNA。其中长度大于200bp的非编码RNA即为长链非编码RNAlong noncoding RNA, lncRNA,在人体内,lncRNA在数量上占全部非编码RNA 转录的大部分。lncRNA起 初被认为是基因组转录的“噪音” ,是RNA聚合酶Ⅱ转录的副产物,不具有生物学功能。近 年来研究表明,lncRNA参与了X染色体的沉默,基因组印记,染色体修饰,转录激活,转 录干扰及核内运输等多种重要调控过程,这些调控作用已经广泛引起人们的关注。 根据传统的遗传学研究方法“基因-mRNA-蛋白质-功能”这个策略以及传统的研究技术 手段,长链非编码RNA很难被发现,即使偶然被发现,也会因为此区域不编码蛋白质,而被 忽略。lncRNA的发现主要归功于基因组和基因芯片等高新技术的研究, 通过基因组测序,发 现一些基因编码RNA,但这些RNA并不翻译成为蛋白质,其实就是非编码RNA。此外,目前的 基因芯片可以高密度检测所有的RNA,发现了更多被遗漏的非编码RNA,其中长链非编码RNA 占了大部分。 2 2lncRNAlncRNA 的生物学特性的生物学特性 2.1缺乏长的进化保守的开放阅读框 lncRNA与mRNA有很多相似的特点和重叠的 区域,因为基因组中所谓的转录热点常常既转录mRNA,也转录lncRNA,蛋白质编 码基因两条链中的任意一条都可能转录lncRNA。 而同一个蛋白质编码基因可以转 录出不同的mRNA 或者是lncRNA。 一部分lncRNA 和mRNA可由外显子通过可变剪切 组合而成lncRNA,并且在3 末端添加有多聚腺苷酸。但是lncRNA缺乏长的进化 保守的开放阅读框,没有编码蛋白质的功能。 2.2保守性 不同于mRNA 和小分子RNA,lncRNA 在不同物种之间的保守性较 差, 这经常被作为其无功能的证据。 这可能是对进化快速适应的结果, 因为lncRNA 可能在进化压力下比cDNA更容易改变,lncRNA对突变具有更大的包容性, 这将有 助于形成物种间或物种内的差异表型。然而lncRNA 在某些短区段内的保守性非 常高,且具有保守的二级结构,相比于其他区段,它们的碱基置换率、外来片段 插入率以及自身片段丢失的概率都很低,核酸剪切位点相当稳定,在lncRNA的稳 定转录和剪切层面上体现了其功能序列的完整性。 这些高保守元件的特定核苷酸 序列或空间结构往往对lncRNA功能的发挥至关重要, 其他区段则可能维持其二级 结构的稳定或对lncRNA 功能的发挥起辅助作用。 2.3时空特异性目前发现的lncRNA的表达具有组织特异性、细胞特异性,并定位于特 定的亚细胞间隔 ,如NRON基因在胎盘、肌肉、淋巴组织中有显著表达,而在心脏、甲状腺、 肾上腺中几乎没有表达 。因此,某些特定的长片段lncRNA可能是某些肿瘤的特异性肿瘤标 志物。其表达的时间特异性, 即只在特定