人类基因组包含约 23,000 个基因,但在任何给定时间内,只有一小部分基因在细胞内处于激活状态。控制基因表达的调控元件复杂网络包括称为增强子的基因组区域,这些区域通常位于远离其调控基因的位置。

捕获短寿命RNA分子的新技术揭示了基因转录在细胞中的协调方式

这种距离使得绘制基因和增强子之间复杂的相互作用变得困难。为了克服这个问题,麻省理工学院的研究人员发明了一种新技术,可以让他们观察细胞中基因和增强子的激活时间。当一个基因与一个特定的增强子同时被激活时,这强烈表明增强子正在控制该基因。

进一步了解哪些增强子控制着不同类型细胞中的哪些基因,可以帮助研究人员确定遗传疾病的潜在药物靶点。基因组研究已经确定了许多非蛋白质编码区域的突变与多种疾病有关。这些可能是未知的增强子吗?

“当人们开始使用基因技术来识别具有疾病信息的染色体区域时,大多数这些位点并不对应于基因。我们怀疑它们对应于这些增强子,这些增强子可能与启动子相距甚远,因此能够识别这些增强子非常重要,”麻省理工学院名誉教授、麻省理工学院科赫综合癌症研究所成员菲利普·夏普 (Phillip Sharp) 说。

Sharp 是这项新研究的资深作者,该研究发表在《自然》杂志上。麻省理工学院研究助理 DB Jay Mahat 是该论文的主要作者。

寻找eRNA

不到 2% 的人类基因组由蛋白质编码基因组成。其余基因组包括许多控制这些基因何时以及如何表达的元素。增强子被认为是通过暂时形成复合物与基因启动子区域进行物理接触来开启基因的,它是在大约 45 年前被发现的。

2010 年,研究人员发现这些增强子被转录成 RNA 分子,称为增强子 RNA 或 eRNA。科学家怀疑这种转录发生在增强子与靶基因积极相互作用时。这提出了一种可能性,即测量 eRNA 转录水平可以帮助研究人员确定增强子何时活跃,以及它针对哪些基因。

Mahat 说:“这些信息对于理解癌症的发展过程以及癌症如何改变其调节程序并激活导致去分化和转移性生长的过程极其重要。”

然而,这种映射已被证明很难进行,因为 eRNA 的产量非常小,并且在细胞中不会持续很长时间。此外,eRNA 缺乏一种称为 poly-A 尾巴的修饰,这是大多数技术用来将 RNA 从细胞中拉出来的“钩子”。

捕获 eRNA 的一种方法是向细胞中添加一种核苷酸,当该核苷酸被整合到 RNA 中时,该核苷酸会停止转录。这些核苷酸还含有一种称为生物素的标签,可用于从细胞中捕获 RNA。然而,目前的这种技术仅适用于大量细胞,无法提供有关单个细胞的信息。

在集思广益寻找捕获 eRNA 的新方法时,Mahat 和 Sharp 考虑使用点击化学,这是一种可用于将两个分子连接在一起的技术,如果每个分子都标记有可以相互反应的“点击柄”。

研究人员设计了带有一键式手柄标记的核苷酸,一旦这些核苷酸被整合到正在生长的 eRNA 链中,就可以用带有互补手柄的标签将这些链捞出来。这使得研究人员能够捕获 eRNA,然后对其进行纯化、扩增和测序。每一步都会丢失一些 RNA,但 Mahat 估计他们可以成功地从给定细胞中提取出大约 10% 的 eRNA。

利用这种技术,研究人员获得了细胞中某一特定时间正在积极转录的增强子和基因的快照。

“你希望能够确定每个细胞中调控元件及其相应基因的转录激活情况。这必须在单个细胞中完成,因为只有这样你才能检测到调控元件和基因之间的同步或异步,”Mahat 说。