人类基因组是生命遗传信息的错综复杂的挂毯,已被证明是一个充满奇怪特征的宝库。其中包括可以在基因组内“跳跃”和移动的DNA片段,称为“转座元件”(TE)。

基因组时间机器揭示了我们DNA的秘密

当它们在基因组中改变位置时,TE可能会引起突变并改变细胞的遗传图谱,但它们也是我们基因组组织和表达的主要协调者。例如,TE有助于调控元件、转录因子结合位点以及嵌合转录本的创建——当来自两个不同基因或基因组部分的片段连接在一起形成新的混合RNA分子时产生的基因序列。

与它们的功能重要性相匹配,TE已被认为占人类DNA的一半。然而,随着他们的搬家和年龄的增长,TE会发生一些变化,掩盖他们原来的形态。随着时间的推移,TE会“退化”并变得越来越难以识别,这使得科学家很难在我们的基因蓝图中识别和追踪它们。

在一项新的研究中,洛桑联邦理工学院DidierTrono团队的研究人员发现了一种通过使用来自不同物种的重建祖先基因组来改进人类基因组中TE检测的方法,这使他们能够识别人类基因组中以前无法检测到的简并TE。该研究发表在《细胞基因组学》上。

科学家们使用了来自不同物种的重建祖先基因组数据库,就像基因组“时间机器”一样。通过将人类基因组与重建的祖先基因组进行比较,他们可以识别后者中的TE,这些TE在数百万年来在人类中已经退化(磨损)。

这种比较使他们能够检测(“注释”)TE,而这些TE在之前仅使用人类基因组数据的研究中可能被遗漏。

通过这种方法,科学家们发现了比之前已知的更多的TE,从而显着增加了由TE贡献的DNA份额。此外,他们还可以证明这些新发现的TE序列与最近发现的、已识别的亲属发挥着相同的调节作用。

潜在的应用是巨大的:“更好地了解TE及其调节因子可以帮助我们深入了解人类疾病,其中许多疾病被认为受到遗传因素的影响,”迪迪埃·特罗诺(DidierTrono)说。“首先也是最重要的是癌症,还有自身免疫和代谢紊乱,更普遍的是我们的身体对环境压力和衰老的反应。”