历史性的适应现在可能使我们易患疾病

米由于选择或运气,突变可能会改变它们在种群中的频率,而回溯过去以找出特定多态性持续存在的原因已被证明是一项特别困难的科学挑战。现在,9月13日发表在CellReports上的研究描述了一种工具,它可能会让科学家更容易做到这一点,尤其是那些研究适应和疾病基因组根源的科学家。该工具是一种名为DeepFavored的深度学习算法,它同时对现有的全基因组关联研究(GWAS)数据集运行多项统计测试,以区分偏好的突变(那些是选择的结果)和未被选择但发生的搭便车突变和最喜欢的人一起。在三个不同的人群中验证该工具时,该论文背后的研究人员(中国南方医科大学)表示,他们已经确定了基因组权衡:适应特定环境的突变也使人们更容易患某些疾病,或者携带搭便车突变的人。

虽然与TheScientist交谈的专家们都认为该论文的权衡特定发现有点牵强——识别这些所谓的偏好突变非常困难,适应和疾病易感性之间的权衡不太可能那么整洁或他们说,正如论文所暗示的那样直截了当——他们都对算法及其帮助科学家更好地探索此类研究问题的潜力很感兴趣。

“我认为这是一篇很好的假设生成论文,”没有参与这项研究的墨西哥国立自治大学遗传学家ClaudiaGonzaga-Jauregui说。“如果你可以在你的人口基因组数据中运行这些算法,那么也许你可以确定一些你可能想要进一步探索的位点。”

人类:研究局部适应的模型

该研究利用现有的GWAS数据来检查祖先定居在欧洲、西非或东亚的人的基因组突变。研究人员专注于与饮食相关的基因中的等位基因,例如与新陈代谢或味觉和免疫相关的基因,假设这三个地理上分开的群体需要适应与病原体和食物供应相关的不同压力。

“人类是一个单一物种,人口遍布全球,生活在并适应每一个可能的纬度、海拔、气候和生态系统。我们是适应不同环境的一个很好的案例研究,”没有参与这项研究的乔治华盛顿大学进化基因组学家布伦达布拉德利通过电子邮件告诉科学家。

为了将适应性进化与巧合突变区分开来,DeepFavored同时进行了七项统计检验,这些检验已经可用并被研究人员用来判断GWAS研究中感兴趣位点的哪些突变是选择的结果,哪些是搭便车,哪些是不相关和巧合的。这些测试旨在检测所谓的硬扫描,即单倍型(一组遗传变异一起遗传)在首次出现后不久迅速变得突出的进化历史时刻。芝加哥大学免疫遗传学家LuisBarreiro解释说,通常情况下,当一种单倍型为携带它的人带来巨大好处时,就会发生这种情况,谁没有参与这项研究。这个想法是,通过结合多项测试,DeepFavored可能能够检测到软扫描——已经在流通但在当地环境改变为有利于它们的条件后变得更有益和更普遍的单倍型。Barreiro补充说,这些频率的轻微变化“非常、非常难以识别。”

研究人员通过将其结果与目前使用的其他两种算法进行比较来验证该算法,以识别一组模拟GWAS数据中的有利突变和搭便车突变,以便他们可以获得可靠的准确性衡量标准,发现它可靠地优于两者。

然后,研究人员在真实世界的GWAS数据上测试了DeepFavored和其他两个工具。尽管每个单独的模型自己发现了700到1,200个候选者,但所有这三种工具只识别了55个推定的有利突变,Barreiro说这使得这55个比仅通过一种或两种技术发现的那些更可信。其中包括公认的代谢突变硬扫描,它通过从稀缺食物来源中提取更多食物来帮助人们生存,但现在与食物丰富地区的糖尿病等代谢疾病有关,以及促进葡萄糖代谢的软突变突变消化,但也与黑色素瘤和癌症的风险增加有关。

请参阅“淋病阻断突变也可预防阿尔茨海默氏症:研究”

“我实际上认为他们制作的乐器非常酷。...其他工具,他们没有使用尽可能多的测试,他们没有同时进行,”伊利诺伊大学厄巴纳-香槟分校的进化免疫学和基因组学研究员JessicaBrinkworth说,她没有工作在学习上。她补充说,她很欣赏DeepFavored似乎比其他工具更强大,因为它同时运行了多项测试。

事实上,类似技术的错误率很高,假阳性和阴性结果都模糊不清,Barreiro警告说,并补充说,即使将偏好的突变检测提高一个完整(假设的)数量级,就检测到的突变的绝对数量而言可能意义不大,考虑到基因组的庞大性和复杂性。

需要更多数据

Barreiro说,虽然这篇论文的广泛结论是合理的,但他、Brinkworth和Gonzaga-Jauregui都表示,如果他们看到来自功能实验的生物学数据,他们会对DeepFavored确定的具体权衡更有信心。

“我认为大多数时候当人们谈论[明确]权衡时,它不一定是真实的,”Brinkworth说,并指出许多表型特征是由多个基因变异共同作用引起的。“显然存在遗传权衡;对这个的保护,对那个的敏感性。他们非常、非常难找。”

人类是一个单一物种,人口遍布全球,生活在并适应每一个可能的纬度、海拔、气候和生态系统。我们是适应不同环境的一个很好的案例研究。

然而,来自体外和最终体内实验的数据——例如,复核算法识别突变的生理效应,或来自相关基因座上下游的遗传物质测序,以更好地评估可能发生的变化。选择的结果和搭便车的东西——可能有助于梳理清扫的进化史。Barreiro还建议,对古代DNA样本进行测序并寻找相关突变可以揭示哪些突变出现的时间、速度以及对环境压力的反应。

“这不是一个脱离现实的假设和研究,但我认为它缺乏一些额外的数据来真正表明他们所展示的东西是真正有意义的,”Gonzaga-Jauregui说。

请参阅“旨在完成人类基因组的大型科学合作”

“现在应该更详细地检查确定的假定适应性和搭便车站点,”布拉德利写道。“这些基因变化是什么?它们如何影响相关蛋白质的功能?这些在更广泛的人群中有何不同(除了这里包括的三个)?”

针对有关需要功能数据的评论,该研究的合著者、南方医科大学研究员朱浩在给《科学家》杂志的一封电子邮件中写道,实际研究需要花费过多的时间和金钱,“更糟糕的是,它通常是不可行的实验检查适应性人类进化。...我认为更可能获得更多支持证据的方法是进行GWAS研究,尤其是非洲人的GWAS研究。..因此我们可以更加确定和更好地衡量欧亚人在适应性进化和疾病易感性之间的权衡。”不幸的是,他指出,该领域因非洲国家缺乏对GWAS研究的财政支持而受到阻碍。