通过利用机器学习的力量,研究人员构建了一个框架来分析哪些因素对物种遗传多样性的贡献最为显著。

利用人工智能审视和验证动物进化理论

这项研究最近发表在《分子系统发育和进化》杂志上,表明巴西嘶嘶蛙和颗粒蟾蜍这两种两栖动物的遗传变异是由不同的过程形成的,这两种动物都是原产于巴西东北部的。

结果表明,嘶叫蛙的基因变异主要是由过去 10 万年间随着栖息地的变化而发生的种群人口统计事件所形成的。

相比之下,颗粒蟾蜍的遗传多样性主要受到当代景观因素的影响——相对较孤立的蟾蜍(无论是由于地理距离还是恶劣的栖息地)更有可能出现遗传差异。

虽然之前的研究已经探索了历史人口和景观因素对这些两栖动物遗传多样性的影响,但他们是针对这些因素使用单独的数据集进行的,因此很难辨别哪个因素是最重要的。

现在,参与这篇论文的研究人员首次使用人工智能来考虑这两个过程如何平等地塑造遗传多样性,而不是手动假设哪个可能更为重要。

“在这项研究之前,我们必须独立提出问题,因为你无法在同一框架内研究这两种影响,”这项研究的共同作者、俄亥俄州立大学进化、生态学和生物生物学教授布莱恩·卡斯滕斯 (Bryan Carstens) 说。

“人工智能让我们能够模拟当前生态和深度进化事件中发生的过程,并将这些发现与我们从这些青蛙身上收集到的实际数据进行比较。”

卡斯滕斯表示,由于过去几十年遗传学家和其他野生生物学家获得了大量数据,研究人员很难确定某些实验中可能重要的特定因素。但通过将大量信息整合到可以在一次分析中解释这些因素的模拟中,有可能获得一个物种发育的更完整记录。

卡斯滕斯说:“建立和训练我们的需要很长时间,但我们希望模型能够以尽可能忠实于我们对系统生物学的了解的方式,捕捉物种历史中各种潜在变化。”

例如,虽然本研究调查的物种生活在同一地区,但它们的自然历史却存在许多差异。尽管它们的卵和幼虫都是完全水生的,但拟蟾蜍在整个雨季和地下室中不断繁殖,而粒蟾蜍的繁殖事件发生得非常突然,因为它们依赖于大雨。

结合机器学习方法,研究人员的模拟确定他们的模型场景 100% 支持关于嘶嘶蛙扩张的历史解释,99% 以上支持关于粒蟾蜍扩张的历史解释。

他们的模型如此准确的原因之一是它能够解释最近的人口事件,包括衡量人类发展或栖息地变化等事件如何在很长一段时间内影响动物遗传多样性。

但卡斯滕斯表示,即使使用人工智能,研究人员也必须小心避免研究结果中出现欺骗性模式。

“我们所做的任何分析都无法捕捉到数百万年来对这些物种至关重要的每一个因素,”他说。“所以我们必须考虑一系列可能性,但不能太宽泛,以至于基本上任何模型都能够拟合数据。”

卡斯滕斯说,话虽如此,随着技术进步使研究人员能够回答小众生态问题并测试新的假设,他们的工作是创建升级版机器学习框架的先驱,该框架可应用于对其他物种的独特研究。

“我们可能会继续以不同的方式使用这些人工智能工具的不同组合,以尝试了解进化历史,”卡斯滕斯说。“随着我们不断学习,我们使用的工具将发生变化,它们将进化得更好。”