基础科学研究所算法和机器人合成中心的研究人员利用人工智能的力量在理解蛋白质的稳定性方面迈出了重要一步。

可以从人工智能预测的结构推断蛋白质突变体的稳定性

研究小组利用 AlphaFold2 探索突变如何影响蛋白质稳定性——这是确保蛋白质正常运作且不会引起阿尔茨海默氏症等疾病的关键因素。这项研究发表在《物理评论快报》上。

DeepMind 的 AlphaFold 算法可以根据基因准确预测蛋白质的结构,它改变了整个生物学领域,让每个人都能接触到结构生物学。尽管取得了巨大的成功,但仍有两个基本问题尚未得到解答:预测的结构会正确折叠并保持折叠状态吗?还有一个关于人工智能算法的常见问题:AlphaFold 究竟是如何工作的?

AlphaFold 的一个关键限制是,它是在一组在生理温度下保持折叠状态的稳定蛋白质上进行训练的。因此,它预测了最有可能的折叠结构,但不知道它是否一定会折叠或不稳定。

了解和预测蛋白质的稳定性至关重要,因为不稳定的蛋白质可能会错误折叠,导致功能障碍和潜在的严重疾病,所以细胞必须花费大量能量来摆脱它们。

此外,大多数蛋白质的稳定性都比较有限,因此它们极易受到突变的影响,而突变会导致它们展开。因此,蛋白质工程在很大程度上是在无法折叠的功能失调的蛋白质序列的雷区中小心导航。所有这些都意味着使用 AlphaFold 的下一步应该是尝试预测突变导致的稳定性变化。

本研究测试的一个基本问题是 AlphaFold 是否已经学会了蛋白质折叠的底层物理原理,还是仅仅是一个仅能识别统计模式的高维回归机器。这个问题是关于泛化能力的:如果 AlphaFold 以某种方式学会了实际作用的物理力,那么它应该能够处理它以前从未见过的蛋白质序列。

这正是两位 IBS 研究人员 John McBride 和 Tsvi Tlusty 想要在他们的研究中测试的内容。他们解决这个问题的方法是检查 AlphaFold 是否能够正确预测突变对稳定性的影响。突变的数量远远多于 AlphaFold 训练中使用的数据点的数量,这意味着即使非常复杂的回归也不足以解释突变的全部影响。

这项任务极具挑战性,因为稳定性的重大变化通常涉及难以预测的细微结构变化。不过,事实证明,AlphaFold 预测的结构变化中存在一些有用的线索,可以为可能的稳定性变化提供有价值的信息。

IBS 研究人员通过比较突变造成的结构变化与实验测量的野生型和突变蛋白之间的稳定性差异证明了这一点。一个关键因素是使用对微小变化非常敏感的探针。研究人员设计了一种创新的指标,称为有效应变,用于检测与稳定性相关的蛋白质结构中微小但重要的变化。

通过观察数千个突变,他们发现有效应变测量与稳定性变化的幅度相关。也就是说,较大的结构变化(由 AlphaFold 预测)也预示着稳定性的巨大变化。

主要作者 McBride 表示:“这有力地表明,AlphaFold 预测的结构编码了重要的物理信息,特别是有关稳定性的信息。有必要开发新的物理模型来进一步解码这些信息。”

这些见解为蛋白质工程开辟了新的可能性,该领域涉及设计具有特定功能的蛋白质。通过更好地了解突变如何影响稳定性,科学家可以更有效地驾驭复杂的蛋白质设计,从而有可能推动药物开发和治疗蛋白质错误折叠引起的疾病。

这项研究标志着人工智能如何用于解开生物学复杂性的持续探索中的一个重要里程碑,并强调需要进一步研究以充分释放人工智能在科学发现中的潜力。