AlphaFold3于5月9日向全世界发布,是一种算法的最新版本,旨在根据蛋白质构建块中的“指令代码”预测蛋白质(所有生命所使用的重要分子)的结构。

人工智能系统可以以惊人的精度预测生命分子的结构

预测蛋白质结构及其与其他分子相互作用的方式一直是生物学中最大的问题之一。然而,人工智能开发商GoogleDeepMind在过去几年中已经采取了一些措施来解决这个问题。新版本的人工智能系统比其前身具有改进的功能和准确性。

就像电子游戏系列的下一个版本一样,结构生物学家以及最近的化学家一直在焦急地等待着看看它能做什么。DNA被广泛理解为生物体的说明书,但在我们的细胞内,蛋白质才是真正执行大部分工作的分子。

正是蛋白质使我们的细胞能够感知外部世界,整合来自不同信号的信息,在细胞内制造新分子,决定生长或停止生长。

它也是使身体能够区分外来入侵者(细菌、病毒)和自身的蛋白质。蛋白质是您或我用来治疗疾病的大多数药物的靶标。

蛋白质乐高

为什么蛋白质结构很重要?蛋白质是由数千个原子以非常特定的顺序组成的大分子。这些原子的顺序以及它们在3D空间中的排列方式对于蛋白质能够发挥其生物功能至关重要。

同样的3D排列还决定了药物分子与其蛋白质靶标结合并治疗疾病的方式。

想象一下有一套乐高积木,其中的积木不是基于长方体,而是可以是任何形状。为了将这套积木放在一起,每块积木都需要紧密贴合,没有任何孔。但这还不够,两块砖块还需要具有正确的凸块和孔组合,以便砖块保持在适当的位置。

设计新的药物分子有点像玩这套新的乐高积木。有人已经建立了一个巨大的模型(在我们的细胞中发现的蛋白质靶点),药物发现化学家的工作就是使用他们的工具包将一些砖块放在一起,这些砖块将与蛋白质的特定部分结合并——用生物学术语来说——阻止它发挥正常功能。

那么AlphaFold有什么作用呢?基于准确了解任何蛋白质中的原子、这些原子在不同物种中如何不同进化以及其他蛋白质结构是什么样子,AlphaFold非常擅长预测任何蛋白质的3D结构。

AlphaFold3是最新的迭代版本,扩展了核酸(例如DNA片段)建模的功能。它还可以预测用可能打开或关闭蛋白质的化学基团或糖分子修饰的蛋白质的形状。这为科学家提供的不仅仅是更大、更丰富多彩的乐高积木套装。这意味着他们可以开发更详细的模型来读取和纠正遗传密码以及细胞控制机制。

这对于在分子水平上理解疾病过程以及开发针对蛋白质的药物非常重要,这些蛋白质的生物学作用是调节基因的开启或关闭。新版本的AlphaFold预测抗体的准确性也比以前的版本更高。

抗体本身就是生物学中的重要蛋白质,构成免疫系统的重要组成部分。它们还被用作生物药物,例如用于治疗乳腺癌的曲妥珠单抗和用于治疗炎症性肠病和类风湿性关节炎等疾病的英夫利昔单抗。

最新版本的AlphaFold可以预测与药物样小分子结合的蛋白质结构。如果通过实验确定了靶点的3D结构,药物发现化学家就可以预测潜在药物与其蛋白质靶点结合的方式。缺点是这个过程可能需要数月甚至数年的时间。

预测潜在药物和蛋白质靶点彼此结合的方式有助于决定在实验室中合成和测试哪些潜在药物。AlphaFold3不仅可以在没有实验确定的蛋白质结构的情况下预测药物结合,而且在测试中,即使目标结构和药物结合位点已知,它也优于现有软件的预测。

这些新功能使AlphaFold3成为用于发现新治疗药物的工具库中令人兴奋的补充。更准确的预测将使我们能够更好地决定在实验室测试哪些潜在药物(以及哪些不太可能有效)。

时间和金钱

这既节省时间又节省金钱。AlphaFold3还提供了预测药物与修饰形式的蛋白质靶标结合的机会,这些预测具有生物学相关性,但目前使用现有软件很难(或不可能)做到这一点。例如,通过化学基团(例如磷酸盐或糖)修饰的蛋白质。

当然,与任何新的潜在药物一样,在批准成为许可药物之前,始终需要对安全性和有效性进行广泛的实验测试(包括在人类志愿者中)。

AlphaFold3确实有一些限制。与它的前身一样,它很难预测缺乏固定或有序结构的蛋白质区域的行为。它在预测蛋白质的多种构象(可能由于药物结合或作为其正常生物学的一部分而改变形状)方面表现不佳,并且无法预测蛋白质动力学。

它还可能会犯一些稍微令人尴尬的化学错误,例如将原子放在彼此的顶部(物理上不可能),以及用镜像替换结构的某些细节(生物或化学上不可能)。

更重要的限制是,至少目前,该代码将不可用,因此必须在纯粹的非商业基础上在DeepMind服务器上使用。尽管许多学术用户不会因此而推迟,但这将限制专家建模者、生物技术人员和药物发现中许多应用的热情。

尽管如此,AlphaFold3的发布看起来肯定会更广泛地激发药物发现和结构生物学领域的新一波创造力,而且我们已经对AlphaFold4充满期待。