多伦多大学的研究人员开发了一种名为PepFlow的深度学习模型,可以预测肽的所有可能形状——比蛋白质短但具有相似生物学功能的氨基酸链。

研究人员开发出深度学习模型其预测肽结构的能力超越谷歌人工智能系统

PepFlow结合了机器学习和物理学,根据肽的能量状况模拟肽可能呈现的折叠模式范围。与蛋白质不同,肽是非常动态的分子,可以呈现一系列构象。

“到目前为止,我们还无法对肽的全系列构象进行建模,”这项研究的第一作者、多伦多大学唐纳利细胞和生物分子研究中心分子遗传学博士毕业生奥萨马·阿布丁(OsamaAbdin)说道。“PepFlow利用深度学习在几分钟内捕捉到肽的精确构象。该模型有可能通过设计充当粘合剂的肽来指导药物开发。”

肽在人体中的作用与其折叠方式直接相关,因为其三维结构决定了它与其他分子的结合和相互作用方式。众所周知,肽具有高度灵活性,具有多种折叠模式,因此参与了许多研究人员在治疗学开发中感兴趣的生物过程。

“肽是PepFlow模型的重点,因为它们是非常重要的生物分子,而且它们自然非常活跃,所以我们需要模拟它们的不同构象来了解它们的功能,”这项研究的首席研究员、唐纳利中心的教授PhilipM.Kim说。“它们作为治疗剂也很重要,从用于治疗糖尿病和肥胖症的GLP1类似物(如Ozempic)可以看出。”

金姆同时也是多伦多大学文理学院的计算机科学教授,他表示,与较大的蛋白质相比,肽的生产成本也更低。

新模型扩展了领先的GoogleDeepmindAI系统AlphaFold预测蛋白质结构的能力。PepFlow可以生成给定肽的一系列构象,从而超越AlphaFold2,而AlphaFold2的设计初衷并非如此。

PepFlow的与众不同之处在于其背后的技术创新。例如,它是一种广义模型,其灵感来自玻尔兹曼生成器,这是一种非常先进的基于物理的机器学习模型。

PepFlow还可以模拟具有不寻常形状的肽结构,例如由大环化过程产生的环状结构。肽大环目前是药物开发中非常有前景的领域。

虽然PepFlow在AlphaFold2的基础上有所改进,但它本身也有局限性,因为这只是模型的第一个版本。研究作者指出了PepFlow可以改进的多种方式,包括使用溶剂原子的明确数据训练模型,溶剂原子会溶解肽形成溶液,以及对环状结构中原子之间距离的限制。

PepFlow的设计初衷是易于扩展,以考虑更多因素、新信息和潜在用途。即使是第一个版本,PepFlow也是一个全面而高效的模型,具有进一步开发依赖肽结合来激活或抑制生物过程的治疗方法的潜力。

“使用PepFlow建模可以深入了解肽的真实能量状况,”Abdin说。“开发PepFlow花了两年半的时间,训练它只花了一个月的时间,但值得迈向下一个前沿,超越仅预测肽的一种结构的模型。”