逆合成旨在预测产生给定分子的一组反应物,这在生物化学领域(例如分子途径设计和药物发现)中发挥着重要作用。大多数现有方法仅受益于一种信息,而不是进一步考虑分子信息的不同方面。

用于逆合成预测的多流网络

为了解决这个问题,一个研究小组进行了一项研究,现已发表在《计算机科学前沿》上。

该团队提出了一种用于逆合成预测的多流网络,通过使用 SMILES 和 ECFP 描述符从多个角度描述分子。

MSNR由三个主要模块组成:(i)并行CNN和文本CNN,将one-hot编码后的ECFP和SMILES作为输入来产生深层特征。 (ii) 组合表示是通过融合 ECFP 和 SMILES 两种深层特征而设计的,提供了分子表示的深入视角。 (iii)已经实现了三个密集分类器来预测分子反应物的概率,其分别利用不同流提取的深层特征作为分子表示。

通过融合这些具有不同权重的多流预测结果,模型得出最终的逆合成预测。此外,该模型使用整体损失函数进行训练,该函数能够利用每种深度特征中可用的各种信息。