在一个由催化剂运行的世界中为什么优化它们仍然如此困难
我们依靠催化剂将牛奶转化为酸奶,用纸浆生产便利贴,并释放生物燃料等可再生能源。寻找特定反应的最佳催化剂材料需要费力的实验和计算密集型的量子化学计算。
通常,科学家会利用图神经网络(GNN) 来捕获和预测原子系统的结构复杂性,只有在将 3D 原子结构细致地转换为图上的精确空间坐标之后,这才是一个有效的系统。
CatBERTa 是一种能量预测 Transformer 模型,由卡内基梅隆大学工程学院的研究人员开发,作为使用机器学习处理分子属性预测的方法。
“这是第一个使用大型语言模型 (LLM) 来完成此任务的方法,因此我们正在开辟一条新的建模途径,”Janghoon Ock 博士说。Amir Barati Farimani 实验室的候选人。
一个关键的区别在于该模型能够直接使用文本(自然语言)而无需任何预处理来预测吸附物-催化剂系统的特性。这种方法非常有益,因为它仍然很容易被人类解释,使研究人员能够将可观察的特征无缝地集成到他们的数据中。
此外,在他们的研究中应用变压器模型提供了重要的见解。自注意力分数对于增强他们对这个框架内可解释性的理解至关重要。
Ock 说:“我不能说它将成为最先进的 GNN 的替代品,但也许我们可以将其用作补充方法。” “正如他们所说,‘越多越好。’”
该模型的预测精度与早期版本的 GNN 相当。值得注意的是,CatBERTa 在有限大小的数据集上进行训练时更加成功。此外,CatBERTa 的错误消除能力超过了现有 GNN。
该团队专注于吸附能,但表示,在给定适当的数据集的情况下,该方法可以扩展到其他属性,例如 HOMO-LUMO 间隙和与吸附物催化剂系统相关的稳定性。
通过将广泛的语言模型的功能与催化剂发现的需求相结合,该团队的目标是简化有效催化剂筛选的过程。Ock正在努力提高模型的准确性。
声明:本站所有文章资源内容,如无特殊说明或标注,均为采集网络资源。如若本站内容侵犯了原著者的合法权益,可联系本站删除。