伊利诺伊大学厄巴纳-香槟分校和密歇根大学(UM)的研究人员开发了一种名为BacterAI的人工智能(AI)系统,该系统使机器人能够进行自主科学实验——每天多达10,000次——有可能推动从医学到农业再到环境科学领域的发现步伐的巨大飞跃。

AI平台在没有先验知识的情况下发现微生物的营养需求

由现就职于密歇根大学的PaulJensen博士领导的研究人员在《自然微生物学》的“白板学习”平台上发表报告,描述了BacterAI如何绘制与口腔健康相关的两种微生物的代谢图,尽管没有基线起始信息。在题为“BacterAI在没有先验知识的情况下绘制微生物代谢图”的论文中,研究人员解释道,“BacterAI通过将科学问题转化为与实验室机器人一起玩的简单游戏来学习。然后,智能体将其发现提炼成人类科学家可以解释的逻辑规则。”

詹森和同事所说的“微生物组革命”已经确定了数千种值得科学研究的细菌,但正如作者指出的,大多数细菌物种仍未得到研究。他们继续说,人工智能和自动化可以提供一种进行这项研究的方法。“……用挖掘科学文献并设计新实验的算法取代人类。”然而,尽管研究最少的细菌将从自动化研究中受益最多,但具有讽刺意味的是,研究人员指出,“数据的缺乏使得部署自主代理来研究这些物种变得困难。”

深度强化学习(RL)是人工智能的一个分支,其中代理可以通过反复试验来解决一些游戏,即使他们没有任何事先的策略知识,甚至不知道游戏规则。科学家们表示:“因此,将生物学研究问题转化为游戏可以使用强化学习技术来研究微生物。”“我们开发了一种RL代理,通过自动化实验‘玩弄’科学来解决组合大型研究问题。”

细菌消耗维持生命所需的20种氨基酸的某种组合,但每个物种都需要特定的营养物质才能生长。密歇根大学团队想知道我们口腔中的有益微生物需要哪些氨基酸才能促进其生长。

“我们对大多数影响我们健康的细菌几乎一无所知。了解细菌如何生长是重新设计微生物组的第一步,”该项目开始时,密歇根大学生物医学工程助理教授、伊利诺伊大学保罗·詹森(PaulJensen)说道。

然而,弄清楚细菌喜欢的氨基酸组合是很棘手的。仅根据每种氨基酸是否存在,这20种氨基酸就可以产生超过一百万种可能的组合。然而,BacterAI能够发现口腔细菌戈登链球菌和血链球菌生长所需的氨基酸。

与将标记数据集输入机器学习模型的传统方法不同,BacterAI通过一系列实验创建自己的数据集。为了找到适合每个物种的配方,BacterAI每天测试数百种氨基酸组合,根据前一天的结果磨练其重点并每天早上更改组合。“BacterAI不能依赖于对每种组合进行强力搜索,”该团队继续说道。“相反,它必须选择信息最丰富的实验并训练计算模型来预测未经测试的组合的结果。”

通过分析之前的试验结果,它可以预测哪些新实验可能会为其提供最多的信息。结果,BacterAI通过不到4000次的实验就弄清楚了大部分喂养细菌的规则。在9天内,它在90%的情况下都能做出准确的预测。

詹森补充道:“当孩子学习走路时,他们不仅仅是看着成年人走路,然后说‘好吧,我明白了’,然后站起来,开始走路。他们首先摸索并进行一些尝试和错误。我们希望我们的人工智能代理能够采取步骤并跌倒,提出自己的想法并犯错误。每一天,它都会变得更好一点,更聪明一点。”研究小组指出,使用这种方法,人工智能系统能够梳理出两种微生物之间需求的差异,“从空白中学习可以避免先验知识产生偏差。使用BacterAI,我们了解到另一种口腔微生物,血链球菌,与戈登链球菌具有不同的氨基酸营养缺陷型,尽管这两个物种密切相关并且生活在相同的环境中。”

大约90%的细菌几乎没有进行过研究,而且使用传统方法了解有关细菌的基本科学信息所需的时间和资源也令人望而生畏。自动化实验可以极大地加速这些发现。该团队一天内进行了多达10,000次实验。

研究人员在论文中总结道:“白板学习避免了对有机体任何先验知识的需要。”“以前的自动化生物学系统开发并测试了从科学文献中收集的假设。这些项目必须研究具有广泛先验知识的模型生物体,以训练代理模型。BacterAI能够仅从自己的数据中学习,从而能够研究微生物学的未知角落。”

但这些应用超出了微生物学的范围。任何领域的研究人员都可以将问题设置为谜题,让人工智能通过这种反复试验来解决。“随着过去几个月主流人工智能的爆炸式增长,许多人不确定它将在未来带来什么,无论是积极的还是消极的,”詹森实验室前工程师、《研究。“但对我来说,很明显,像我们的项目这样的人工智能的集中应用将加速日常研究。”