通过显微镜观察单个细胞可以揭示一系列重要的细胞生物学现象,这些现象经常在人类疾病中发挥作用,但区分单个细胞及其背景的过程非常耗时,而且是一项非常适合的任务寻求人工智能帮助。

人工智能工具创建细胞的合成图像以增强显微镜分析

学习如何通过使用一组由人类注释的数据来执行此类任务,但是将细胞与其背景区分开来的过程(称为“单细胞分割”)既耗时又费力。因此,可用于人工智能训练集中的注释数据数量有限。加州大学圣克鲁斯分校的研究人员开发了一种方法来解决这个问题,通过构建显微镜图像生成来创建单细胞的逼真图像,然后将其用作“合成数据”来训练,以更好地进行单细胞分割。

“从我们的模型中得出的图像已准备好用于训练分割模型,”Shariati说。“从某种意义上说,我们是在没有显微镜的情况下进行显微镜检查,因为我们能够生成在单细胞形态细节方面非常接近细胞真实图像的图像。它的美妙之处在于,当它们出来时在模型中,它们已经被注释和标记了,这些图像与真实图像有很多相似之处,这使我们能够生成模型在训练过程中未见过的新场景。”

通过显微镜看到的单个细胞的图像可以帮助科学家了解细胞随时间的行为和动态,改进疾病检测并寻找新药物。纹理等亚细胞细节可以帮助研究人员回答重要问题,例如细胞是否癌变。

然而,从背景中手动查找和标记细胞的边界非常困难,特别是在图像中有许多细胞的组织样本中。研究人员可能需要几天时间才能对100张显微镜图像进行手动细胞分割。

深度学习可以加速这个过程,但需要一个带注释图像的初始数据集来训练模型——至少需要数千张图像作为基线来训练准确的深度学习模型。即使研究人员可以找到并注释1000张图像,这些图像也可能不包含在不同实验条件下出现的特征变化。

分割前后的细胞图像示例,该过程使研究人员能够区分单个细胞及其背景。图片来源:AliShariati等人

“你想展示你的深度学习模型在具有不同细胞类型和不同图像质量的不同样本中的工作原理,”扎加里说。“例如,如果你用高质量图像训练你的模型,它就无法分割低质量的细胞图像。我们很少能在显微镜领域找到如此好的数据集。”

为了解决这个问题,研究人员创建了一种图像到图像生成,该模型采用有限的一组带注释、标记的细胞图像并生成更多图像,引入更复杂和多样化的亚细胞特征和结构,以创建一组多样化的“合成”图像图片。值得注意的是,它们可以生成具有高密度细胞的注释图像,这特别难以手动注释,并且与研究组织特别相关。该技术可处理和生成不同细胞类型以及不同成像方式的图像,例如使用荧光或组织学染色拍摄的图像。

领导生成模型开发的扎加里采用了一种常用的人工智能算法,称为“循环生成对抗网络”来创建逼真的图像。生成模型通过所谓的“增强功能”和“风格注入网络”得到增强,这有助于生成器创建各种高质量的合成图像,显示细胞外观的不同可能性。据研究人员所知,这是首次在这种情况下使用样式注入技术。

然后,生成器创建的这组多样化的合成图像用于训练模型,以对实验期间拍摄的新的真实图像准确地进行细胞分割。

“使用有限的数据集,我们可以训练一个好的生成模型。使用该生成模型,我们能够生成更多样化、更大的带注释的合成图像集。使用生成的合成图像,我们可以训练一个好的分割模型——这是主要想法,”扎加里说。

研究人员将使用合成训练数据的模型结果与更传统的训练人工智能方法进行比较,以对不同类型的细胞进行细胞分割。他们发现,与使用传统的有限训练数据训练的模型相比,他们的模型产生了显着改进的分割。这向研究人员证实,在分割模型的训练过程中提供更多样化的数据集可以提高性能。

通过这些增强的分割能力,研究人员将能够更好地检测细胞并研究单个细胞之间的变异性,特别是干细胞之间的变异性。未来,研究人员希望利用他们开发的技术超越静态图像来生成视频,这可以帮助他们查明哪些因素影响细胞生命早期的命运并预测它们的未来。

“我们正在生成合成图像,这些图像也可以变成延时电影,我们可以在其中生成细胞看不见的未来,”沙里亚蒂说。“这样,我们想看看是否能够预测细胞的未来状态,比如细胞是否会生长、迁移、分化或分裂。”