加州大学洛杉矶分校的研究人员开发了一种“一体化”的下一代统计模拟器,能够吸收广泛的信息以生成逼真的合成数据,并为使用先进技术研究疾病和潜在疾病的医学和生物学研究人员提供基准工具疗法。具体来说,新的计算机建模(或“insilico”)系统可以帮助研究人员评估和验证计算方法。

能够密切模拟单细胞和空间基因组学数据的基准测试工具

单细胞RNA测序,称为单细胞转录组学,是分析细胞基因组成(全基因组基因表达水平)的基础。其他“组学”的引入提供了一系列分子特征的详细信息,近年来,空间转录组学技术使得利用细胞“邻域”的空间位置信息来分析基因表达水平成为可能,从而显示细胞在其中的精确位置和运动组织。

“已经开发了数以千计的计算方法来分析各种任务的单细胞和空间组学数据,这使得方法基准测试成为方法开发人员和使用人员面临的紧迫挑战,”加州大学洛杉矶分校研究员JingyiJessicaLi博士说,统计学、生物统计学、计算医学和人类遗传学教授。李还隶属于加州大学洛杉矶分校琼森综合癌症中心的基因调控研究领域。李领导了一个名为统计与生物学交界处的研究小组。

“虽然模拟器已经进化并变得更强大,但也有很多局限性。很少有人可以通过模拟真实数据从连续的细胞轨迹生成逼真的单细胞RNA测序数据,而且大多数缺乏模拟多组学和空间转录组学数据的能力。我们推出了scDesign3,我们认为它是迄今为止最真实、最通用的模拟器,以填补研究人员的基准测试需求与现有工具的局限性之间的差距,”5月11日发表在《自然生物技术》上的一项研究的资深作者李说。

加州大学洛杉矶分校的研究人员表示,他们相信scDesign3“提供了第一个概率模型,统一了单细胞和空间组学数据的生成和推理。配备可解释的参数和模型可能性,scDesign3超越了多功能模拟器,并且具有生成定制化数据的独特优势insilico数据,它可以作为计算分析的阴性和阳性对照,并以无监督的方式评估推断的细胞簇、轨迹和空间位置的拟合优度。”拟合优度衡量统计模型与一组观察值的拟合程度。

这组作者说,该系统的“透明建模和可解释参数可以帮助用户探索、更改和模拟数据。总的来说,scDesign3是一个多功能套件,用于基准计算方法和解释单细胞和空间组学数据。”