如果没有人工智能和机器学习(ML),现代天文学将举步维艰,而这两者已成为不可或缺的工具。只有它们才有能力管理和处理现代望远镜产生的大量数据。ML可以筛选大型数据集,寻找人类需要花费更长时间才能找到的特定模式。

加快寻找宜居星球

在类似地球的系外行星上寻找生物特征是当代天文学的一个重要部分,而机器学习可以在其中发挥重要作用。

由于系外行星距离我们如此遥远,天文学家密切关注那些允许透射光谱的行星。当星光穿过行星大气层时,光谱可以将光分解成不同的波长。然后天文学家检查光线以寻找特定分子的迹象。然而,系外行星大气层中的化学生物特征很棘手,因为自然的非生物过程可以产生一些相同的特征。

虽然这种方法很有效,但它也面临一些挑战。恒星活动(如星斑和耀斑)会污染信号,而大气发出的光与恒星发出的光相比可能非常微弱。如果系外行星的大气中有云或雾霾,那么在光谱数据中检测分子吸收线将变得困难。

这是JWST类地行星的透射光谱模型。它显示了臭氧(O3)、水(H2O)、二氧化碳(CO2)和甲烷(CH4)等分子吸收的阳光波长。y轴表示被地球大气层阻挡的光量,而不是穿过大气层的阳光亮度。亮度从下到上逐渐降低。了解地球光谱有助于科学家解释系外行星的光谱。图片来源:NASA、ESA、LeahHustak(STScI)

瑞利散射增加了难度,而且对同一光谱信号也可能有多种不同的解释。信号中这类“噪声”越多,信噪比(SNR)就越差。噪声数据(SNR较低的数据)是一个明显的问题。

我们仍在探索不同类型的系外行星和行星大气层,我们的模型和分析技术还不完善。再加上低信噪比问题,这对行星构成了重大障碍。

但新研究表明,机器学习可以提供帮助。《使用低信噪比透射光谱对类地系外行星中的潜在生物特征进行机器辅助分类》是一篇发布在arXiv预印本服务器上的论文,该论文正在接受皇家天文学会月刊的审查。主要作者是哥伦比亚麦德林安蒂奥基亚大学计算物理和天体物理组的DavidS.Duque-Castaño。

JWST是我们最强大的透射光谱工具,它取得了令人印象深刻的成果。但有一个问题:观测时间。一些观测工作需要大量时间。要探测到臭氧等物质,可能需要进行大量凌日。如果我们有无限的观测时间,那就没那么重要了。

一项研究表明,就TRAPPIST-1e而言,可能需要多达200次凌日才能获得具有统计意义的探测结果。如果搜索仅限于甲烷和水蒸气,凌日次数会变得更加合理。

作者写道:“研究表明,利用合理数量的大气过境,可以恢复这些大气物种的存在,这些物种通常与全球生物圈有关。”不幸的是,甲烷并不像臭氧那样具有强大的生物特征。

考虑到检测这些潜在生物标记所需的时间,研究人员表示,最好使用JWST进行信噪比(SNR)调查。“虽然这可能无法进行具有统计意义的检索,但至少可以规划未来使用当前和未来更强大的望远镜(例如ELT、LUVOIR、HabEx、Roman、ARIEL)对有趣目标进行后续观测,”作者写道,并引用了正在建造或规划阶段的望远镜的名称。

研究人员开发了一种机器学习工具来帮助解决这个问题。他们表示,该工具可以利用人工智能的力量,加快寻找宜居星球的进程。他们写道:“在这项工作中,我们开发并测试了一种机器学习通用方法,旨在根据低信噪比的透射光谱包含生物特征的可能性对其进行分类。”

由于我们的大部分系外行星大气光谱数据都是噪音,因此ML工具旨在对其进行处理,找出其噪音程度,并对可能含有甲烷、臭氧和/或水的大气进行分类,或对可能值得进行后续观察的大气进行分类。

该团队根据著名的TRAPPIST-1e行星生成了100万个合成大气光谱,然后对其机器学习模型进行训练。TRAPPIST-1e的大小与地球相似,是一颗位于其恒星宜居带的岩石行星。论文指出:“近年来,TRAPPIST-1系统因其特殊特性而引起了科学界的广泛关注,尤其是在行星科学和天体生物学领域。”

TRAPPIST-1恒星以拥有我们所发现的所有系统中最多的岩石行星而闻名。对于研究人员来说,它是训练和测试ML模型的理想候选者,因为天文学家可以在合理的时间内获得有利的SNR读数。TRAPPIST-1e行星很可能拥有像地球一样的紧凑大气层。由此产生的模型是成功的,并正确识别了具有合适SNR水平的透射光谱。

研究人员还在现代地球真实的合成大气光谱上测试了他们的模型。他们的系统成功识别了合成大气中甲烷和/或臭氧的比例与元古代地球相似。在元古代,大气因大氧化事件(GOE)而发生了根本性变化。

大氧事件改变了一切。它使臭氧层得以形成,为复杂生命的繁衍创造了条件,甚至导致了我们今天开采的大量铁矿的形成。如果其他系外行星发展出光合生命,它们的大气层应该与元古代地球的大气层相似,因此它是生物生命的相关标志。(最近发现的暗氧对我们理解氧气作为系外行星大气中的生物标志物具有重要意义。)

在论文中,作者将氧气或臭氧的检测描述为系外行星光谱特征的“皇冠上的宝石”。但也有非生物来源,氧气或臭氧是否来自生物取决于特征中的其他内容。他们写道:“要区分生物和非生物的O2,​​可以寻找特定的光谱指纹。”

为了评估其模型的性能,他们需要了解更多信息,而不仅仅是哪些系外行星大气被正确识别(真),哪些系外行星大气被错误识别(假)。

结果还需要分类为与准确性相关的真阳性(TP)或真阴性(TN),或错误阳性(FP)或错误阴性(FN)。为了组织数据,他们创建了一个分类系统,称为混淆矩阵。

“在图中,我们引入了有趣类别,以区分值得后续观察或深入分析的行星,”作者解释道。“我们应该再次回顾,这是这项工作的重点:我们的目标不是使用机器学习检测生物特征,而是标记有趣或不有趣的行星。”

混淆矩阵有四种分类。

其中一个模型成功地在一次凌日之后就识别出了元古代地球光谱中可能的生物特征。根据他们的测试,他们解释说,JWST可以成功探测到大多数“使用JWST/NIRSpecPRISM观测到的位于距离TRAPPIST-1e相似或更小的M矮星周围的有人居住的类地行星”。如果它们存在的话。

这些结果可以完善JWST未来的工作。研究人员写道:“与本文介绍的类似的机器辅助策略可以显著优化JWST资源在生物特征搜索中的使用。”

他们可以简化流程,并最大限度地提高后续观测发现有希望的候选者的机会。该望远镜已经完成了计划为期五年半的主要任务,目前已两年零七个月。(尽管望远镜的总使用寿命可达20年。)任何可以优化太空望远镜宝贵观测时间的事情都是胜利。

总而言之,这项研究提出了一种可以节省时间和资源的机器学习模型。它可以快速筛选潜在宜居系外行星的大气光谱。虽然它无法确定哪些行星含有生物标记,但它可以在仅1到5次凌日之后确定最佳的后续候选者,具体取决于大气类型。有些类型可能需要更多凌日,但该模型仍然节省时间。

他们写道:“将一颗行星认定为有趣的行星只会使詹姆斯·韦伯太空望远镜等宝贵资源的观测时间分配更加高效,这是现代天文学的一个重要目标。”