核物理实验是数据密集型的。粒子加速器探测质子、中子和夸克等亚原子粒子的碰撞,以揭示构成物质的细节。在这些实验中测量粒子的仪器会生成大量原始数据。为了更好地处理数据,核物理学家正在转向人工智能和机器学习方法。

智能流式读出系统分析核物理实验的原始数据

最近对使用这种方法的两个流式读出系统进行的测试发现,这些系统能够对原始实验数据进行实时处理。测试还表明,与传统系统相比,每个系统都表现良好。结果发表在TheEuropeanPhysicalJournalPlus上。

流式读出系统使用先进的计算机软件实时收集和分析设备生成的数据。它们具有比传统系统更简单的物理基础设施。此外,它们可以更加强大、高效、快速和灵活。流式读出系统可以最大化从实验中提取的信息,从关于保存哪些数据的初始决定到标记在非常复杂的检测器系统中捕获的意外物理现象。这些系统还存储更多的原始数据以供分析。这允许通过提供整个事件而不是仅触发事件的一小部分来更全面地了解事件。

核物理学要求很高,而且每年都在增加。实验的进步需要强大的软件和计算资源来理解实验产生的大量原始数据。例如,功能强大的连续电子束加速器设施(CEBAF)是能源部(DOE)科学办公室用户设施,位于托马斯杰斐逊国家加速器设施(杰斐逊实验室),每秒启动亚原子粒子级联数千次。

这些实验每天都会产生大量的原始数据。为了利用这些数据,核物理学家依靠基于硬件的“触发”系统来帮助他们根据定时事件对数据进行预分类。一旦检测到特定事件,这些系统只会在短时间内记录数据。

现在,核物理学家正在用基于软件的流读出系统取代触发系统。这些系统利用人工智能和机器学习工具实时处理核物理实验产生的大量数据。

通过这种方式,所有数据都流式传输到数据中心进行分析、标记和过滤。系统自动筛选海量数据,过滤掉不需要的背景,记录下有趣的点点滴滴。通过流式读出系统完成这项工作,实际数据分析只需花费一小部分时间。