光作为一种电磁场,具有两个基本组成部分:振幅和相位。然而,通常依赖于光子到电子转换的光学探测器(例如电荷耦合器件传感器和人眼)由于采样频率有限而无法捕获光场的相位。

使用深度学习进行相位恢复

幸运的是,随着光场的传播,相位延迟也会引起幅度分布的变化;因此,我们可以记录传播的光场的幅度,然后计算相应的相位,称为相位恢复。

一些常见的相位恢复方法包括全息/干涉测量、Shack-Hartmann 波前传感、强度方程传输和基于优化的方法(相位恢复)。它们在时空分辨率、计算复杂度和应用范围方面都有各自的缺点。

近年来,作为迈向真正人工智能(AI)的重要一步,通常通过深度神经网络实现的深度学习在相位恢复方面取得了前所未有的性能。

在Light: Science & Applications发表的一篇综述论文中,来自香港大学、西北工业大学、香港中文大学、广东工业大学和麻省理工学院的科学家回顾了各种深度学习相位恢复方法以下四个观点:

相位恢复的深度学习预处理:神经网络在相位恢复之前对强度测量进行一些预处理,如像素超分辨率、降噪、全息图生成、自动对焦等。

用于相位恢复的深度学习处理:神经网络直接执行相位恢复或通过监督或无监督学习模式与物理模型或基于物理的算法一起参与相位恢复过程。

相位恢复的深度学习后处理:神经网络在相位恢复后进行后处理,例如降噪、分辨率增强、像差校正和相位展开。

用于相位处理的深度学习:神经网络将恢复的相位用于特定应用,例如分割、分类和成像模态变换。

为了让读者了解有关阶段恢复的更多信息,他们还提供了实时更新资源(https://github.com/kqwang/phase-recovery)。

当深度学习应用于相位恢复的各种过程时,不仅带来了前所未有的效果,同时也引入了一些不可预测的风险。有些方法可能看起来相同,但存在难以察觉的差异。这些科学家指出了一些类似方法之间的差异和联系,并就如何充分利用深度学习和物理模型进行相位恢复提出了建议:

“需要注意的是,uPD(未经训练的物理驱动)方案不需要大量强度图像作为先决条件,但每次推理都需要多次迭代;而 tPD(训练有素的物理驱动)方案仅通过训练了一次神经网络,但需要大量强度图像进行预训练。”

他们在介绍结构先验网络时说道: “z f是一个固定向量,这意味着神经网络的输入与样本无关,因此神经网络不能像 PD 方法那样进行预训练。” -物理策略。

“基于学习的深度神经网络具有巨大的潜力和效率,而传统的基于物理的方法更加可靠。因此,我们鼓励将物理模型与深度神经网络相结合,特别是对于那些从现实世界中很好地建模的人来说,而不是让物理模型与深度神经网络相结合。深度神经网络作为‘黑匣子’执行所有任务,”科学家们说。