One-step robust deep learning phase unwrapping
KAIQIANG WANG, YING LI, QIAN KEMAO, JIANGLEI DI, AND JIANLIN ZHAO
——||导读||——
本文题为《单一鲁棒深度学习的相位展开》,是西北工业大学赵建林课题组2019年5月10日发表在《Optics Express》上的文章。
——||背景||——
相位计算在许多测量和图像处理中至关重要,然而直接由复指数计算出来的相位被折合到(-Π,Π]的范围内,需要将相位展开才能对其潜在的物理量进行测量和计算。解决相位展开问题有两种经典空间方法:最小范数法和路径跟踪法。但是,当相位中包含噪声和锯齿(欠采样)时,最小范数法无法限制由空间奇异点造成的错误相位传播,而路径跟踪法会遇到多径问题。除了空间方法,也有人提出了时域相位展开方法,但是无法实现单个相位的展开。
——||创新||——
深度学习是利用神经网络来模拟人类大脑从而进行模拟学习。神经网络起源于1943年提出的MCP智能网络,后来因为梯度消失进入了瓶颈期,2006年之后Hinton提出了解决方案,随后深度学习又如雨后春笋般发展起来。深度学习应用于很多图像科学中来解决反向问题,如超分辨率成像、CT、磁共振成像等,因此作者想到是否也可用深度学习来实现相位展开。
针对于处理相位展开问题,文章提出了单一深度学习相位展开法(deep learning phase unwrapping,DLPU)和以相位为目标的数据库生成法。该网络训练学习到了折合相位和其对应的展开相位的映射关系,运行的速度快(30ms可以展开一个256×256像素的相位图)。最后通过展开活体小鼠成骨细胞相位图像和动态蜡烛火焰相位图像验证了该网络的泛化性。
——||图文一览||——
图一 真实相位生成的示例:
生成真实相位有两个步骤:产生一个值域为(2,100)的随机矩阵,实验中矩阵大小为2×2到25×25;然后利用插值法将矩阵放大到256×256。
(a) 2×2方阵生成真实矩阵。
(b) 3×3方阵生成真实矩阵。
(c) 5×5方阵生成真实矩阵。
(d) 10×10方阵生成真实矩阵。
Conclusion:实验中生成了37,500个真实的相位图,然后按照公式(1)将其折合成(-Π,Π]。分别用其中的80%、10%、10%作为训练集、验证集和测试集。在训练集中随机加入高斯噪声、椒盐噪声和乘性噪声。
图二 网络训练和测试示意图:
(a) 网络训练流程图,橙色部分和蓝色部分是相反的过程。
(b) 网络测试流程图,将折合的相位输入训练好的网络,然后输出展开后的真实相位。
图三 DLPU的CNN网络架构示意图:
Conclusion:此网络参考U-Net和ResNet。网络由3部分组成,分别为收缩路径(contracting path)、扩张路径(expansive path)和过度网络。收缩路径可以理解为一种下采样,通过卷积将输入信息转化为更高维度的多层抽样信息;相应地,扩张路径则是通过反卷积将高维信息转化为可以输出的低维信息。
参考 U-Net: Convolutional Networks for Biomedical Image Segmentation
图四 DLPU的CNN网络结果:
Conclusion:为了避免过拟合(overfitting),在验证数据集中网络性能开始下降时停止训练。CNN结果的SSIM(structural similarity)为0.991。在水平和竖直方向上分别展开,得到CNN训练的均方根误差和最大误差为0.09Π和0.17Π。上述结果表明了DLPU的实用性和精确性都很高。
图五 抗噪声性能测试:
LS(least square):最小二乘法,是最小范数法的一种;
QG(quality-guided):质量导向算法,是路径跟踪法的一种。
Conclusion:实验比较了三种相位展开方法的SSIM。LS和QG的SSIM低于0.27,而CNN从1降到0.75。经过窗口傅里叶变换(window Fourier transform)后得到的结果如上图。图5证明了在复合噪声环境下DLPU方法远优于LS和QG法,甚至由于WFT-LS和WFT-QG法。
图六 抗锯齿性能测试:
图七 活体小鼠成骨细胞相位展开测试:
首先通过TIE(transport of intensity equation)法获得活体小鼠的成骨细胞,然后利用公式(1)折合相位,最后用三种不同的方法来进行相位展开。
图八 动态蜡烛火焰的相位测试:
动态蜡烛火焰的相位是用Mach-Zehnder干涉仪通过全息成像得到,选取了8组进行相位展开。
图九 利用动态蜡烛火焰相位作抗锯齿性能测试:
从火焰相位中随机选择一个,然后将其线性映射到0-200弧度。折合后分别用LS、QG和DLPU方法进行相位展开。
(I) 折合相位;
(II) 真实相位;
(III) 锯齿图;
(IV) DLPU结果的3D示图;;
(V) LS结果的3D示图;
(VI) QG结果的3D示图;
(VII) DLPU结果的误差图;
(VIII) LS结果的误差图;
(IX) QD结果的误差图。
图十 训练数据集的频谱分析:
(a)相位图具有相同的分布,但是高度不同,从5弧度到85弧度,可以看到折合后的相位的高频信息增加。
(b)相位图具有相同的高度,但是矩阵的尺寸不同,分别为5×5、10×10、15×15、20×20、25×25,随着矩阵尺寸的增大折合后相位的高频分量增加。
Conclusion:初始随机矩阵的大小决定了最终实际阶段中极值点的数量和位置,初始矩阵的设计对于数据集的制作十分重要。
图十一 火焰相位和训练集中两个最相似相位的比较:
可视化最大池化操作之前的5个卷积层网络,卷积越深,图像越相似。此图为DLPU网络泛化能力的具体体现。
——||结论||——
文章针对于相位展开生成了一套数据集,并提出和验证了一种基于深度学习的相位展开方法,在有噪声和锯齿的条件下,DLPU方法相较于LS和QG两种传统方法具有更好的鲁棒性。文章通过活体小鼠成骨细胞相位展开和动态蜡烛火焰相位展开的实验,证明了CNN具有很高的泛化性。作者后续将在评估相位不连续性的影响等方面做更多的研究。
文献链接:
https://www.osapublishing.org/oe/abstract.cfm?uri=oe-27-10-15100
报告人:安希鹏,硕士研究生。