【文献阅读】 Deep Neural Network Inverse Design of Integrated Photonic Power Splitters

作者:时间:2019-09-12点击数:

Deep Neural Network Inverse Design of Integrated Photonic Power Splitters

——||导读||——

本文题为《集成光子功率分束器的深度神经网络反向设计》,是201924日发表在www.nature.com/scientificreports上的文章。

——||背景||——

人工设计的亚波长纳米结构材料可用于将入射电磁场控制成特定的透射和反射波前。然而,使用软件如(FDTD)进行数值仿真得到大量可能的结构,在计算上是costly的。神经网络(NNs)可用于预测拓扑的光学响应(前向设计)以及设计目标光学响应的拓扑(反向设计)。

——||创新||——

纳米结构集成光子功率分配器的目标是操作光学相互作用,将光束按一定的功率强度引导到目标端口。为了设计具有任意分光比的光子功率分配器,设计者通常从基于分析模型的整体结构开始,并在数值模拟中使用参数扫描微调结构。

本文的目标是训练一个NN,它可以快速设计一个具有用户指定的分光比的集成光子功率分配器。集成光子器件的设计空间远大于之前的光学散射应用,这些应用需要强大的深层网络,如ResNet。本文证明了使用深度学习方法,可以在紧凑的(compactResNet网络模型中有效地学习宽带集成光子功率分配器的设计空间。用户只需要求特定的功率分配性能,并且几乎可以立即看到近乎理想的解决方案,而不依赖于耗时的FDTD仿真。


——||图文一览||——

图一 DNN预测和反向设计过程示意图:

 undefined

(a) TE模式在功率分配器的输入端口处被发射到标准SOIsilicon-on-insulator)波导中(注意,x方向和y方向上的比例是不同的)。

(b) 纳米结构集成光子功率分配器的示意图,面积为2.6×2.6μm2。圆圈表示蚀刻孔(Si)的位置;通过优化蚀刻孔位置的二进制序列,可以调节光传播到任一端口。

(c) 使用DNN进行纳米光子器件的正向和反向建模。DNN可以将器件拓扑设计作为网络的输入,光谱响应作为标签。反之亦然。

实验在标准的完全蚀刻SOI平台上选择了简单的三端口结构。一个输入和两个输出连接到2.6μm宽的方形功率分配器设计区域,连接宽度为1.3μm。正向建模的输入数据是若干20×20孔矢量(HV),标签由端口1T 1)和端口2T 2)的光谱传输响应(SPEC)和输入端口(R)的反射来表示。每个pixel是半径为45nm的圆,蚀刻(n = nSi)的每个pixel表示为1,未蚀刻(n = nSiO2)的pixel表示为0。改变孔位置处的折射率会改变功率分配器内部的局部有效折射率,以确定器件中行波的传播路径。



图二 使用数据训练DNN网络:

 undefined

(a) 不对称的孔矢量。T1T2分别是端口12的发送功率;R是输入端口的反射光功率。用初始孔向量开始优化,并使用单步长二进制搜索来最大化

 undefined

(b) 对称的孔矢量。对于对称情况,端口1和端口2的传输是相同的(T1 = T2)。用初始孔向量开始优化,并使用单步长二进制搜索来最大化

 undefined

(c) 通过数值方法收集的在1550nm处的约20,000个功率分配器拓扑的所有传输序列和测试数据标签的直方图。

(d) 训练(线)和测试(点)损失函数的学习曲线。网络恒定隐藏层宽度为100且深度为4, 810ResNet网络的学习曲线显示网络通过增加网络深度达到8层来减少损失。插图显示了FCDNN(全连接深度神经网络)的最佳情况(4层),其具有更大的损失值,约为0.58

对于前向问题,输入是对应于孔位置的二进制图像的二维20×20HV阵列。训练DNN来预测SPEC矢量,它是具有63个元素的一维矢量。SPEC包括用于在输出端口T1T2处传输的宽带光谱数据(14501650 nm),以及到输入端口R的反射。对于反向设计,SPEC用作输入,孔向量被视为标签。前向问题作为回归问题解决,使用高斯对数似然函数来训练模型。相反,反向问题作为分类问题被解决,其中预测的是表示孔位置的二元向量,因此使用伯努利对数似然分类器作为训练反向问题的损失函数。

对于这两个问题,首先使用具有多个层的完全连接的DNNFCDNN),其中每层具有100个神经元。但是,实验发现增加FCDNN的深度并没有改善网络的性能,因此使用残差深度神经网络(ResNet)来改善网络。这是因为FCDNN通常遭受梯度消失的问题,所以增加FCDNN的深度不一定会改善性能。ResNet旨在通过使用自身快捷连接 “identity shortcut connections”)来解决这个问题,其认为是优化残差映射比优化原始映射更容易。与FCDNN相比,ResNet在深层架构方面具有更大的灵活性。在两种网络架构中都使用sigmoidσ)激活函数。增加FCDNN的深度并不一定会改善性能。ResNet旨在使用额外的功能,以通过增加网络深度来实现准确性。

图三 用于平面FCDNNa)和ResNet DNNb)的网络架构,用于集成纳米光子学的反向设计:

 undefined


图四 使用ResNet网络进行频谱响应的近似:

 undefined

建模的过程使用16,000(总数的80%)输入数据进行训练,使用4,000(总数的20%)数据进行测试。abc是三个代表性功率分配器的ResNet预测光谱响应与数值验证的光谱响应的比较。黑色,蓝色和红色分别代表端口1的传输,端口2的传输和输入端口的反射。实线是给定孔矢量的真值,虚线是使用ResNet预测的光谱响应。

图五 相关系数:

 undefined

ResNet预测值与端口1a)和端口2b)的真实值进行拟合。相关系数R高于0.995,灰色圆圈符号大小与梯度不确定性成比例。


图六 DNN反向设计示意图:

 undefined

使用ResNet DNN反向设计效率值为90%的功率分配器。ah分别为分光比为1:11:1.051:1.51:1.551:21:2.51:31:3.58组器件。光谱响应曲线表明,预测的二进制模式的数值验证的透射和反射光功率(虚线)与目标宽带光谱(实线)很好地匹配。使用FDTD模拟计算在1550nm下操作的每个装置的电磁能密度图(右)。

——||结论||——

本文证明了DNN在纳米结构集成光子器件设计中的应用。通过利用ResNet DNN架构训练大约20,000组数据得到了一个网络,可以近似拟合设计空间内的任意二维HV对应的光谱响应。此外,文章提出可以使用反向网络为任何用户特定的功率分配比设计优化的功率分配器拓扑。DNN在预测拓扑的光学响应和反向设计方面的能力有望在纳米结构光子系统的设计中得到广泛使用。

文献链接:

https://www.nature.com/articles/s41598-018-37952-2

报告人:安希鹏,硕士研究生。


版权所有 © 纳米光子学实验室                    地址:华中科技大学新光电大楼C569室、C568室                    联系电话:(027) 8755 7747