【文献阅读】 Generative Multi-Functional Meta-Atom and Metasurface Design Networks

作者:时间:2019-08-28点击数:

Generative Multi-Functional Meta-Atom and Metasurface Design Networks

Sensong An, Bowen Zheng, Hong Tang, Mikhail Y. Shalaginov, Li Zhou, Hang Li, Tian Gu, Juejun Hu, Clayton Fowler, Hualiang Zhang

——||导读||——

本文题为《生成多功能超原子和超表面的设计网络》,是美国马萨诸塞大学洛厄尔分校Sensong An等人2019813日发表在arxiv.org上的文章。

——||背景||——

超表面由于其在操纵光学波前方面具有很好的性能,并且具有将多功能集成到一个平面光学器件中的潜力而被广泛应用。超表面设计的主要挑战在于它根据特定的要求生成相应的模型的非直观的过程,即使对于简单的形状,超原子中的多极响应也可能非常复杂,因此难以预测对入射波的电磁响应。用传统的数值计算方法虽然可以得到精确的电磁响应,但是是人为的试错方法,因此非常耗时并且低效,尤其是在多功能超表面和超原子设计等高度非线性问题上。

为了解决非直观的设计问题,2018年一些深度神经网络(DNN)被提出用于超表面的设计,其中一个被广泛采用的方法是用生成器结合预训练模拟网络组成级联结构,但这种方法也存在着一些局限性:生成器的特性收到模拟网络的极大限制,即取决于输入的训练数据的范围;级联的反向设计网络只能根据每个输入规范生成一个单一的设计;训练的数据都是由几个参数定义的简单的规则的几何形状,而不是自由形状。

——||创新||——

生成性对抗网络(Generative Adversarial Networks GAN)在2014年被提出,在GAN内,生成网络学习从潜在空间映射到指定的数据分布,而鉴别网络试图区分由生成器给出的候选者与从实际数据分布中提取的候选者。随后又有人提出了条件生成性对抗网络(Conditional Generative Adversarial Nets CGAN)、Wasserstein Generative Adversarial NetworksWGAN)等GAN的变种。

本文的工作是提出了一种结合CGANWGAN设计高自由度的超器件的方法,第一次证明了基于GAN的多功能超原子和超表面设计的深度学习框架。采用这种网络结构的设计实例证实了所提出的方法实现了以下重要目标:第一个自由形式全介电超原子设计网络;第一个自由形式多功能超表面设计网络;第一个由GAN设计的基于表面的透镜和全息图。

——||图文一览||——

图一 超原子生成设计网络的网络架构(Network architecture of the generative meta-atom design network):

 undefined

(a) 所提出网络的示意图。判别网络测量输入和目标图片之间的Wasserstein距离,最大化真实和假样本之间的距离:

 1CCA

生成器网络利用给定的目标条件和噪声相结合产生类似于真实样本的假样本,以混淆判别网络。在这种对抗过程中,这两个组件都通过参数调整来接近实际数据分布。模型完全训练后,生成器和判别器的损失都达到最小:

 undefined

这时,生成器可以生成足够接近真实样本的样本,判别器无法区分真实样本分布和伪样本分布。

(b) 生成器和判别器的结构细节。



图二 训练数据集的收集过程(Training data collection process):

 undefined

(a) 随机生成的超原子的视图。每个超原子的晶格尺寸为2.8μm,高折射率电介质结构的高度固定为1μm。白色代表高折射率介电物质,黑色代表低折射率衬底。

(b) 模式生成过程的示意。将x-y平面中的2D图案网格化以获得更好的视图,每个网格具有0.10.1um的尺寸。以不同颜色勾勒出的矩形代表不同的高折射率的分布,它们随机生成并落在基底画布的左上象限上。通过沿xy轴镜像完成模式。

使用商业软件包CST Microwave Studio Suite来进行全波电磁仿真,一共生成具有不同形状的69,000个超原子并进行模拟,得到它们的宽谱相位和振幅响应。在移除相似模式后, 29,000种模式被保留用于下一步的训练。


图三 一种新的定制梯度惩罚插值方法(A novel interpolation method for customized gradient penalty):

从等式1可以得到当鉴别器是1-Lipschitz函数时,Wasserstein距离才是准确的。为了执行此约束,原始WGAN应用了一个简单粗略的阈值来限制判别器的每一层中的最大权重值。WGAN-GP使用梯度惩罚项来确保其梯度的范数几乎都是1,因此判别器是1-Lipschitz。公式如下:

 undefined

这种插值方法的主要优点是随着训练的进行,这种更广泛分布的梯度范数取代实际样本分布,能够满足Lipschitz约束。

 undefined

(a) WGAN-GP中随机插值过程的示意图,网络在生成样本和实际样本之间随机插值得到梯度惩罚样本

(b) 传统WGAN-GP采用的数值插值方法,超原子模式被二值化,白色代表“1”而黑色代表“0”

(c) 提出的新的几何插值方法,从假样本和真实样本中按随机比例(用红色标记)组合成新模式。

Conclusion:图3说明了传统的数值插值过程不能很好地用于超原子判别器。生成“0”“1”之间的值,其不对应于任何类型的物理结构。采用的新的几何插值方法将不同的对应物按随即比例组合在一起,它充分表征了生成样本和真实样本之间的样本。


图四 使用完全训练的条件WGAN模型生成超原子设计(Meta-atom designs generated using a fully-trained conditional WGAN model:

 undefined

对每个组合的幅度和相位条件,使用训练好的超原子设计网络生成100个超原子。分别是(a0.5+180°,(b0.3+200°,(c0.8+180°,(d0.9+90°,(e0.5+60°和(f0.3+20°。蓝色的点表示使用网络生成的结构的电磁响应,红色点表示目标的电磁响应,右边的子图表示每个超原子的结构,其中红色框线内表示符合要求的响应,其结构在右图中用高亮黄色标出。

这里采用了±0.1幅度误差和±10°相位误差,表一是上图的通过率的统计。

 undefined

为了避免相位突变的问题,在第一层输入之前添加了一个预处理层,将相位和幅度响应转换为复数传输系数。传输系数的实部和虚部形成条件x,使得x= [𝑇real(z), 𝑇imag(z)]


图五 用超原子生成网络设计的全息图(A hologram designed with the meta-atom generative network):

 undefined

(a) 平面图像U的超表面全息成像视图。超表面的设计尺寸为112 x 112 μm2,图像平面距离超表面56μm

(b) 全息成像的目标振幅掩膜。

(c) 全息成像的目标相位掩膜。

(d) 使用超原子生成设计网络,右侧为使用CST模拟仿真得到的振幅和相位。

(e) 图像平面上电场的全波模拟结果。

Conclusion:将超表面分成了40×40个超原子,在50THz的频率上进行实验。可以到全波模拟的结果与设计图像吻合的较好,验证了所提出的网络的性能。


图六 利用双极化超原子生成网络设计的焦点可重构镜头(A focal-reconfigurable lens designed with the dual-polarization meta-atom generative network.):

 undefined

(a) y轴线性偏振入射下操作的焦点可重构透镜的视图。

(b) x轴线性偏振入射下操作的焦点可重构透镜的视图。

(c) 焦点可重构镜头分别在x偏振入射和y偏振入射下的目标相位掩模。

(d) 采用双极化超原子生成网络设计的超表面模式。

(e) y偏振下放大部分的相位和振幅响应。

(f) x偏振下放大部分的相位和振幅响应。

(g) 分别在yx偏振入射下的y-z平面中的全波模拟电场,当偏振方向从y切换到x时,焦点明显从z =60μm偏移到z =80μm

(h) 在两个不同的入射下沿光轴的模拟电场。

Conclusion:将超原子设计网络的条件向量改为

 undefined

网络很容易转变为可极化重构的超原子设计网络。

目标设计镜头在y偏振平面波入射下聚焦在60μm,在用x偏振平面波照射时聚焦在80μm。透镜的面积为140 x 140 μm2,由50×50个超原子组成。

图七 采用双极化元原子生成网络设计的偏振不敏感聚焦透镜(A polarization-independent focusing lens designed with the dual-polarization meta-atom generative network):

 undefined


图八 采用超滤波器生成网络设计的宽带透射超曲面调制器(A wideband transmissive metasurface modulator designed with the meta-filter generative network):

 undefined

(a) 训练集中的目标谱响应。

(b) 用户定义的目标谱响应。

Conclusion:在目标响应来自训练数据集和用户定义的情况下,网络生成的超原子的透射光谱与目标光谱响应很好地吻合。表明所提出的网络具有泛化能力,其不一定受到训练数据分布的限制。


——||结论||——

本文提出并演示了一种基于条件WGAN架构的多功能超原子设计网络。首次提出并采用了一种新的梯度惩罚方法,以及定制的分离复杂系数数据馈送方法来稳定训练。利用训练好的多功能超原子生成模型,对50THz的全息图,双极化焦点可重构镜头,偏振相关镜头和宽带透射调制器进行设计和全波模拟验证。数值结果与理论计算之间有良好的一致性。它可以进一步扩展到解决科学和工程中的其他复杂问题。

文献链接:

https://arxiv.org/abs/1908.04851

报告人:安希鹏,硕士研究生。


版权所有 © 纳米光子学实验室                    地址:华中科技大学新光电大楼C569室、C568室                    联系电话:(027) 8755 7747