AI For Science专题
利用人工智能技术解决科学研究中的高纬度复杂问题
人工神经网络(ANN)
案例下载

基于人工神经网络模型逆向设计Y-brach光波导器件

GMPT, 2024/09/09

   近年来,基于神经网络逆向设计纳米光子结构的电磁响应逐渐成为热门的研究方向。通常,逆向设计器件的仿真中,每次迭代都至少需要运行一次完整的模拟计算,而基于神经网络模型的逆向设计,可以通过建立正向神经网络快速预测已知结构对应的电磁响应,来替代传统的全波电磁仿真方法,能够大大缩短生成电磁响应所需的时间。
   本文基于人工神经网络模型逆向设计Y-branch光波导器件,首先构建Y-branch光波导器件的仿真数据库,再使用该数据库,训练根据人工神经网络(Artificial Neural Network)构建的模型,最后通过逆向设计优化构建好的神经网络模型,从而减少仿真设计的计算耗时,并得到优化透射率的Y-branch光波导器件结构。


图1. 基于ANN的Y-Branch设计流程

一、逆向设计器件基本案例介绍

   本文中逆向设计器件结构与《逆向设计Y-branch光波导器件》 相同。首先,对连接输入输出端口之间的波导结构,使用多边形几何,将波导顶点相连形成边缘轮廓为直线的锥形结构,以此作为设计Y-branch 的轮廓线的初始输入。然后,利用三次样条插值函数构建的曲线作为 Y-branch 器件结构的轮廓。最后,将输出波导处透射率与目标透射率的差值作为优化目标。

二、人工神经网络的应用

   人工神经网络(ANN)是一种受生物神经网络启发的计算模型,通过多个节点(称为神经元)相互连接和权重调整来模拟人脑的学习和决策过程,常用于模式识别、分类和预测等任务。


图2. 人工神经网络(ANN)

   ANN在光波导器件设计中的应用主要是利用神经网络的强大预测能力,通过已知数据集来构建特征参数和器件性能参数之间的映射关系模型,在模型训练成熟之后替代仿真输出器件在新特征数据下的性能参数,并依此来指导后续的逆向设计和优化过程。由于基于人工神经网络构建起的模型计算速度远快于相同参数下仿真的计算速度,故而可以在使用ANN模型替代仿真后大幅加速优化过程。
   对于 Y-branch 光波导器件的设计,通过ANN构建模型学习器件结构与性能之间的关系,快速预测不同设计参数下的器件性能,从而相比传统的基于仿真进行优化设计,大大减少优化过程的时间。

1. 参数列表构建
   结合上文的逆向设计器件结构介绍,可知本案例中的特征参数为轮廓控制点的位置。根据器件的依据的物理原理和设计需求,对于每一个控制点的位置存在对应的取值范围,这些取值范围一起构成了本案例的特征参数取值空间。利用随机采样法在取值空间中进行一定数量的随机采样,生成特征参数列表。这里选择拉丁超立方采样法(Latin Hypercube Sampling)对特征参数取值空间中的参数进行300次采样,该方法可以在控制采样数量的同时,较好的兼顾数据的多样性和均匀性。

2. 数据集生成
   在上一步的采样操作之后,得到特征参数列表,使用Macondo 软件对列表中的参数进行逐一仿真计算,获取相应的透射率数据。这些数据和对应的特征参数一起构成了训练模型使用的原始数据集。本案例在进行训练前对数据进行分析筛选,剔除一些异常结果,获得由286组数据构成的数据集,将这些数据按9:1的比例进行随机分配,最终形成训练集和验证集。

3. 模型定义
   根据数据对应场景的复杂程度设置神经网络模型的隐藏层数,神经元个数等超参数,并确定相应的激活函数类型。

4. 模型训练
   在完成模型定义之后,根据案例的特性,选择合适的损失函数和迭代设置即可输入训练集数据开启模型训练。本案例使用均方差作为损失函数对训练结果进行评估,并使用Adam作为迭代器进行模型参数的迭代。同时将模型的精度要求设置为0.01,进一步控制训练时间和防止模型出现过拟合现象。


图3. ANN模型训练过程

   本案例实际训练时,设置的训练次数上限为100000,由于加入了早停设置,实际在26993便已经达到模型的训练要求,且使用验证集进行验证,平均相对误差为0.096,同样符合要求。

三、结合神经网络模型进行逆向设计

   结合已训练完成的ANN模型进行逆向设计与传统的结合仿真的逆向设计的过程是一致的,唯一的不同点是将仿真计算替换为利用训练完的ANN模型进行预测,从而大大减少逆向设计的耗时。本案例中,使用Nelder-Mead算法作为优化算法进行逆向设计计算。


图4. 结合ANN逆向设计结果

   图4(a) 给出了优化透射率关键指标的迭代过程,图4(b) 展示了轮廓线控制点的变化过程,图4(c) 为优化后的器件轮廓线,而图4(d) 是优化后相应的的功率分布。
   用来训练ANN模型的数据集对应的透射率在0.4到0.7之间,经过优化迭代后,得到了透射率达0.8的结构。这一过程中调用了320次适应度函数,整个仿真过程仅耗时1.1秒。如果对此案例采取传统的结合仿真逆向设计,预计时间为进行320次仿真的耗时。因此,基于ANN模型逆向设计与传统的结合仿真逆向设计对比,基于ANN模型逆向设计主要用时在数据集生成过程,而目标结果优化过程用时可以忽略不计。

四、总结

   通过使用深度神经网络结合逆向设计方法,可以显著加快 Y-branch 光波导器件设计的优化过程。这种方法不仅减少了对传统仿真软件的依赖,还提高了设计的灵活性和效率。最终,研究人员可以更快地发现具有优异性能的光波导器件结构,从而促进新型光子学器件的研发。

参考文献

[1] S. Boyd and L. Vandenberghe, “Convex Optimization,” Cambridge University Press, 2004.
[2] J. Nocedal and S. Wright, “Numerical Optimization,” Springer, 2006.
[3] I. Goodfellow, Y. Bengio, and A. Courville, “Deep Learning,” MIT Press, 2016.
[4] M. D. Gunzburger, “Perspectives in Flow Control and Optimization,” SIAM, 2003.
[5] K. Hornik, M. Stinchcombe, and H. White, “Multilayer feedforward networks are universal approximators,” Neural Networks, vol. 2, no. 5, pp. 359-366, 1989.
[6] A. R. Barron, “Universal approximation bounds for superpositions of a sigmoidal function,” IEEE Transactions on Information Theory, vol. 39, no. 3, pp. 930-945, 1993.
[7] K. E. Parsopoulos and M. N. Vrahatis, “Recent Approaches to Global Optimization Problems Through Particle Swarm Optimization,” Natural Computing, vol. 1, no. 2-3, pp. 235-306, 2002.
[8] J. A. Nelder and R. Mead, “A simplex method for function minimization,” The Computer Journal, vol. 7, no. 4, pp. 308-313, 1965.