上海光机所高功率激光物理联合实验室前沿部在利用深度强化学习实现激光种子源锁模状态搜索研究上取得重要进展,相关成果以“Deep reinforcement with spectrum series learning control for a mode-locked fiber laser”为题发表在Photonics Research。
针对高功率激光器光纤锁模种子源稳定锁模状态搜索的问题,提出了一种算法,可有效搜索耗散孤子锁模激光器(图1)的锁模状态并完成不同运行状态之间的切换(图2)。该算法结合了时间序列深度强化学习和长短时记忆网络。数值模拟表明,激光腔的动态特征可以从光谱序列中获得,与传统的进化搜索算法相比,该模型大大提高了锁模搜索的效率。在实验中,所提出的算法平均只用了690ms即可获得稳定的锁模状态,搜索次数比传统方法少一个数量级,也是目前报道搜索次数最少的方法(图3)。在16°C–30°C温度环境下,该方法平均只需18次搜索就可以获得稳定的锁模状态,极大地提高了激光器在复杂环境下的适应能力。
该方法是无模型的,因此不仅可以用于锁模状态的搜索,还可以获得特殊时间-光谱特性的锁模动力学模式,在激光时空精确调控等方面有潜在应用前景,受到国内外同行的关注。
相关研究得到了中科院先导专项A类子课题的资助。
图1 耗散孤子锁模激光器
图2 时间序列深度强化学习算法模型
图3 随机初始状态锁模搜索结果
转载请注明出处。