从星系模型到原子-AI实现中的简单技巧可加快数十亿次仿真速度



要对极其复杂的自然现象(例如亚原子粒子的相互作用或雾对气候的影响)进行建模,即使在最快的超级计算机上也要花费数小时。仿真器是可以快速近似详细仿真结果的算法,它提供了一种解决此限制的方法。在线发表的一项新作品展示了AI如何轻松产生精确的仿真器,从而可以加速数十亿次科学领域的仿真。

Livermore国家实验室的气候模拟器Donald Lucas说:“这是一项重大成就。”他说,新系统会自动创建比其团队手动开发和训练的模拟器更好更快的模拟器。新型仿真器可用于改进其仿真的模型并提高科学家的效率。卢卡斯说,如果这项工作通过同行评议,“它将发生很大变化。”

典型的计算机模拟可以逐步计算物理效应如何影响原子,云,星系-它们模拟的一切。基于诸如机器学习(MO)的AI变体的仿真器跳过了繁琐的自然再现阶段。模拟器收到了完整模拟所需的输入和输出数据后,便会寻找模式并学习推测模拟将如何使用新的一组输入数据。但是,要创建训练数据,必须多次运行完整的仿真-也就是说,要完全执行模拟器应摆脱的工作。

新的仿真器基于神经网络-受人脑结构启发的MO系统-并且它们需要学习的东西更少。神经网络由简单的计算元素组成,这些元素以某种方式相互连接以执行某些任务。通常,元素的连通性在学习过程中会发生变化。但是,一种称为“搜索神经体系结构”的技术可让您确定给定任务的最有效连接方案。

基于这种技术,深度仿真器网络搜索(DENSE)技术依赖于斯坦福大学计算机科学家Melody Guan开发的通用神经体系结构搜索方案。她在输入和输出之间随机插入计算层,然后在有限的数据集上检查和训练结果连接。如果添加的层提高了运营效率,那么在将来的网络变化中出现它的可能性就会增加。重复该过程可以改善仿真器。关说,他以“热情”跟随自己的工作被“用于获得科学发现的目的”。负责这项研究的牛津大学物理学家穆罕默德·卡西姆(Muhammad Qasim)说,他的小组的工作基于关的工作,因为这种方法在准确性和效率之间取得了平衡。

研究人员使用DENSE开发了10个仿真器的仿真器-包括物理,天文学,地质学和气候学。例如,一种模拟方法可以模拟大气中烟灰和其他悬浮颗粒如何反射和吸收阳光,从而改变全球气候。她的工作可能需要花费数千个小时的计算机时间,因此,牛津大学大气物理学专家,研究的合著者Duncan Watson-Parris有时会使用MO模拟器。但是,据他介绍,仿真器难以配置,并且无论接收到多少数据,它都无法产生高分辨率结果。

尽管缺少数据,但DENSE仿真器仍显示出出色的结果。当他们配备特殊的图形芯片时,与相应的仿真相比,它们显示出100,000到20亿倍的加速。这种加速通常是仿真器的特征,但是它们的结果也非常准确:在一个比较中,天文学仿真器的结果与完整仿真的结果有99%以上的一致性,并且根据10个仿真的结果,基于神经网络的仿真器显示出比平常更好的结果。 Qassim说,他认为DENSE模拟器将需要成千上万的训练示例,以使每次模拟达到类似的精度。但在大多数情况下,仅需使用几千个示例,对于悬浮的大气颗粒-只有几十个。

蒙特利尔大学的天体物理学家劳伦斯·佩罗特-莱瓦西耶(Lawrence Perrault-Levassier)说:“一个非常酷的结果。”他假装模拟了受其他星系引起的引力透镜作用的星系。 “令人印象深刻的是,可以将相同的方法应用于如此不同的任务,并且他们能够在如此少量的示例中对其进行训练。”

卢卡斯说,DENSE模拟器除了快速准确外,还有另一个有趣的用途。他们可以解决“逆问题”-确定模型的最佳参数以正确预测结果。然后,这些参数可用于改进全面的仿真。

卡西姆(Qasim)说,DENSE甚至可以让科学家即时解释数据。他的团队正在研究由斯坦福大学的巨型X射线激光在极端条件下产生的等离子体行为,在这里实验时间非常宝贵。不可能实时分析其数据(例如,模拟等离子体的温度和密度),因为所需的模拟可能需要几天的时间,而使用激光的研究人员则没有。但是,据他说,DENSE仿真器可以足够快地解释数据,从而可以改变实验。“我们希望将来我们能够几乎立即进行分析。”

All Articles