Des modèles de galaxies aux atomes - des astuces simples dans la mise en œuvre de l'IA accélèrent des simulations des milliards de fois



Pour modéliser des phénomènes naturels extrêmement complexes, tels que l'interaction de particules subatomiques ou l'influence du brouillard sur le climat, il faut de nombreuses heures à passer, même sur les superordinateurs les plus rapides. Les émulateurs, des algorithmes qui rapprochent rapidement les résultats de simulations détaillées, offrent un moyen de contourner cette limitation. Un nouveau travail publié en ligne montre comment l'IA peut facilement produire des émulateurs précis qui peuvent accélérer des simulations dans divers domaines scientifiques des milliards de fois.

«Il s'agit d'une réalisation majeure», a déclaré Donald Lucas, un simulateur climatique au Livermore National Laboratory qui n'était pas impliqué dans ce travail. Il dit que le nouveau système crée automatiquement des émulateurs qui fonctionnent mieux et plus rapidement que ceux que son équipe développe et forme manuellement. De nouveaux émulateurs peuvent être utilisés pour améliorer les modèles qu'ils simulent et augmenter l'efficacité des scientifiques. Si le travail réussit l'examen par les pairs, dit Lucas, «cela changera beaucoup.»

Une simulation informatique typique peut calculer, étape par étape, comment les effets physiques affectent les atomes, les nuages, les galaxies - tout ce qu'ils simulent. Les émulateurs basés sur une variante de l'IA comme l'apprentissage automatique (MO) sautent l'étape de la reproduction laborieuse de la nature. Après avoir reçu les données d'entrée et de sortie requises d'une simulation complète, les émulateurs recherchent des modèles et apprennent à spéculer sur ce que la simulation fera avec le nouvel ensemble de données d'entrée. Cependant, pour créer des données d'entraînement, il est nécessaire d'exécuter plusieurs fois une simulation complète - c'est-à-dire de faire exactement ce que les émulateurs doivent enregistrer.

Les nouveaux émulateurs sont basés sur des réseaux de neurones - des systèmes MO inspirés par la structure du cerveau humain - et ils ont besoin d'apprendre beaucoup moins. Les réseaux de neurones sont constitués d'éléments informatiques simples qui sont connectés les uns aux autres d'une certaine manière pour effectuer certaines tâches. En règle générale, la connectivité des éléments change dans le processus d'apprentissage. Cependant, une technique appelée "recherche d'architecture neuronale" vous permet de déterminer le schéma de connexion le plus efficace pour une tâche donnée.

Basée sur cette technique, la technologie Deep Emulator Network Search (DENSE) s'appuie sur un schéma générique de recherche d'architecture neuronale développé par Melody Guan, informaticien à l'Université de Stanford. Elle insère au hasard des couches de calcul entre l'entrée et la sortie, puis vérifie et entraîne la connexion résultante sur un ensemble de données limité. Si la couche ajoutée améliore l'efficacité opérationnelle, la probabilité de son apparition dans les futures variations du réseau augmente. La répétition du processus améliore l'émulateur. Guang dit qu'avec «enthousiasme» il suit la façon dont son travail est utilisé «dans le but d'obtenir des découvertes scientifiques». Muhammad Qasim, physicien à l'Université d'Oxford qui a dirigé l'étude, dit que son équipe a basé son travail sur le travail de Guan,car cette approche atteint un équilibre entre précision et efficacité.

Les chercheurs ont utilisé DENSE pour développer des émulateurs de 10 simulations - en physique, astronomie, géologie et climatologie. Une simulation, par exemple, modélise la façon dont la suie et les autres particules en suspension dans l'atmosphère réfléchissent et absorbent la lumière du soleil, modifiant ainsi le climat mondial. Son travail peut prendre des milliers d'heures de temps informatique, donc Duncan Watson-Parris, un spécialiste de la physique atmosphérique d'Oxford et co-auteur de l'étude, utilise parfois un émulateur avec MO. Cependant, selon lui, l'émulateur est difficile à configurer et il ne peut pas produire de résultats à haute résolution, quelle que soit la quantité de données qu'il reçoit.

Les émulateurs DENSE montrent d'excellents résultats malgré le manque de données. Lorsqu'ils étaient équipés de puces graphiques spéciales, ils montraient une accélération de 100 000 à 2 milliards de fois par rapport aux simulations correspondantes. Une telle accélération est souvent caractéristique des émulateurs, mais leurs résultats étaient également extrêmement précis: dans une comparaison, les résultats d'un émulateur d'astronomie étaient identiques à plus de 99% aux résultats d'une simulation à part entière, et selon les résultats de 10 simulations, les émulateurs basés sur un réseau de neurones ont montré de meilleurs résultats que ceux habituels. Qassim dit qu'il pensait que les simulateurs DENSE auraient besoin de dizaines de milliers d'exemples de formation pour atteindre une précision similaire pour chaque simulation. Mais dans la plupart des cas, seuls quelques milliers d'exemples ont dû être utilisés,et dans le cas des particules atmosphériques en suspension - seulement quelques dizaines.

«Un résultat très cool», a déclaré Lawrence Perrault-Levassier, astrophysicien à l'Université de Montréal, faisant semblant de simuler des galaxies dont la lumière subit une lentille gravitationnelle causée par d'autres galaxies. «Il est impressionnant que la même méthodologie puisse être appliquée à des tâches aussi différentes et qu'ils aient pu la former sur un si petit nombre d'exemples.»

Lucas dit que les émulateurs DENSE, en plus d'être rapides et précis, ont une autre utilisation intéressante. Ils peuvent résoudre des "problèmes inverses" - pour déterminer les meilleurs paramètres du modèle pour la prédiction correcte des résultats. Et puis ces paramètres peuvent être utilisés pour améliorer les simulations à part entière.

Qasim dit que DENSE pourrait même permettre aux scientifiques d'interpréter les données à la volée. Son équipe étudie le comportement du plasma dans des conditions extrêmes créées par un laser à rayons X géant à Stanford, où le temps de l'expérience est très précieux. Il est impossible d'analyser leurs données en temps réel - par exemple, pour simuler la température et la densité d'un plasma - car les simulations requises peuvent prendre plusieurs jours, ce que les chercheurs utilisant le laser n'ont pas. Cependant, selon lui, l'émulateur DENSE pourrait interpréter les données assez rapidement pour pouvoir changer l'expérience. «Nous espérons qu'à l'avenir nous pourrons analyser presque immédiatement.»

All Articles