40 ans d'analyse de grandes quantités de données en physique des hautes énergies: un entretien avec René Bran

Au cours de ses 40 ans de carrière au CERN (Laboratoire international de recherche nucléaire situé à Genève), René Brun a développé un certain nombre de progiciels largement utilisés en physique des hautes énergies. Pour cette contribution fondamentale, il a récemment reçu un prix spécial de la division de physique des particules de haute physique de la Société européenne de physique (EPS). Nous avons discuté avec lui des événements clés de cette histoire.

image

Il est difficile d'imaginer qu'une même personne puisse créer autant de progiciels les plus importants et les plus largement utilisés développés au CERN et dans le domaine de la physique des hautes énergies: HBOOK, PAW, ROOT et GEANT. Cette personne passionnée et prévoyante est René Bran, maintenant membre honoraire du CERN , qui a récemment reçu le prix spécial du Département de physique des particules de haute énergie EPS (Société de physique européenne) " pour sa contribution exceptionnelle et originale aux outils logiciels pour le traitement des données, la modélisation et l'analyse des détecteurs, qui aidé à créer des expériences en physique des particules et des hautes énergies pendant des décennies . » Plus de 40 ans de sa carrière au CERNil a travaillé avec divers scientifiques brillants, et nous ne pouvons pas oublier que la réalisation de tels efforts est toujours le résultat d'efforts conjoints. Néanmoins, René a incontestablement le mérite de générer de nouvelles idées, de proposer des projets et de travailler avec diligence et enthousiasme pour les concrétiser.

L'une de ses créations, ROOT , est un outil d'analyse de données largement utilisé dans les expériences en physique des hautes énergies et nucléaire, au CERN et dans d'autres laboratoires. RACINEdépassait déjà la physique et est maintenant utilisé dans d'autres domaines scientifiques et même en finance. GEANT est un progiciel extrêmement réussi développé par René Bran, qui vous permet de simuler des expériences physiques et des interactions de particules dans des détecteurs. Sa dernière version, GEANT4 , est actuellement le principal outil de modélisation de détecteurs.

Mais, avant l'avènement de ROOT et GEANT4 , bien connus même des plus jeunes physiciens, on leur a proposé de nombreux autres projets et outils logiciels. C'est une histoire passionnante que René a racontée lors d'un séminaire organisé au CERN par le Département de physique expérimentale en 2017.

Tout a commencé en 1973 quand il a été embauché par le département informatique du CERN pour travailler avec Carlo Rubbia (lauréat du prix Nobel, l'un des directeurs du CERN) dans l'expérience R602 sur l' ISR (le premier collisionneur de hadrons au monde). Sa responsabilité était d'aider à développer un processeur matériel spécial pour la reconstruction en ligne de modèles de collision. Mais comme ce développement était lent et ne prenait pas beaucoup de temps, il a été demandé à René d'écrire un logiciel pour reconstruire les événements dans des caméras proportionnelles multifilaires. «À cette époque, je détestais les logiciels », admet René, souriant. «J’ai écrit des logiciels pendant ma thèse, étudiant à Clermont-Ferrand et travaillant dansLe CERN le week-end, et je n'ai pas vraiment aimé. J'ai rejoint le groupe Carlo Rubbia avec une «promesse» de travailler sur du matériel, mais très vite je suis redevenu «un gars du logiciel» ... »

Bientôt René a réalisé en logiciel (programmation sur Fortran4) qu'ils ne pouvaient pas implémenter avec en utilisant du matériel, et en plus, il a développé un paquet d'histogramme appelé HBOOK. Cela a permis de réaliser une analyse de données très simple, de créer des histogrammes, de les remplir et d'envoyer les résultats à une imprimante linéaire. Il a également écrit un programme appelé HPLOT, spécialisé dans le dessin d'histogrammes générés par HBOOK.

Il n'y avait pas de périphérique graphique à l'époque, donc la seule façon de visualiser les histogrammes était de les imprimer sur une imprimante linéaire, et les programmes étaient écrits sous forme de cartes perforées.

René se souvient avec émotion du temps passé à perforer les cartes, non pas sur la procédure elle-même, qui était lente et plutôt fatigante, mais sur les longs rassemblements qui se trouvaient dans la salle où se trouvaient les poinçons et les imprimantes du service informatique, ainsi que le café à proximité ( à l'époque elle travaillait 24 heures sur 24 avec la vente d'alcool ). Pendant ces longues heures, il a pu discuter d'idées et de nouvelles technologies avec des collègues.

D'énormes progrès ont été rendus possibles grâce à l'introduction du téléscripteur, qui a remplacé les perforateurs de cartes. Les utilisateurs pouvaient créer des programmes sur disque et échanger des données avec une machine centrale appelée FOCUS, et en même temps, voir sur un rouleau de papier ce qu'ils faisaient, comme sur une machine de type normal. « La façon dont cela fonctionne peut faire sourire les gens aujourd'hui », se souvient René, « pour entrer dans FOCUS, vous avez dû taper une équipe qui a allumé le feu rouge dans le centre informatique. Voyant la lumière, l'opérateur a dû insérer dans la mémoire de la machine une bande d'une personne connectée qui pouvait démarrer une session sur disque. Lorsque l'utilisateur s'est déconnecté, la session a été réinitialisée sur la bande à nouveau. Vous pouvez imaginer le mouvement! Mais c'était beaucoup plus rapide que les cartes perforées . "

Quelque temps plus tard, le télétype a été à son tour remplacé par le terminal Tektronix 4010, ce qui a conduit à une révolution encore plus grande, car il a permis d'afficher les résultats sous forme graphique. Ce nouvel appareil très coûteux a permis à René d'accélérer le développement de son logiciel: d'abord HBOOK, puis un autre package appelé ZBOOK et la première version de GEANT. GEANT1 a été créé en 1974 par lui, avec ses collègues du groupe des expériences électroniques, et était un outil de modélisation de détecteurs simples utilisant la méthode de Monte Carlo. Progressivement, ils ont ajouté des fonctionnalités à ce logiciel et ont pu jouer les collisions de particules: c'est ainsi que GEANT2 est né.

En 1975, Renee a rejoint l'expérience NA4, une expérience de diffusion de muons inélastiques profonds qui a conduitCarlo Rubbia . Là, il a participé au développement de nouveaux outils graphiques permettant d'imprimer des histogrammes à l'aide d'un appareil appelé traceur CalComp. Cette machine, qui fonctionnait avec un rouleau de papier de 10 mètres de long, donnait une bien meilleure résolution que les imprimantes linéaires, mais était très chère. En 1979, un système de microfilm a été introduit: les histogrammes enregistrés sur film pouvaient être vérifiés avant d'être envoyés au traceur pour n'en imprimer que des intéressants. Cela a réduit le coût d'utilisation de CalComp .

René devait continuer à travailler avec Carlo Rubbia dans l'expérience UA1pour lequel il a fait beaucoup de modélisation. Mais au lieu de cela, à la fin de 1980, il a rejoint l'expérience OPAL , où il a fait toute la modélisation du détecteur et créé GEANT3 .

En travaillant sur le système HBOOK, René a développé en 1974 un système de gestion de la mémoire et d'E / S appelé ZBOOK. Cet outil était une alternative au système HYDRA, qui a été développé par Julius Zoll, un groupe de chambres à bulles (également l'auteur d'un autre système de contrôle appelé Patchy).

Considérant qu'il est inutile d'avoir deux systèmes concurrents, Emilio Pagiola a proposé en 1981 de développer un nouveau progiciel appelé GEM. Alors que trois personnes ont travaillé dur sur le projet GEM, Renee et Julius ont commencé à tester ensemble pour comparer leurs systèmes, ZBOOK et HYDRA, avec GEM. À la suite de ces tests, ils ont conclu que le nouveau système était beaucoup plus lent qu'eux.

En 1983, Jan Butterworth, alors directeur du département informatique, a décidé que seul le ZBOOK serait pris en charge au CERN, et que le GEM devait être arrêté, et le développement d'HYDRA était gelé. "Mon chef de groupe, Hans Grote, est venu à mon bureau, m'a serré la main et m'a dit: "Félicitations, Renée, tu as gagné." Mais j'ai immédiatement pensé que cette décision était injuste, car en fait les deux systèmes avaient de bonnes fonctions, et Julius Zoll était un excellent développeur de logiciels. «

Suite à cette décision, Renee et Julius ont entamé une collaboration et ont uni leurs forces pour développer un package qui combine les meilleures fonctionnalités de ZBOOK et HYDRA. Le nouveau projet a été appelé ZEBRA, en raison de la combinaison des noms de deux systèmes originaux. "Lorsque Julius et moi avons annoncé notre coopération, Jan Butterworth nous a immédiatement appelés à son bureau et nous a dit que si après 6 mois le système ZEBRA ne fonctionnait pas, nous serions renvoyés du CERN. En effet, en moins de deux mois, nous avons pu montrer une version primaire fonctionnelle du système ZEBRA. »

Parallèlement, l'histogramme et les outils de visualisation sont en cours de développement. René a mis au point une version interactive de HBOOK et HPLOT appelée HTV, qui fonctionne sur les machines Tektronix. Mais, en 1982, l'avènement des postes de travail personnels marque une révolution. Le premier poste de travail personnel à apparaître en Europe, Apollo, a démontré un bond en termes de performances et de performances: il était plus rapide, avait plus de mémoire et une meilleure interface utilisateur que tout autre appareil précédent. « Apollo m'a invité à me rendre à Boston et à leur rendre visite» , explique René. « Quand j'ai vu le poste de travail Apollo pour la première fois , j'ai été choqué. J'ai immédiatement réalisé que cela pouvait accélérer notre développement de 10 fois. Je me suis forcé à travailler et je pense qu'en seulement trois jours, j'ai adapté environ 20 000 lignes de code pour cela. »

Les travaux de René sur l'adaptation du HTV au poste de travail Apollo ont suscité l'intérêt de Rudy Beck, Luke Pape et Jean-Pierre Revol de la collaboration UA1qui a également suggéré quelques améliorations. Par conséquent, en 1984, trois d'entre eux ont développé une proposition pour un nouveau package qui sera basé sur HBOOK et ZEBRA, qu'ils ont appelé PAW (Physics Analysis Workstation).

image
Équipe PAW: (à gauche) René Bran, Pietro Zanarini, Olivier Cue (debout) et Carlo Vandoni .

Après la première période d'incertitude, le projet PAW s'est développé rapidement et de nombreuses nouvelles fonctions ont été introduites, notamment en raison de l'augmentation de la mémoire des postes de travail. «À un moment donné, le logiciel PAW s'est développé si rapidement que nous avons commencé à recevoir des plaintes d'utilisateurs qui ne pouvaient pas suivre le développement », explique René, souriant. "Peut-être que nous étions un peu naïfs, mais définitivement enthousiastes . »

Le langage de programmation couramment utilisé pour le calcul scientifique était FORTRAN. En particulier, à cette époque, le FORTRAN 77 (introduit en 1977) était répandu dans la communauté des physiciens des hautes énergies, et la principale raison de son succès était le fait qu'il était bien structuré et assez facile à apprendre. De plus, des implémentations très efficaces étaient disponibles sur toutes les machines utilisées à l'époque. En conséquence, lorsque le nouveau FORTRAN 90 est apparu, il semblait évident qu'il remplacerait FORTRAN 77 et serait aussi réussi que la version précédente. "Je me souviens bien du chef de la division informatique, Paolo Zanella, qui a déclaré: "Je ne sais pas ce que fera le prochain langage de programmation, mais je connais son nom: FORTRAN . »

En 1990 et 91, René, avec Mike Metcalf, qui était un grand expert FORTRAN, a travaillé dur pour adapter le package ZEBRA au FORTRAN 90. Mais, ces efforts n'ont pas abouti à un résultat satisfaisant, et des discussions ont eu lieu sur la possibilité de continuer à travailler avec FORTRAN ou de passer à une autre langue. C'était une période où la programmation orientée objet faisait ses premiers pas, et aussi lorsque Tim Berners Lee (créateur d'Internet) a rejoint le groupe René.

Tima dû développer un système de documentation appelé XFIND pour remplacer le précédent FIND, qui ne pouvait fonctionner que sur des machines IBM censées être utilisées sur d'autres appareils. Cependant, il pensait que la procédure qu'il était censé suivre était un peu maladroite et, bien sûr, pas une meilleure approche du problème. Ainsi, il a proposé une autre solution avec une approche plus décentralisée et adaptable, qui nécessitait principalement beaucoup de travail de normalisation. Dans ce contexte, Tim a développé sa célèbre idée de serveurs et de clients - le World Wide Web , développée à l'aide d'un langage orienté objet ( Objective-C ). Une fois que j'ai demandé à René, "Comment c'était?" Sa réponse m'a choqué -«Ce n'était pas grâce, mais contraire au CERN.»

Ce fut une période très chaude, car la phase de conception et de simulation des expériences pour le nouvel accélérateur du LHC (Large Hadron Collider) a commencé. Il était important de décider du langage de programmation et des outils logiciels qui seront utilisés dans ces nouveaux projets.

Au séminaire ERICE organisé par INFNen novembre 1990, puis à la conférence sur le génie informatique en physique des hautes énergies (CHEP) à Annecy (France) en septembre 1992, le «gourou» de la physique des hautes énergies du monde s'est réuni pour discuter des langages de programmation et des orientations possibles pour le développement de logiciels en Physique des hautes énergies pour le grand collisionneur de hadrons. Parmi les nombreuses langues proposées figuraient Eiffel, Prolog, Modula2 et d'autres.

En 1994, deux projets de recherche et développement ont été lancés: RD44 pour le développement en C ++ d'une nouvelle version de GEANT (qui deviendra GEANT4 ) et RD45 pour l'étude de solutions de bases de données orientées objet pour des expériences au Grand collisionneur électron-positon LEP .

Selon René, sa division était divisée en trois groupes: ceux qui voulaient rester avec FORTRAN 90, ceux qui comptaient sur C ++ et ceux qui étaient intéressés à utiliser des produits commerciaux. " J'ai soumis une proposition pour développer un package qui permettrait de transférer PAW dans le monde de la programmation orientée objet. Mais le projet, que j'ai appelé ZOO, a été rejeté, et on m'a même proposé de prendre des vacances " , admet René.

Ce coup, cependant, s'est avéré être une bonne chance pour Renée. Son leader David Williams l'a invité à rejoindre l'expérience NA49dans la partie nord du CERN, où quelqu'un était nécessaire pour aider au développement de logiciels. Au début, il a refusé. Pendant de nombreuses années, il a dirigé les projets GEANT et PAW et s'est engagé dans la modélisation ou le développement de logiciels pour divers groupes et applications, de sorte que le consentement au retour au travail dans une expérience particulière lui semblait une grande limitation.

Mais, il y a pensé et s'est rendu compte que c'était l'occasion de passer du temps à développer de nouveaux logiciels en toute liberté. Il a visité le bâtiment NA49 sur le site de Privesan et, voyant des pins et des écureuils par les fenêtres, il a estimé que c'était en effet l'environnement très calme dont il avait besoin pour son nouveau projet. Par conséquent, il a déplacé son poste de travail de son bureau vers le site Web de Privessan («Je l'ai fait le week-end sans même en parler à David Williams ") et, tout en travaillant sur NA49 , il a appris le C ++, traduisant la plupart des logiciels HBOOK en C ++.

Début 1995, Rennes est rejoint en NA49 par Fons Raidemakers, avec qui il a déjà collaboré. Ils ont beaucoup travaillé ensemble et ont créé la première version de ce qui est devenu le célèbre système ROOT. Le nom vient simplement d'une combinaison de la lettre initiale des adresses e-mail des deux fondateurs (René et Rdm, pour Rademakers), du double O Object Oriented et du mot Technology. Mais le sens ou le mot «racine» était également bien adapté pour servir de base au développement de plus de logiciels et à l'utilisation de structures arborescentes dans son architecture.

En novembre de la même année, René a organisé un séminaire pour présenter le système ROOT. « La salle informatique était remplie de façon inattendue! » Se souvient René: « Je pense que c'est parce que les gens pensaient que Fons et moi avions disparu de l'arène logicielle et que soudain nous étions de retour! » Et en fait, le système ROOT a suscité un intérêt considérable .

Mais, alors que René et Fons étaient complètement absorbés par le travail sur leur nouveau progiciel, le projet RD45, qui avait le pouvoir de décider quel nouveau logiciel devait être adopté dans de nouvelles expériences sur le LHC, a suggéré d'utiliser le produit commercial « Objectivité". et beaucoup de travail a continué pour développer des applications pour répondre aux besoins de la physique des hautes énergies. Selon René, il y avait une intention claire d'empêcher le développement et la propagation de ROOT. Au printemps 1996, le directeur informatique du CERN, Lorenzo Foa, a annoncé que le projet ROOT était considéré comme une initiative privée NA49, qui n'était pas soutenu par la direction du CERN, et que la ligne de développement officielle visait l' objectivité .

« Je pense que le LHC Computing Board n'avait pas la bonne idée de l'architecture de ces outils logiciels, afin de pouvoir juger quelle solution était la meilleure. Ainsi, ils devaient faire confiance à ce qu'on leur disait » , commente René. "C'est toujours un problème quand il y a un tel écart entre les experts - et les utilisateurs - travaillant sur quelque chose et les personnes qui doivent prendre des décisions importantes . "

Cependant, Renee et Fons ont poursuivi le développement de ROOT et introduit de nouvelles fonctionnalités, en utilisant les enseignements tirés des précédents progiciels (en particulier, les demandes et les critiques des utilisateurs). De plus, ils ont suivi de près le développement de la ligne officielle avec Objectivité pour savoir ce que recherchaient les utilisateurs et quels étaient les problèmes ou difficultés. « Plus nous examinions l' objectivité , plus nous réalisions qu'elle ne pouvait pas répondre aux besoins de notre communauté », ajoute René, «nous savions que le système s'effondrerait et que les gens finiraient par le réaliser. Cela nous a donné encore plus d'énergie et de motivation pour travailler dur et améliorer notre produit. »

Ils ont reçu un soutien continu des collaborations NA49 et ALICE , ainsi que de nombreuses personnes d' ATLAS et de CMS qui ont vu un bon potentiel dans ce progiciel. À cette époque, René a collaboré avec de nombreuses personnes dans les deux expériences, notamment Fabiola Gianotti (directrice actuelle du CERN) et Daniel Frodevo, en particulier, pour modéliser des détecteurs. De plus, de nombreux utilisateurs leur font confiance depuis de nombreuses années grâce au support des utilisateurs PAW et GEANT.

La situation a commencé à changer lorsque l'intérêt pour ROOT a augmenté en dehors du CERN (curieusement, mais le slogan Zagranitsa nous aidera! Travaille en dehors de la Russie). En 1998, deux expériences les laboratoire. Enrico Fermilab en Amérique (Fermilab), CDF et D0 , ont décidé de discuter de l'avenir de leur logiciel à la lumière de la prochaine session Tevatron . Ils ont ainsi ouvert deux appels d'offres pour des solutions logicielles, l'un pour le stockage des données et l'autre pour l'analyse et la visualisation des données. René a envoyé ROOT aux deux compétitions. Lors de la conférence CHEP à Chicago (c'est là que j'ai rencontré personnellement René pour la première fois, même si j'ai collaboré avec lui par contumace pendant un certain temps.
Là, il m'a offert un emploi), des propositions ont été discutées et le dernier jour, il a été annoncé publiquement que CDF et D0 accepteraient ROOT. " Je ne m'attendais pas à cela ", dit René, " Je me souviens que lorsque la décision a été annoncée, tout le monde s'est tourné et m'a regardé ." Bientôt, les expériences RHIC au Brookhaven National Laboratory ont pris la même décision. Lorsque les physiciens de l' expérience BaBar au SLAC , après de nombreuses années d'essayer d'utiliser l'objectivité, ont réalisé que ce n'était pas un système aussi bon que prévu, ils sont donc passés à ROOT.

Peu à peu, il est devenu clair que toute la communauté de la physique des hautes énergies évoluait «naturellement» vers ROOT, la direction du CERN a dû accepter cette situation et, finalement, la soutenir. Mais cela n'est arrivé qu'en 2002. Avec la croissance des effectifs alloués au projet (René a alors plaisanté « vous êtes le premier employé du CERN à recevoir officiellement un salaire pour travailler sur ROOT »), ROOT a continué de se développer rapidement et le nombre d'utilisateurs a fortement augmenté. ROOT a également commencé à s'étendre à d'autres branches de la science et au monde financier. « En 2010, nous avions en moyenne 12 000 téléchargements de progiciels par mois, et il y avait plus de visiteurs sur le site Web de ROOT qu'au CERN

imageLogo du progiciel ROOT.


René a pris sa retraite en 2012, mais ses deux descendants les plus importants,ROOT et GEANT continuent d'évoluer grâce au travail de nombreux jeunes scientifiques. « Je pense qu'il est important d'avoir une motivation constante qui vous poussera à améliorer vos produits et l'émergence de nouvelles solutions. La contribution des jeunes est très importante pour cela », commente René. Mais, comme il l'admet, ce qui l'a vraiment amené, lui et ses collègues, à travailler si dur pendant de nombreuses années, c'est qu'il y a toujours eu plusieurs concurrents, même si dans de nombreux cas, ils ont été un défi et même interféré. « Lorsque vous avez un adversaire, mais sachez que vous avez raison, vous êtes voué au succès . «Une

grande attention aux demandes des utilisateurs était également très importante car elle a aidé à développer des logiciels et à établir des relations de confiance avec les gens. "J'ai toujours dit que vous devriez donner la priorité à l'assistance aux utilisateurs » , explique René. « Si vous répondez à la demande dans les 10 minutes, vous recevrez 10 points, en une heure vous recevrez 2 points et en un jour vous gagnerez -10 points. Les réponses aux questions et commentaires sont fondamentales, car si les utilisateurs sont satisfaits du support que vous leur fournissez, ils sont prêts à faire confiance à ce que vous proposez ensuite. "

Maintenant qu'il a démissionné, Renee surveille toujours le développement de logiciels au CERN, mais uniquement en tant qu'observateur externe. Cela ne veut pas dire qu'il a laissé de côté ses intérêts scientifiques, au contraire, il consacre désormais l'essentiel de son énergie à un projet plus théorique, puisqu'il développe un modèle physique. Dans ses temps libres, il aime jardiner. Il aime les fleurs, mais ne peut s'empêcher de les regarder avec un regard scientifique: " Mon collègue, un mathématicien et moi avons développé un modèle mathématique de la façon dont les fleurs sont structurées et poussent ."

Des esprits brillants sont toujours au travail.



Un peu de toi
ROOT.
.
.
— . .
— « ».
, , « » ! .
, , , , .

All Articles