Menu
Rechercher
Accueil > Thèses, Stages, Formation et Enseignement > Propositions de thèses 2023 > Incertitudes pour les tâches de régression avec des réseaux de neurones sur graphe. Application à la détection de particules cosmiques.
Incertitudes pour les tâches de régression avec des réseaux de neurones sur graphe. Application à la détection de particules cosmiques.
par Tristan Beau - 19 janvier 2023
Titre : Incertitudes pour les tâches de régression avec des réseaux de neurones sur graphe. Application à la détection de particules cosmiques
Directrice/directeur de thèse : Olivier Martineau
Co-encadrant.e : Aurélien Benoit-Levy
Groupe d’accueil :GRAND
Webpage du projet : https://grand.cnrs.fr/
Collaboration : GRAND
Description :
L’utilisation des techniques d’apprentissage profond, notamment à base de réseaux de neurones, a connu un formidable essor ces dernières années dans de nombreux domaines. Toutefois des verrous techniques existent encore, qui empêchent le déploiement de ces modèles pour des applications à haut niveau de criticité. Les réseaux de neurones artificiels représentent des fonctions ayant un très grand nombre de paramètres, à la fois différentiables (donc entraînables) ainsi que fortement non linéaires. Cette dernière propriété leur confère un fort pouvoir de représentation, à l’origine de leur utilisation massive, mais elle implique également que les réseaux de neurones sont, par nature, sensibles à de faibles variations des données d’entrée. Ainsi la question de la détermination des incertitudes sur les prédictions des réseaux de neurones est aujourd’hui l’un des enjeux majeurs en machine learning.
L’objectif de cette thèse est de travailler sur l’utilisation de réseaux de neurones sur graphes, dans l’optique de pouvoir déterminer des quantités physiques et leurs erreurs, à partir des mesures effectuées avec des réseaux de capteurs distribués spatialement. L’utilisation de réseaux de neurones sur graphes (GNN) se prête particulièrement bien à cette problématique dans la mesure où le réseau de capteurs peut être irrégulier, avec ajout ou suppression de capteurs en fonction du temps.
Le cas d’application principal sera le projet GRAND[1], qui vise à déterminer l’origine des rayons cosmiques d’ultra-haute énergie à l’aide d’un réseau de 200 000 antennes radio déployées à l’horizon 2030. Si la construction de cet instrument est prévue pour les années 2030, le déploiement d’un premier prototype de 300 antennes radio, GRANDProto300, est imminent dans le désert du Gansu en Chine et des antennes tests sont d’ores et déjà déployées sur le site du radio-télescope de Nançay (Cher). Celui-ci sera un banc de test idéal pour développer de nouvelles techniques d’analyse, basées sur l’utilisation de méthodes d’apprentissage automatique, et pour investiguer l’origine des rayons cosmiques dans une gamme d’énergie peu étudiée.
Les particules cosmiques induisent dans l’atmosphère des cascades de particules secondaires qui vont générer une émission électromagnétique brève (< 100 ns) que les antennes de GRAND détecteront dans la gamme 50-200 MHz. Il s’agira ainsi, à partir des mesures radio des antennes, de reconstruire les paramètres primaires des particules incidentes (nature, énergie, direction d’arrivée, etc.). Pour estimer ces quantités, il est nécessaire d’exploiter les données de plusieurs antennes qui détectent en coïncidence l’émission radio des particules. Il s’agit ainsi de résoudre un problème inverse par des techniques d’apprentissage machine. Des expériences similaires utilisent déjà des GNN (Choma et al. 2018), mais l’originalité du travail proposé est que les données mesurées sur chaque noeud du graphe seront des séries temporelles.
Le travail envisagé dans cette thèse sera ainsi structuré autour de deux axes :
- Mise en place et utilisation d’une architecture de type GNN pour la reconstruction
des paramètres physiques des évènements mesurés par le réseau de capteur de
GRAND. - Quantification des erreurs de prédictions pour cette tâche de régression, et
extension des méthodes existantes pour déterminer les erreurs et covariance de
plusieurs paramètres simultanément.
Le doctorant ou la doctorante pourra s’appuyer sur l’expertise en simulation de l’équipe GRAND du Laboratoire de Physique Nucléaire et des Hautes Énergies (CNRS IN2P3) pour générer des jeux de données synthétiques, mais également sur les données de TREND (Ardouin et al. 2011), une expérience passée, précurseuse de GRAND, et sur les données de GRANDProto300. Des simulations seront nécessaires pour entrainer les réseaux de neurones. Toutefois ces simulations sont parfois coûteuses, et il pourra être intéressant d’étudier des approches mixtes AI et simulation.
Les méthodes développées à travers l’étude de ce cas d’application physique seront applicables par la suite à d’autres cas d’usages, par exemple en radio-protection ou en sismologie. L’étudiant(e) sera également associé(e) à la collaboration GRAND et des contacts fréquents avec les équipes de GRAND au LPNHE et à l’Institut d’Astrophysique de Paris auront lieu.
Lieu(x) de travail : LIST (CEA Saclay ) et LPNHE (Paris)
Déplacements éventuels : Etats-Unis (Pennslvania State University)
Stage proposé avant la thèse : Oui
Bourse : Oui (cea)
Important : Thèse déjà pourvue
Dans la même rubrique :
- Etude de la production de di-Higgs pour la nouvelles physiques et amélioration du trajectographe de l’expérience ATLAS en vue de la phase à haute luminosité du LHC
- Mesure de l’élément Vub de la matrice CKM et recherche de nouvelle physique dans l’étude de l’universalité de la saveur leptonique avec l’expérience LHCb au CERN/Measurement of the Vub element of the CKM matrix and search for new physics in lepton flavour universality tests with the LHCb experiment at CERN
- Analyses en amplitudes des désintégrations
- Mesure de la masse du quark top avec des événements ttbar avec des mésons J/ψ et D dans l’état final. Études et réalisation du détecteur de temps hautement granulaire (HGTD) dans l’expérience ATLAS auprès du LHC. Measurement of the top quark mass using ttbar events with J/ψ and D mesons in the final state. Study and realization of a High Granularity Timing Detector (HGTD) for the ATLAS detector for the High Luminosity phase of the LHC.
- Variability from active galactic nuclei with the future Cherenkov Telescope Array and validation tests with the NectarCAM camera
- Joint supernovae and galaxy clustering analysis with ZTF and the DESI BGS
- First LSST dataset : toward the next generation of cosmological constrains.
- Development of the new silicon pixel tracker for the upgrade of the ATLAS detector at the High Luminosity LHC (HL-LHC), study of the performance of the new design, and application to the research of new physics and precision Higgs measurements at HL-LHC
- Towards precise measurement of neutrino oscillations parameters in T2K-II with new input from the upgraded Near Detector ND280
- Development of reconstruction algorithms for the Hyper-Kamiokande experiment – a unique observatory for rare events in the Universe
- Prospectives pour une détection interférométrique de particules cosmiques dans le projet GRAND
- Quantifying ML uncertainties in searches for new physics at the LHC