Le projet PRÉDICTION développe des outils d’intelligence artificielle dédiés à la prédiction de phénomènes environnementaux. Les travaux portent en particulier sur l’évolution de la quantité et de la qualité des eaux dans les nappes phréatiques ainsi que sur la surveillance de la qualité de l’air. Il s’inscrit dans le programme JUNON, dont l’ambition est de construire des jumeaux numériques capables de représenter et d’analyser des systèmes naturels complexes.

Les recherches s’appuient sur les données collectées dans les projets EAU et SOL/AIR, et structurées dans DATA : mesures issues de capteurs de terrain, observations météorologiques ou données satellitaires. Les approches d’intelligence artificielle sont étudiées en parallèle des modèles physiques et mécanistiques utilisés de longue date dans les sciences de l’environnement. Leur confrontation éclaire leurs performances respectives, leur robustesse face aux évolutions des systèmes étudiés et leur capacité à apporter des éléments d’interprétation scientifique. Les résultats obtenus alimentent progressivement les jumeaux numériques environnementaux développés dans le cadre du programme.

Évaluer les approches prédictives

Les méthodes de prévision appliquées aux données environnementales couvrent un large spectre : modèles physiques, approches statistiques, ou d’apprentissage automatique. Leur comparaison constitue une étape essentielle des travaux menés dans PRÉDICTION.

Un pipeline d’évaluation rassemble ces différentes approches et les confronte à des séries temporelles environnementales réelles. Plusieurs dimensions sont analysées : qualité des prédictions à court, moyen et long terme ; capacité de généralisation ; comportement des modèles lorsque les données évoluent. Une première version du benchmark sert déjà de base pour comparer différents modèles sur cinq années test et structurer l’analyse des performances. À terme, ces travaux nourriront un guide méthodologique destiné à orienter le choix des approches de prévision selon la nature des données et les objectifs scientifiques.

Identifier des dynamiques communes dans les séries environnementales

Les séries temporelles issues des observations environnementales présentent parfois des comportements similaires entre différents sites pour un même phénomène observé. Par exemple, on peut mettre en évidence des dynamiques hydrogéologiques comparables à différents endroits en France.

Des méthodes de regroupement ont ainsi été appliquées aux séries piézométriques afin d’identifier des ensembles de données partageant des caractéristiques proches. Ces regroupements servent de base à l’apprentissage de modèles qui peuvent être partagés, plutôt qu’à l’entraînement de modèles locaux indépendants pour chaque piézomètre considéré. Cette stratégie améliore la robustesse des prédictions et leur capacité de généralisation, tout en limitant le nombre de modèles à maintenir.

Une autre façon de traiter l’hétérogénéité des séries, consiste à utiliser des méthodes de méta-apprentissage capables d’identifier automatiquement les modèles les plus pertinents en fonction des caractéristiques d’une série. Ces méthodes contribuent au développement d’outils d’aide à la modélisation.

Croiser modèles physiques et intelligence artificielle

PRÉDICTION développe également des approches hybrides combinant connaissances physiques et méthodes d’apprentissage automatique. Ces travaux s’appuient notamment sur des réseaux de neurones guidés par la physique (Physics-Informed Neural Networks), dans lesquels certaines lois physiques sont intégrées au processus d’apprentissage. 

Ces modèles hybrides apportent une nouvelle manière d’exploiter les connaissances existantes tout en bénéficiant de la capacité d’adaptation des techniques d’intelligence artificielle. Ils contribuent, par exemple, à estimer des variables difficiles à observer dans les modèles physiques ou à améliorer la robustesse des prédictions en les contraignants par des lois physiques.

Prendre en compte les dimensions spatiales et multi-sources

Les phénomènes environnementaux varient fortement d’un territoire à l’autre et les données proviennent de sources multiples. Les travaux menés dans PRÉDICTION intègrent ces différentes informations au sein des modèles.

Les observations satellitaires occupent une place importante dans cette perspective, en particulier pour l’analyse de la pollution atmosphérique et de la qualité de l’air. Les instruments dédiés au suivi global offrent une couverture étendue ; leur résolution spatiale reste toutefois limitée pour l’analyse de phénomènes locaux. Des méthodes fondées sur l’apprentissage automatique enrichissent ces observations en reconstruisant des structures spatiales plus fines tout en préservant la cohérence physique des mesures.

Des modèles capables d’évoluer avec les données

Les systèmes environnementaux se transforment continuellement sous l’effet des variations climatiques, des usages ou des dynamiques territoriales. Les modèles prédictifs doivent donc évoluer au fil du temps.

PRÉDICTION s’intéresse à des approches d’apprentissage continu dans lesquelles les modèles s’actualisent automatiquement à partir des nouvelles observations collectées. Ces stratégies permettent d’éviter des réapprentissages complets à chaque mise à jour et contribuent ainsi à réduire les coûts de calcul, les besoins de stockage et l’empreinte environnementale associés à l’exploitation des modèles.

Les travaux interrogent plus largement les pratiques d’évaluation habituellement utilisées en intelligence artificielle, qui se concentrent souvent uniquement sur la précision des prédictions obtenues sur des jeux de données de référence. Dans le domaine environnemental, l’évaluation des modèles doit prendre en compte leur robustesse face à l’évolution des données, leur capacité de généralisation ainsi que les ressources mobilisées tout au long de leur cycle de vie.

Les premiers résultats obtenus sur des tâches de prévision hydrogéologique montrent notamment que les architectures les plus complexes n’apportent pas systématiquement d’améliorations significatives par rapport à des approches plus simples. Ces travaux contribuent au développement d’approches prédictives plus durables et adaptées aux contraintes scientifiques, opérationnelles et environnementales des jumeaux numériques.

Explicabilité et évaluation des modèles prédictifs

En parallèle, plusieurs travaux portent sur l’interprétation des résultats des modèles d’intelligence artificielle appliqués aux données environnementales : identification des variables influentes dans les prédictions, estimation de la confiance associée aux résultats produits, analyse des relations entre variables environnementales. Ces éléments facilitent l’analyse scientifique et renforcent l’utilité opérationnelle des modèles.

Vers des jumeaux numériques prédictifs

Les modèles développés dans PRÉDICTION alimenteront les jumeaux numériques environnementaux du programme JUNON. Leur intégration ouvre la voie à des outils capables de faire des prévisions à différentes échelles de temps, de les actualiser à mesure que de nouvelles données deviennent disponibles mais aussi de simuler l’évolution de systèmes naturels complexes en fonction de scénarios ou de projections.

À plus long terme, ces recherches contribueront à structurer des méthodes pour la conception de jumeaux numériques environnementaux capables d’anticiper l’évolution des systèmes naturels et d’accompagner la gestion durable des ressources.

Responsable scientifique :

JUNON
Nicolas Ragot : Projet PREDICTION
Professeur des Universités à l’Université de Tours
Responsable du département informatique de Polytech Tours
Chercheur dans l’équipe Reconnaissance de Formes et Analyse d’Images (RFAI)
du LIFAT (Laboratoire d’Informatique Fondamentale et Appliquée de Tours)

Université de Tours
64 av. Jean Portalis
37200 Tours
France