C.04 - Procédures multi-modèle

Sommaire

1 Pourquoi l'approche multi-modèle ?
2 Comment combiner au mieux plusieurs modèles ?
- 2.1 Combinaisons purement déterministes
- 2.2 Combinaisons des incertitudes associées à chaque modèle
3 Évaluation de l'apport de ces combinaisons

Pourquoi l'approche multi-modèle ?

Les procédures multi-modèle consistent à valoriser les résultats de plusieurs modèles pour élaborer une simulation ou une prévision. Cette méthode est notamment employée en hydrologie pour prendre en compte l'incertitude sur la structure des modèles, c'est-à-dire sur la représentation mathématique des processus impliqués dans la relation Pluie – Débit. Cette représentation imparfaite des processus (hydrologiques ou autres) a les conséquences suivantes :

les faiblesses d'un modèle donné empêchent d'avoir l'assurance de l'existence d'un jeu de paramètres « parfait ». Il n'est même pas sûr qu'un ensemble fini de jeux de paramètres soit suffisant pour rendre compte de l'ensemble des situations devant être simulées par le modèle.
pour un modèle donné, plusieurs jeux de paramètres peuvent conduire à des performances optimale (concept d'équifinalité, discuté entre autres par Beven et Binley, 1992).
plusieurs modèles, bien que très différents dans leurs structures, peuvent conduire à des performances globales équivalentes (Perrin, 2000; Marchandise, 2007)

Si les performances de différents modèles (ou paramétrisations d'un modèle) peuvent apparaître sensiblement égales (en moyenne), il peut être souhaitable de valoriser les différents comportements de ces modèles (ou paramétrisations), dans la mesure où chacun(e) d'entre eux renvoie à un comportement possible du bassin modélisé (réponse hydrologique). L'approche multi-modèle est une méthode, parmi d'autres (fiche C.1), qui y concourt.

Différentes études ont montré que l'approche multi-modèle était plus apte à capter l'étendue de l'incertitude structurelle qu'un ensemble généré à partir d'un modèle unique. Les procédures multi-modèle permettent de répondre à deux objectifs :

améliorer la prévision déterministe ;
fournir une évaluation de l'incertitude due aux imperfections des modèles.

Comment combiner au mieux plusieurs modèles ?

L'utilisation la plus simple des sorties de plusieurs modèles consiste à les afficher simultanément, ce qui permet au prévisionniste de réaliser une analyse subjective et qualitative de l'incertitude.

Au delà de l'affichage des différentes sorties, plusieurs stratégies de combinaison des sorties de plusieurs modèles existent. Elles peuvent fournir :

une combinaison déterministe des résultats des modèles (une N + 1e prévision, fonction des prévisions des N modèles) ;
une combinaison probabiliste qui apporte également une information sur l'incertitude (due à la modélisation).

Combinaisons purement déterministes

Combinaisons fixes dans le temps

De nombreuses approches consistent en le calcul d'une moyenne simple (SMA^[1]) ou pondérée (WMA) des sorties des N modèles.

Dans le cas d'une moyenne pondérée, différentes méthodes permettent de calculer les poids aj. L'une des plus simples consiste en la résolution d'un système multi-linéaire (régression sur les performances des différents modèles).

Des combinaisons non linéaires sont également proposées, c'est par exemple le cas de réseaux de neurones artificiels (Shamseldin, 1997).

Combinaisons évoluant dans le temps

Il est également possible d’adapter la combinaison à la situation hydrologique en cours pour tirer le meilleur profit des modèles les plus performants sur les derniers pas de temps.

Exemple 1. Une telle méthode est proposée par Shamseldin et O'Connor (1999) qui calculent les poids d'une fonction de transfert linéaire (LTFM) en fonction de l'erreur sur les p derniers pas de temps des différents modèles : ces poids minimisent l'erreur sur le débit prévu résultant de la combinaison multi-modèle sur ces derniers pas de temps.

Exemple 2. (procédure multi-modèle implémentée dans SOPHIE). Roche et Tarmin (1986) puis Loumagne et al. (1995) ont proposé une procédure multi-modèle pour les bassins de la Vézère et de la Garonne amont. Dans cette méthode, le débit prévu s'exprime comme une somme pondérée des débits prévus avec des poids variables dans le temps :

L'originalité de l'approche réside dans le calcul du poids de chaque modèle au pas de temps t ; il suppose que le modèle peut fonctionner dans deux configurations différentes :

le modèle est dans une situation hydrologique et d'alimentation en données équivalentes aux conditions dans lequel il a été calé ;
le modèle évolue dans une situation hydrologique non rencontrée dans le calage ou est alimenté par des données dont la qualité douteuse n'a pas été identifiée (la procédure exclut par ailleurs de l'ensemble les modèles non alimentés ou mal-alimentés en données, cas de figure devant être considéré en prévision opérationnelle).

La première situation est rendue par un poids fixe tandis que la seconde situation fait intervenir un poids variable dans le temps (terme non stationnaire permettant à la procédure de s'adapter aux nouvelles configurations). Le poids total s'écrit donc:

Le terme non stationnaire permet de faire baisser ou augmenter l’importance d’un modèle dans la pondération de façon progressive.

Pour calculer les poids stationnaires, on fait l'hypothèse que les erreurs des différents modèles ne sont pas corrélées entre elles. Si Vi désigne la variance du ie modèle sur les données de calage, le poids stationnaire du modèle est défini par :

Le calcul des poids non stationnaires est fonction des performances du ie modèle sur les derniers pas de temps. Afin de stabiliser le calcul du poids évolutif, Loumagne et al. (1995) proposent un lissage des erreurs antérieures et de l’erreur à l’instant t :

Nous remarquons que le poids évolutif attribué à la prévision à t + Δt est calculé à partir des écarts quadratiques de l’instant t. On considère donc que le meilleur modèle à t+Δt est le meilleur modèle à t.

Les résultats de la prévision étaient peu influencés par la variation des constantes α et β (Roche et Tamin, 1986). Des valeur moyennes ont donc été adoptées pour le bassin de la Garonne . On accorde ainsi autant d’importance aux erreurs passées qu’aux erreurs récentes, le fonctionnement normal et le fonctionnement récent sont également conséquents dans le calcul du poids.

L'avantage d'une telle méthode est de tenir compte à la fois des performances a priori des modèles mais également de leur performance actuelle.

Combinaisons des incertitudes associées à chaque modèle

Si une incertitude est associée aux sorties de chacun des modèles (indépendamment de l'incertitude due au aux modèles), il est possible de combiner ces informations pour obtenir une évaluation de l'incertitude totale sur la prévision. Cette approche est similaire aux estimations d'incertitude pour les prévisions d'ensemble^[2].

Exemple 2 (suite). La méthode proposée par Roche et Tarmin (1986) puis par Loumagne et al. (1995) fait l'hypothèse de distributions gaussiennes des erreurs de chacun des modèles impliqués dans la procédure multi-modèle. Il est alors possible de reconstruire une distribution des erreurs de la procédure multi-modèle : c'est une somme pondérée des distributions des erreurs des modèles.

Exemple 3. Velázquez et al. (2011) proposent de combiner les prévisions d'ensemble du CEPMMT avec une démarche multi-modèle : les 50 membres de l'ensemble de prévisions de précipitation alimentent 16 modèles Pluie – Débit simples pour fournir un « super-ensemble » de 800 prévisions hydrologiques. La distribution prévue est obtenue en considérant les 800 prévisions équiprobables.

Exemple 4. Une approche classique est la moyenne bayésienne (BMA pour Bayesian Model Averaging). Elle permet de faire évoluer la distribution d'incertitude de la procédure multi-modèle.

Un problème qui apparaît fréquemment est la sous-dispersion : l'étendue de l'ensemble multi-modèle n'est pas capable de capter l'étendue de l'incertitude (a posteriori, les observations empiriques sont hors du champ défini par l'approche multi-modèle). Ceci est dû au fait que la procédure multi-modèle ne traite qu'une des sources d'incertitude. Pour pallier ce défaut, il est alors de possible de prendre en compte les autres sources d'incertitude significatives ou de réaliser un post-traitement utilisant une approche bayésienne visant à calibrer cette dispersion.

Exemple 4 (suite). Raftery et al. (2005) proposent un traitement bayésien des prévisions à court terme et à moyenne échelle de températures et de pression au niveau de la mer de 5 modèles météorologiques. Ce post-traitement conduit à déterminer une fonction de densité de probabilité pour le multi-modèle, sur la base d'une combinaison linéaire « intelligente » des fonctions de densité de chacun des modèles. Cette approche part du principe que, parmi l'ensemble des modèles, il y a un membre qui est meilleur que les autres, sans pour autant savoir duquel il s'agit. Il s'agit alors de quantifier, par une approche bayésienne cette incertitude sur le choix du meilleur modèle. Cette quantification est effectuée à partir des données d'apprentissage et conduit donc à la détermination de poids wk pour chacun des k modèles.

Évaluation de l'apport de ces combinaisons

Différents travaux s'attachent à évaluer l'apport de la combinaison multi-modèle :

Sur un plan déterministe, Shamseldin et O'Connor (1999) évaluent à l'aide du critère de Nash-Sutcliffe l'apport de la méthode de combinaison temps réel développée au 2.1.2. Sur 3 des 5 bassins testés, les performances en validation sont meilleures pour la combinaison multi-modèle que la performance de chacun des 3 modèles qui le composent. Néanmoins, on constate que les gains en validation restent limités à quelques points de critères de Nash-Sutcliffe (souvent de l'ordre de l'unité). Georgakakos et al. (2004) montrent dans le cadre de l'expérience états-unienne de comparaison des modèles DMIP, l'apport de l'approche multi-modèle : la simulation moyenne d'un ensemble de multi-modèle donne une performance supérieure aux simulations de tous les modèles, y compris à celle du meilleur modèle calibré. Ce résultat est confirmé par Butts et al. (2004), puis par Ajami et al. (2006) qui recommandent d'utiliser au minimum 4 modèles pour obtenir des simulations « consistantes ».
En ce qui concerne l'estimation de l'incertitude, l'apport du post-traitement bayésien évoqué au 2.2 est évalué par Raftery et al. (2005) qui présentent des estimations de prévision fiables de l'incertitude totale de prévision de champs de températures et de pression de surface. La combinaison d'un ensemble de prévisions de précipitation avec une combinaison multi-modèle présentée par Velázquez et al. (2011) présentent des niveaux de fiabilité élevés.

Voir également

Fiche C.01 – Méthodes usuelles d'estimation des incertitudes de prévision

Pour aller plus loin

Ajami, N. K., Duan, Q., Gao, X., Sorooshian, S. (2006). Multimodel Combination Techniques for Analysis of Hydrological Simulations: Application to Distributed Model Intercomparison Project Results. Journal of Hydrometeorology, 7:755–768. doi: http://dx.doi.org/10.1175/JHM519.1
Beven, K. et Binley, A. (1992). The future of distributed models: model calibration and uncertainty prediction

Hydrological Processes, 6:279–298

Butts, M. B., Payne, J. T., Kristensen, M. et Madsen, H. (2004). An evaluation of the impact of model structure on hydrological modelling uncertainty for streamflow prediction. Journal of Hydrology, 298:242–266
Georgakakos, K. P., Seo, D. J., Gupta, H., Schaake, J. et Butts, M. B. (2004). Characterizing streamflow simulation uncertainty through multimodel ensembles. Journal of Hydrol.ogy, 298:222–241
Loumagne, C., Vidal, J. J., Feliu, C., Torterotot, J. P. et Roche, P. A. (1995). Procédure de décision multimodèle pour une prévision des crues en temps réel. Application au bassin supérieur de la Garonne. Revue des Sciences de l'Eau, 8:539 –561
Marchandise, A. (2007). Modélisation hydrologique distribuée sur le Gardon d’Anduze ; étude comparative de différents modèles pluie-débit, extrapolation de la normale à l'extrême et tests d'hypothèses sur les processus hydrologiques. Thèse de doctorat, Université de Montpellier II.
Perrin, C. (2000). Vers une amélioration d'un modèle Pluie – Débit au travers d'une approche comparative, Thèse de doctorat, INPG
Raftery, A. E., Gneiting, T., Balabdaoui, F. et Polakowski, M. (2005). Using Bayesian Model Averaging to Calibrate Forecast Ensembles. Monthly Weather Review, 133:1155–1174.doi: http://dx.doi.org/10.1175/MWR2906.1
Roche, P. A. et Tamin, R. (1987). Procédures de décision multi-modèles applicables à la prévision des crues en temps réel. CERGRENE, ENPC, Noisy-le-Grand, 86 p.
Shamseldin, A., O'Connor, K. et Liang, G. (1997). Methods for combining the outputs of different rainfall-runoff models. Journal of Hydrology, 197:203–229
Shamseldin, A. (1997). Application of a neural network technique to rainfall-runoff modelling.

Journal of Hydrology, 199:272–294

Shamseldin, A. Y. et O’Connor, K. M. (1999). A real-time combination method for the outputs of different rainfall-runoff models. Hydrological Sciences Journal, 44(6): 895–912.

http://iahs.info/hsj/440/hysj_44_06_0895.pdf

Velázquez, J. A., Anctil, F., Ramos, M. H. et Perrin, C. (2011) Can a multi-model approach improve hydrological ensemble forecasting? A study on 29 French catchments using 16 hydrological model structures. Advances in Geosciences, 29:33 – 42, doi:10.5194/adgeo-29-33-2011
Zin, I., 2002. Incertitudes et ambiguïté dans la modélisation hydrologique. Thèse INPG, Grenoble.

↑ SMA : Simple Model Averaging ; WMA : Weighted Model Averaging
↑ Une distinction est souvent faite entre prévisions d'ensemble et approches multi-modèle. Dans les approches multi-modèle, les différents « membres » sont aisément distinguables les uns des autres. Au contraire, les membres d'une prévision d'ensemble sont indiscernables ; c'est par exemple le cas des prévisions d'ensemble météorologiques résultant de l'exécution du même modèle avec des conditions initiales légèrement plus différentes, définies de façon (au moins partiellement) aléatoire.

[0] SMA : Simple Model Averaging ; WMA : Weighted Model Averaging

[1] Une distinction est souvent faite entre prévisions d'ensemble et approches multi-modèle. Dans les approches multi-modèle, les différents « membres » sont aisément distinguables les uns des autres. Au contraire, les membres d'une prévision d'ensemble sont indiscernables ; c'est par exemple le cas des prévisions d'ensemble météorologiques résultant de l'exécution du même modèle avec des conditions initiales légèrement plus différentes, définies de façon (au moins partiellement) aléatoire.

[1]

[2]