La population redistribuée au niveau sous-régional est encore ajustée spatialement, séparément pour les zones urbaines et rurales. En supposant une offre fixe de logements dans les zones déjà bâties, l'évolution de la population dans les zones urbaines et l'expansion de ces zones (c'est-à-dire le tissu urbain ou les classes CLC 111 et 112) sont entraînées par l'évolution du nombre total de ménages urbains. Comme la population a augmenté mais que le nombre moyen de personnes par ménage a diminué dans toute l'Europe depuis le XIXe siècle, la demande de logements a considérablement augmenté. Le mouvement de population vers les périphéries des villes (périurbanisation) s'accompagne d'une réduction de la densité de population dans les « noyaux » urbains où un nombre similaire de ménages contient un stock de population en déclin. Ce processus d'aplatissement de la répartition de la population en tant que fonction logarithmique de la distance aux noyaux urbains a été quantifié par Clark44 et de nombreuses études ultérieures45,46.
En prenant la population urbaine totale U et le nombre moyen de personnes par ménage H (taille du ménage) de nos statistiques historiques, nous pouvons calculer le nombre total de ménages urbains Nt = Ht/Ut l'année t pour chaque région. Nous simulons comment l'augmentation de Nt a provoqué l'expansion du tissu urbain grâce à la construction de nouveaux logements et d'infrastructures connexes dans des zones auparavant non développées. Dans de rares cas, au cours des dernières années, il y a eu une diminution du nombre de ménages urbains au fil du temps. Jusqu'à présent, cela a conduit à la vacance des logements plutôt qu'à une contraction de la surface du tissu urbain.
La modélisation opère en modifiant, pour un pas de temps t donné, la population par maille de tissu urbain P2011 définie dans la grille de population de référence. Cela se fait séparément et indépendamment pour chaque VLAU, où la population urbaine totale de référence est \({U}_{2011}=\sum {P}_{2011}\). Le but de cette étape de modélisation est de générer une nouvelle grille de population, où \(\sum {P}_{2011}\) correspond à Ut, qui à son tour est la population urbaine totale d'une VLAU au pas de temps t. Ut est défini au préalable pour chaque VLAU, car il s'agit d'un ajustement proportionnel de la population totale de toutes les VLAU d'une région NUTS3 donnée, déjà calculée à la section S2.2, à la population urbaine totale d'une région NUTS3 définie dans les statistiques historiques. Nous connaissons donc la population urbaine attendue dans une VLAU et devons modifier la grille de population pour reproduire l'évolution historique de la taille de la population urbaine et l'évolution de sa répartition au sein des villes. Les modifications de la taille des ménages sont tirées des statistiques historiques au niveau NUTS3. La procédure se fait par étapes :
Dans chaque cellule de la grille du tissu urbain d'une VLAU, la population de cellules de la grille P à l'année t est modifiée par rapport à la référence de 2011 pour tenir compte de l'évolution de la taille du ménage :
où H est la taille moyenne des ménages, déterminée pour chaque région NUTS3;
Toutes les cellules de la grille d'une région sont classées en fonction de la distance par rapport aux centres urbains (expliqué plus loin dans le texte), où les cellules les mieux classées sont les plus proches de tout centre urbain.
La population excédentaire St est calculée :
où \({U}_{t}=\sum {P}_{t}\) est la population urbaine totale dans la VLAU. La modélisation se termine ici si St = 0, mais ce n'est presque jamais le cas. St est généralement positif ou négatif et indique combien de personnes, après avoir ajusté la grille de la population à la taille du ménage du niveau historique Ht, doivent être supprimées ou ajoutées à la grille afin de correspondre à la population totale historique Ut. Selon que l'on modélise une année avant ou après la ligne de base, quatre combinaisons de St et t peuvent être distinguées, comme indiqué dans le tableau 7.
Dans les deux cas A et B, c'est-à-dire St > 0, t < 2011 et St < 0, t > 2011, le nombre de ménages, et donc l'étendue des aires urbaines, s'est élargi dans le temps. Pour les pas de temps antérieurs à 2011, cela signifie qu'une partie du tissu urbain doit être supprimée de l'ensemble de données raster d'occupation/d'utilisation du sol de référence (cas A), tandis que pour les pas de temps postérieurs à 2011, davantage de tissu urbain doit être ajouté (cas B). Les changements dans la population des cellules de la grille P dépendront de la distance des centres urbains d. La distance aux centres urbains utilisée ici est une moyenne pondérée de différentes mesures de centres de population ("distance combinée") afin de saisir les multiples niveaux de hiérarchie existant dans les réseaux urbains. Cinq ensembles de données différents ont été testés et, sur la base d'un processus d'étalonnage expliqué dans le texte supplémentaire S2 (le même que dans Paprotny et al.32), quatre de ces ensembles de données ont été sélectionnés pour la distance combinée des centres urbains. Les jeux de données et leurs poids sont les suivants :
Centres arbitraires des grandes agglomérations (plus de 300 000 personnes en 2018) et des capitales de la révision 2018 des perspectives d'urbanisation mondiale des Nations Unies (https://population.un.org/wup/), avec un poids de 1,0
Centroïdes des grappes de population à haute densité44, avec un poids de 1,5
Centroïdes des villes incluses dans l'Atlas urbain 201844, avec un poids de 2,0
Barycentres des parcelles urbaines Corine Land Cover 2012, avec un poids de 0,5.
La distance combinée est calculée pour chaque cellule de la grille. Ensuite, la modélisation se poursuit selon les cas :
Cas A : les mailles urbaines sont supprimées de manière itérative en remontant à partir de l'année de base 2011 en commençant par la moins bien classée (i = 1), et leur population est réduite de la proportion D :
La proportion D est basée sur le logarithme de la distance aux centres urbains d en hectomètres :
À chaque itération, le surplus est réduit de la quantité de population redistribuée :
Le calcul se poursuit jusqu'à ce que St,i = 0. Cependant, si à une itération, il y a plus de population dans les cellules de la grille que de surplus restant, c'est-à-dire :
la population est réduite du montant disponible, divisé proportionnellement à la population de cellules de la grille s'il y a plus de cellules avec le même rang :
Cas B : les cellules où l'expansion urbaine a le plus probablement eu lieu sont identifiées à l'aide du modèle de transition d'affectation des sols décrit à l'étape 10, en commençant par les cellules présentant la probabilité de transition la plus élevée. Si plus de cellules avaient la même probabilité de transition vers le tissu urbain qu'il n'en fallait pour affecter la population supplémentaire, les cellules de ce groupe étaient classées en fonction de la distance par rapport au centre urbain. La population dans les cellules les mieux classées, c'est-à-dire l'itération i = 1, est fixée à la population maximale par cellule de grille dans la VLAU, réduite de la proportion D de l'Eq. 12 :
À chaque itération, le surplus est augmenté de la quantité de population redistribuée :
Le calcul se poursuit jusqu'à St,i = 0. Cependant, si à une itération il y a plus de population à redistribuer que de surplus disponible, c'est-à-dire :
le surplus est réparti équitablement entre toutes les cellules qui ont été modifiées jusqu'à cette itération (notée n) :
S'il n'y a pas de cellules de grille vides disponibles dans la VLAU, la population de toutes les cellules de grille urbaines est augmentée proportionnellement de la même manière que dans l'équation. 19.
Cas C et D : dans ces cas, le nombre de ménages a diminué au fil du temps, car certains logements sont devenus vacants. L'aire urbaine est restée inchangée, le tissu urbain n'étant pas supprimé sauf cas très extrêmes. Avant 2011, la population de toutes les cellules de la grille urbaine était ajoutée à la grille (cas C), tandis qu'après 2011, elle était supprimée (cas D). La population a augmenté/diminué proportionnellement à la population dans une cellule de grille donnée en 2011 (comme dans l'équation 19).
La modélisation de la redistribution de la population dans les zones urbaines est étroitement liée à l'évolution du tissu urbain. Dans les cas A et B, l'aire urbaine change du fait de la croissance du nombre de ménages urbains, contrairement aux cas C et D, où le tissu urbain reste inchangé. Comme le tissu urbain est étroitement lié à une forte densité de population, les cellules de la grille du tissu urbain ne sont supprimées (cas A) ou ajoutées (cas B) à l'ensemble de données de référence que si les changements de densité de population sont suffisamment importants. Par conséquent, le tissu urbain est supprimé dans les pas de temps avant l'année de référence 2011 uniquement si la population dans une cellule de la grille a été réduite à moins de 9 personnes. Pour les pas de temps après 2011, seule une augmentation de la population à plus de 81 par cellule de grille de 100 m a entraîné la transition vers une classe de tissu urbain. Les deux seuils ont été obtenus en calibrant le modèle pour correspondre à l'ampleur du changement observé dans les inventaires CLC (2000-2018). Entre 2000 et 2012, le tissu urbain s'est agrandi de près de 1,88 million d'ha, alors qu'entre 2012 et 2018 seulement de 98 676 ha, selon les données du CLC. En fixant les seuils de population par calibrage, le modèle représente correctement l'effet de l'évolution de la population urbaine sur le type d'utilisation des terres. Comme le montrent les résultats, l'étalonnage était effectivement applicable jusqu'à l'année 1900.
Les aéroports et les réservoirs sont de grands éléments d'infrastructure qui sont apparus pour la première fois au cours de la période de cette étude. Comme la période de construction de ceux-ci est généralement bien connue et que leur nombre est relativement faible, ils sont supprimés ou ajoutés au jeu de données raster de référence en fonction de l'année de construction. Nous avons identifié 1598 aéroports et 1121 grands réservoirs (Fig. 4) dans la zone d'étude en combinant des ensembles de données CLC (classes CLC 124 et 512) avec des bases de données mondiales de ces objets (https://www.globaldamwatch.org/grand et https:/ /ourairports.com/data/) et complétées par une recherche en ligne de leur histoire. Bien que HANZE v1.0 comprenne également ces données, en raison de l'ajout de nouveaux pays, de l'utilisation d'un ensemble de données CLC révisé et de mises à jour des bases de données mondiales sur les aéroports et les réservoirs, nous avons recompilé les données sur les aéroports et les réservoirs à partir de zéro. Un aéroport ou des réservoirs qui sont supprimés de l'ensemble de données de référence permettent à d'autres types d'utilisation des terres de remplir l'espace vide résultant. Un ajout d'un tel objet après 2011 supprime toute population qui y était présente en 2011.
Nombre (a) d'aéroports et (b) de réservoirs construits dans la zone d'étude entre 1870 et 2020 (périodes de 5 ans se terminant par l'année indiquée).
La population rurale est recalculée séparément pour chaque VLAU, en ajustant la population de base de la cellule de grille proportionnellement à sa valeur, de sorte qu'elle soit égale à la population attendue dans cette zone. Pendant des années avant la référence, les zones dont le tissu urbain a été supprimé sont toujours considérées comme urbaines aux fins de ce calcul. Pendant des années après la référence, la population rurale dans les zones qui sont passées au tissu urbain n'est plus considérée comme rurale, par conséquent, l'ajustement n'est effectué que sur les cellules rurales restantes dans la VLAU.
Comme la population est toujours enregistrée sous forme de nombres entiers, un écart peut survenir en ajustant la population dans les cellules de la grille puis en l'arrondissant. Par conséquent, la population ajustée dans les cellules de la grille est d'abord arrondie à l'aide de la fonction "plancher", puis les cellules de la grille avec les restes les plus élevés de la division des valeurs non arrondies par 1 sont arrondies à l'aide de la fonction "plafond". Le nombre de restes les plus élevés est déterminé par la différence entre la population attendue dans la VLAU et la population totale de cellules ajustée et arrondie à l'aide de la fonction "plancher".
La zone couverte par les grandes installations industrielles/commerciales (classe CLC 121) est supposée évoluer proportionnellement au PIB généré dans une région NUTS 3 par l'industrie et les services. Les cellules de la grille industrielle situées les plus éloignées des centroïdes des parcelles d'utilisation des terres industrielles sont supprimées en premier lors d'un retour dans le temps. Pour les pas de temps après l'année de référence, les cellules de la grille industrielle les plus proches des centroïdes sont ajoutées en premier. L'utilisation industrielle des terres ne peut s'étendre que dans les cellules inhabitées de certaines classes CLC : chantiers de construction (133), agricoles (211-244) et certaines zones naturelles (311-324 et 333). Cependant, la croissance du PIB de l'industrie et des services n'est que partiellement tirée par l'expansion des installations, car la productivité du capital et du travail a tendance à augmenter. En effet, la classe CLC 121 a augmenté entre 2000 et 2018 (sur la base de CLC 2012 et CLC-Changes) de 16% dans la zone d'étude, mais le PIB de l'industrie et des services a augmenté de 32%. Par conséquent, la variation du PIB de l'industrie/des services est mise à l'échelle par une élasticité de 0,45, de sorte que les variations modélisées entre 2000 et 2018 dans la zone d'étude ont la même ampleur que celle observée dans l'inventaire CLC. La zone industrielle A dans la région r et l'année t est la suivante :
où ε est l'élasticité et Gr est le PIB régional de l'industrie/des services selon les statistiques historiques au niveau NUTS3.
La superficie couverte par les routes et les voies ferrées (classe CLC 122) avant 2000 était supposée changer proportionnellement à la longueur des autoroutes et des voies ferrées. Des données historiques sur la longueur de ce type d'infrastructure ont été incluses dans la base de données d'entrée. Comme les infrastructures ont d'abord été construites dans les grandes zones urbaines et industrielles, les mailles des infrastructures (classe CLC 122) situées les plus éloignées des centres urbains sont supprimées en premier en remontant dans le temps jusqu'à ce que la superficie totale par région corresponde à la valeur de la base de données. À l'inverse, les mailles les plus proches des centres urbains sont remplies d'infrastructures pour les pas de temps après l'année de référence. L'infrastructure n'est autorisée à s'étendre qu'à certaines classes CLC: chantiers de construction (133), agricoles (211–244) et certaines naturelles (311–324 et 333). Cependant, les chantiers de construction ont été priorisés par rapport aux autres classes CLC; toutes les cellules de la grille « construction » doivent être épuisées avant que d'autres classes CLC puissent être envisagées. En effet, en dehors du tissu urbain ou des sites industriels déjà considérés dans les étapes précédentes, les sites routiers et ferroviaires sont les aboutissements les plus fréquents de l'activité de construction. Nous avons trouvé ce modèle dans les transitions d'utilisation des terres dans les inventaires CLC ultérieurs (2000-2018) : près de la moitié de la superficie des chantiers de construction dans l'inventaire CLC qui a fait la transition vers d'autres tissus urbains ou sites industriels (considérés dans les étapes précédentes) a fait la transition aux infrastructures d'ici le prochain inventaire à 6 ans.
Les chantiers de construction (classe 131 du CLC) sont par définition une utilisation temporaire du sol, généralement pour quelques années seulement. L'inventaire CLC montre que 76 à 81 % des chantiers de construction passent à une autre utilisation des terres au cours des périodes de 6 ans entre les ensembles de données CLC (2000-2006, 2006-2012, 2012-2018). Par conséquent, pour les années 2005 à 2011, leur superficie a été supposée constante, tandis que pour les années 1870 à 2004, tous les sites de construction ont été supprimés de l'ensemble de données. Après 2011, ils ont été autorisés à faire la transition vers le tissu urbain, les sites industriels, les routes, les voies ferrées et les aéroports (CLC 111-122 et 124), mais sont par ailleurs restés inchangés.
Les espaces verts urbains, les équipements sportifs et de loisirs (classes CLC 141 et 142) sont étroitement liés aux autres surfaces artificielles. Près des deux tiers de ces parcelles CLC bordent soit le tissu urbain, soit des sites industriels, soit des sites routiers/ferroviaires, soit des aéroports dans l'inventaire CLC 2012. Par conséquent, les patchs des classes CLC 141 et 142 qui bordaient les classes CLC 111–122 et 124 dans l'ensemble de données de base sont supprimés si dans un pas de temps donné, s'ils ne bordent plus les classes CLC 111–122 et 124 en raison de l'application de la modélisation précédente pas. Les ports, l'extraction minière et les décharges (classes CLC 123, 131 et 132) sont de grands éléments d'infrastructure comme les aéroports et les réservoirs, mais ils sont trop nombreux (près de 15 000 objets) et leur histoire moins traçable pour appliquer la même approche que pour les aéroports. . Par conséquent, ils ont été maintenus constants à chaque pas de temps et n'ont pas interagi avec d'autres classes d'utilisation des terres, sauf en ce qui concerne la construction de polders (étape 1) ou de réservoir (étape 4).
Le concept général de modélisation des changements des terres agricoles a été tiré de l'ensemble de données HYDE50, c'est-à-dire que l'adéquation locale à l'agriculture détermine où cette classe d'utilisation des terres se développe (la plus adaptée des terres disponibles en premier) et se contracte (la moins adaptée tombe en désuétude en premier). L'évolution des zones agricoles et l'augmentation du tissu urbain après l'année de référence ont été calculées à l'aide d'un modèle utilisant un réseau bayésien (RN) qui combine la théorie des probabilités et la théorie des graphes afin de construire et d'exploiter une distribution conjointe. Le BN est formé avec l'ensemble de données CLC-Changes, qui enregistre 1,2 million de transitions impliquant des parcelles de terrain de plus de 5 ha, et CLC 2012 identifiant les types d'utilisation des terres qui n'ont pas connu de transition entre 2000 et 2018. The CLC-Changes et CLC 2012 inventaire ont été échantillonnés pour obtenir 513 915 cas de transition et un nombre égal de parcelles d'utilisation des terres stables entre 2000 et 2018. Jeu de données DEM51 (https://ec.europa.eu/eurostat/web/gisco/geodata/reference-data/elevation/eu-dem/eu-dem-laea, aptitude agricole de Global Agro-Ecological Zoning (GAEZ) version 4 base de données (https://gaez-data-portal-hqfao.hub.arcgis.com/) et ensemble de données de population des étapes 2 et 3. La procédure d'échantillonnage et une liste de tous les prédicteurs testés sont décrites dans le texte supplémentaire S3.
Comme l'information sur l'utilisation des terres est catégorique, un NE discret a été utilisé. Les classes d'occupation des sols ont été collectées dans 5 bacs (tissu urbain, autre artificiel, terres cultivées, pâturages, naturel). Le groupe avec terres naturelles exclut les types de couverture terrestre non utilisables (CLC 331–332, 334–335, 421–523), qui ne sont pas autorisés à interagir avec l'utilisation des terres artificielles ou agricoles. Le modèle BN a été construit de manière itérative, en commençant par un simple réseau à trois nœuds, où la « ancienne » classe d'utilisation des terres est le parent de la « nouvelle » classe d'utilisation des terres, et une seule variable prédictive est le parent des deux classes d'utilisation des terres. utiliser des nœuds. Des BN plus complexes avec plus de prédicteurs ont été respectivement validés par rapport à un sous-ensemble disjoint d'échantillons de transitions et de non-transitions non utilisés pour la formation (voir le texte supplémentaire S3 pour la procédure d'échantillonnage et la «validation technique» pour les résultats finaux de la validation). De manière itérative, les meilleurs prédicteurs, le nombre de prédicteurs et le nombre de cases (dans lesquelles les variables continues ont été discrétisées) ont été sélectionnés. Trois prédicteurs ont été choisis, qui sont tous les parents des deux nœuds d'utilisation des terres (Fig. 5) :
Densité de population par VLAU – 9 bacs ;
Indice d'aptitude pour le blé : densité de production (production potentielle divisée par la surface totale des cellules de la grille) pour le blé dans des conditions pluviales et un niveau d'intrants élevé – 5 cellules ;
Indice d'aptitude pour l'herbe : rendement potentiel agro-climatique pour l'herbe avec une teneur en eau disponible de 200 mm/m (en conditions d'irrigation) et un niveau d'apport élevé - 10 bacs.
Réseau bayésien pour les transitions d'utilisation des terres avec 5 nœuds et 7 arcs. Les nœuds indiquent le nombre de casiers des distributions discrètes et les intervalles des casiers.
Les deux indices d'aptitude agricole proviennent de la base de données GAEZ, basée sur le climat de 1971 à 2000. Comme le BN est quantifié avec une table de probabilité conditionnelle (CPT), cette configuration se traduit par un CPT ayant 11 250 cellules. Par conséquent, aucune autre variable n'a été ajoutée pour éviter trop peu de points de données quantifiant les cellules du CPT.
La figure 6 montre un exemple d'application du réseau bayésien. Dans ce cas, nous connaissons l'utilisation actuelle des terres (terres cultivées) et nous savons qu'au cours d'une période antérieure, la superficie totale des terres cultivées dans une région NUTS3 était inférieure à ce qu'elle est actuellement. Par conséquent, nous voulons connaître la probabilité que l'utilisation des terres soit différente des terres cultivées dans les cellules de la grille situées dans la région. La figure 6a montre une zone qui était très probablement une terre cultivée auparavant, en raison d'une densité de population relativement élevée et d'une bonne aptitude à l'agriculture. La zone de la Fig. 6b a une aptitude plus faible, ce qui indique une probabilité beaucoup plus élevée que la zone ait été utilisée à d'autres fins que les terres cultivées. Par conséquent, la zone de la Fig. 6b sera classée plus haut que la zone de la Fig. 6a lors de la sélection des cellules de grille des terres cultivées qui seront supprimées du jeu de données raster afin de faire correspondre la superficie totale des terres cultivées avec les données statistiques historiques.
Exemple de réseau bayésien conditionnel pour les transitions d'occupation du sol. Le panneau (a) montre une zone hautement appropriée pour les terres cultivées, et (b) une zone inappropriée. Le graphique indique la probabilité a priori (situation sur la Fig. 5) et a posteriori (les nœuds en gris étant conditionnés avec les valeurs indiquées) du type d'utilisation des terres précédent (60,8 % en (a) et 43,4 % en (b) pour être des terres cultivées).
Le BN formé est utilisé pour générer des probabilités de transitions d'affectation des terres dans neuf cas, comme suit :
de non urbain à urbain après l'année de référence ;
de terres non cultivées à terres cultivées après l'année de référence ;
de non-pâturage à pâturage après l'année de référence;
des terres cultivées aux terres non cultivées après l'année de référence ;
du pâturage au non-pâturage après l'année de référence;
de terres non cultivées à terres cultivées avant l'année de référence ;
de non-pâturage à pâturage avant l'année de référence;
des terres cultivées aux terres non cultivées avant l'année de référence ;
du pâturage au non-pâturage avant l'année de référence.
Comme indiqué à la section 2.4.3, le BN traite le cas de la transition non urbaine vers urbaine après 2011. Lorsque les besoins en logement de la population entraînent l'expansion des villes, les zones présentant la plus forte probabilité de transition de terres non urbaines vers des terres urbaines -l'utilisation est l'accumulation en premier. Le BN est utilisé de la même manière pour les huit cas restants liés à l'agriculture, c'est-à-dire qu'ils déterminent dans quelles zones agricoles ajouter ou supprimer de sorte que la superficie totale des terres cultivées et des pâturages dans le jeu de données raster de couverture terrestre/utilisation pour un pas de temps donné correspond aux valeurs obtenues à partir des statistiques historiques par région NUTS3. Cela se fait de manière itérative en commençant par les parcelles de terre avec la plus forte probabilité de transition entre des classes données (par exemple, non-pâturage à pâturage). La redistribution des terres cultivées est modélisée en premier, puis les pâturages sont redistribués dans la deuxième étape. Les terres encore occupées par des terres cultivées après la première étape ne peuvent pas passer au pâturage. Cependant, les terres vidées par la redistribution des terres cultivées lors de la première étape peuvent passer au pâturage lors de la deuxième étape.
Nous devons modéliser les transitions en arrière dans le temps pour les pas de temps avant 2011. Nous supprimons partiellement le tissu urbain ou les sites routiers/ferroviaires au cas où ils occupaient moins de terrain dans le passé et créons un espace vide, que les terres cultivées peuvent occuper. Avancer dans le temps, c'est une transition entre terres cultivées et terres non cultivées. La probabilité de transition utilisée pour déterminer les cellules à remplir avec des terres cultivées est la probabilité qu'une cellule de terres non cultivées ait été une terre cultivée auparavant. Il en est de même pour les pâturages, à condition qu'ils ne puissent pas occuper des cellules déjà affectées à des terres cultivées. La transition des surfaces artificielles restantes à cette étape du modèle vers l'utilisation des terres agricoles n'est pas autorisée.
Dans le processus itératif de redistribution de l'utilisation des terres, le nombre de cellules de grille avec une probabilité égale de transition peut dépasser le nombre de cellules qui doivent être converties pour correspondre à la superficie totale dans les statistiques historiques. Cela se produit souvent car les prédicteurs (ensemble de données GAEZ et densité de population par VLAU) ont une résolution relativement grossière avec un petit nombre de cases dans lesquelles les données sont divisées. Afin de dériver des cellules de grille exactes de 100 m à partir de parcelles de terre de probabilité égale, un autre prédicteur de l'aptitude agricole a été ajouté. La pente du terrain est un prédicteur important, également utilisé dans les deux indices d'aptitude agricole de la FAO. Il est disponible dans la résolution cible (100 m) en tant que quantité continue à partir de l'ensemble de données d'élévation EU-DEM. Une pente plus faible indique une meilleure aptitude à l'activité agricole, par conséquent, des cellules de 100 m de probabilité égale de transition sont classées en fonction de la pente de la plus faible à la plus élevée. Le nombre approprié de cellules les mieux classées est ajouté/supprimé afin que la superficie totale des terres cultivées ou des pâturages corresponde exactement à la superficie totale dans les statistiques historiques.
Les zones naturelles contiennent moins de 1 % de la population et des immobilisations, par conséquent, une modélisation limitée est effectuée pour ces classes. Les zones où la végétation a brûlé (généralement des forêts) sont par définition une utilisation temporaire des terres. Les zones brûlées ont une durée de vie très courte : presque aucune des parcelles d'occupation du sol de cette classe (CLC 334) en 2012 n'était présente dans les inventaires CLC de 2006 ou 2018. Pour les années 2007-2017, la superficie brûlée a été supposée constante, tandis que pour les années 1870-2006 et 2018-2020, toutes les zones brûlées ont été supprimées de l'ensemble de données. Comme presque toutes les zones brûlées sont anciennement ou ultérieurement des classes CLC 311 à 324, cette étape de modélisation est effectuée après la redistribution des zones agricoles. Pourtant, il n'y a pas d'exposition dans les zones brûlées, et très peu d'exposition dans l'utilisation des terres précédente, sauf dans de rares cas.
Les espaces naturels sont ce qui reste après modélisation des zones artificielles, agricoles et brûlées ainsi que des réservoirs et des cas particuliers. Les espaces naturels couvriraient tout le continent sans activité humaine. Par conséquent, si un terrain devient inoccupé à la suite de la modélisation, on lui attribue la même couverture terrestre naturelle qui est typique dans son voisinage le plus proche. La couverture végétale naturelle typique (classes CLC 311–324 et 411–422) est définie comme la plus fréquente dans la VLAU. Le calcul est effectué séparément pour les forêts (CLC 311–313) et les autres terres naturelles (CLC 321–324 et 411–422), et le plus fréquent des deux groupes est utilisé. S'il n'y a pas de couverture naturelle dans la VLAU, la couverture terrestre végétale dominante de la région NUTS3 applicable est utilisée. Si aucune couverture végétale n'était localisée dans la région NUTS3, les terres inoccupées étaient supposées être couvertes d'arbustes boisés de transition (CLC 324), car il s'agit des terres naturelles non forestières les plus courantes dans la zone d'étude.
Après la première allocation, la superficie totale des forêts est comparée aux données historiques de la base de données NUTS3. S'il y a trop de superficie forestière dans une région NUTS3 donnée, les terres qui ont été attribuées à la forêt à cette étape sont converties de manière itérative dans la classe non forestière la plus fréquente, en commençant par la VLAU la plus densément peuplée. Inversement, s'il n'y a pas suffisamment de terres forestières, les cellules qui ont été attribuées à la végétation non forestière à cette étape sont converties de manière itérative dans la classe forestière la plus fréquente, en commençant par la VLAU la moins densément peuplée.
Toutes les autres terres naturelles, sans végétation et généralement interdites à la construction ou à l'agriculture, c'est-à-dire les plages, les dunes, les sables (CLC 331), les roches nues (CLC 332), les glaciers et les neiges éternelles (CLC 335), les plaines intertidales (CLC 423) et l'eau (CLC 511-523), ont été maintenus constants tout au long. Les parcelles de ces types de couverture terrestre sont supprimées de l'ensemble de données uniquement en relation avec la construction de réservoirs (étape 4) ou de polders (étape 1).
Les changements dans l'imperméabilisation des sols sont entièrement basés sur les transitions d'utilisation des terres, donc cette étape est effectuée après la modélisation de l'utilisation des terres, mais avant la désagrégation des données économiques. L'imperméabilisation des sols dans le jeu de données raster de référence est augmentée à la valeur moyenne pour une classe CLC donnée (tableau 8) lorsque les terres non artificielles deviennent artificielles, à moins qu'elles ne soient déjà supérieures à cette valeur. Pour le calcul en arrière dans le temps pour les pas de temps avant 2011, partout où des terres actuellement artificielles sont transformées en terres agricoles, le degré d'imperméabilisation du sol est réduit à 1 %. De même, il est ramené à 0 % en cas de transformation de terres agricoles ou artificielles en terres naturelles.
La désagrégation des données économiques suit des méthodes de cartographie dasymétrique, similaires à celles appliquées dans les études européennes52 ou mondiales53, y compris HANZE v1.0. Plusieurs révisions de ce dernier ont été introduites (tableau 9). Le PIB régional est divisé en partie proportionnellement à la population et en partie en fonction de l'utilisation des terres (avec imperméabilisation des sols le cas échéant). De cette manière, la main-d'œuvre (une partie de la population totale) et le capital (lié à l'utilisation des terres) du PIB sont représentés. La part du travail dans le PIB des pays avancés est d'environ 60 % et est restée relativement stable au fil du temps54. Ainsi, 60 % du PIB sont désagrégés en fonction de la population et les 40 % restants en fonction de l'utilisation des terres. Les immobilisations en termes absolus par région sont calculées en multipliant le PIB régional, ou un secteur de celui-ci, par le ratio respectif richesse/PIB pour chaque secteur, tel que défini par les variables « Immobilisations » (tableau 6). Les logements et les biens de consommation durables sont répartis en fonction de la population totale, car ils sont les plus étroitement liés à la répartition de la population. Les autres actifs, liés aux activités économiques, sont répartis selon les classes d'occupation des sols appropriées, proportionnellement au degré d'imperméabilisation des sols. Enfin, l'infrastructure est distribuée aux terrains urbains et industriels (classes CLC 111-121) proportionnellement à la surface couverte par les routes et les rues, et aux routes/voies ferrées, ports et aéroports (classes CLC 122-124) proportionnellement au degré de sol scellage.
Il existe également des hypothèses supplémentaires sur la désagrégation du PIB et de la richesse pour deux secteurs. Le secteur agricole comprend l'agriculture, la pêche et la foresterie, tandis que le secteur industriel comprend l'exploitation minière, la fabrication et les services publics. Une ventilation détaillée de ces sous-secteurs n'est pas disponible au niveau régional pour le PIB, ou pas du tout pour les actifs fixes, sauf pour un petit nombre de pays. Ainsi, le PIB régional et la richesse provenant de la foresterie et de l'exploitation minière ont été estimés en calculant des "indices d'efficacité" au niveau national. L'indice forestier a été compilé en calculant le PIB de l'agriculture (sans la foresterie) au niveau national par ha de terres agricoles du CLC et le PIB de la foresterie par ha de terres forestières. Ces valeurs ont été calculées pour l'année 2000 pour tous les pays et présentées comme l'efficacité de l'économie forestière par rapport aux autres agricultures en %. Ce ratio a été utilisé pour calculer la part relative de la foresterie dans le PIB régional pour une année donnée sur la base de la couverture/utilisation des sols modélisée pour cette année :
où G est le PIB, A est la superficie couverte par la couverture/l'utilisation des terres dans un secteur particulier, Ec est l'indice d'efficacité pour le pays c. Le secteur forestier est désigné par f, le secteur agricole (hors sylviculture) par a, la région NUTS3 par r et le pas de temps par t. Le PIB agricole sans foresterie est donc :
Le ratio richesse/PIB pour l'agriculture est utilisé à la fois pour la foresterie et les autres activités agricoles. Les mines et les carrières sont séparées des activités industrielles restantes (fabrication et services publics) à l'aide d'un indice d'efficacité minière, calculé comme l'indice forestier. De la même manière, il utilise la proportion de zones minières (CLC 131) par rapport aux zones industrielles (CLC 121) dans chaque région NUTS3 et le pas de temps pour désagréger les deux secteurs. Les équations 21 et 22 sont applicables en substituant les différents secteurs et types d'utilisation des terres. Le ratio richesse/PIB pour l'industrie est utilisé à la fois pour l'industrie minière et les autres industries.
L'ensemble de données disponible sur Zenodo55 se compose de trois éléments (tableau 10). Le premier est un ensemble de rasters GeoTIFF couvrant l'ensemble du domaine de 42 pays. Chaque raster a une résolution de 100 m et la référence spatiale européenne standard ETRS89/LAEA (EPSG:3035). Il existe un total de 195 jeux de données raster, une de chacune des cinq variables (couverture/utilisation du sol, population, PIB, immobilisations et imperméabilisation des sols) et 39 pas de temps (décennal 1870–1950, quinquennal 1950–2000 et annuel 2000– 2020). Les variables économiques sont évaluées en euros (EUR) en utilisant le niveau de prix constant et les taux de change des autres devises en 2020. Pour une visualisation plus rapide des grilles d'occupation/d'utilisation du sol, des fichiers de légende pour ArcGIS et QGIS sont également inclus dans le référentiel.
La deuxième partie sont des estimations de l'incertitude de l'exposition passée aux inondations. Il a été créé en utilisant la capacité du modèle à calculer des sorties probabilistes basées sur l'incertitude de la reconstruction de la distribution passée de la population et des transitions d'utilisation des terres (étapes de modélisation 2 et 10). Cependant, les distributions d'incertitude des cellules de grilles individuelles ne sont pas indépendantes, mais fortement corrélées, il n'a donc pas été possible de présenter les limites d'incertitude dans le même format que les ensembles de données raster de « meilleure estimation ». Par conséquent, ils doivent être calculés en échantillonnant le modèle et en agrégeant chaque itération pour des zones de danger définies. Les estimations d'incertitude dans le référentiel ont été créées à l'aide de cartes des risques d'inondation pour les événements de période de retour de 100 ans, tirées de Paprotny et al.56 pour les risques côtiers et d'Alfieri et al.57 pour les risques fluviaux. Les 5e, 20e, 50e, 80e et 95e centiles de la population, du PIB et de la valeur des immobilisations pour les 39 pas de temps sont contenus dans des fichiers séparés pour chaque région NUTS 3, variable et type de risque.
Les données d'entrée du modèle HANZE v2.0 qui ont été utilisées pour générer cet ensemble de données sont répertoriées dans les tableaux supplémentaires S3 à S6. Les bases de données d'entrée sur l'utilisation historique des terres, la population, le PIB, les actifs fixes ainsi que d'autres variables démographiques et économiques présentent un intérêt particulier pour les chercheurs. Les statistiques sont principalement au niveau NUTS 3 (certaines variables au niveau national), compilées dans cette étude et dans une étude précédente (HANZE v1.0)32 en harmonisant près de 400 sources de données distinctes, elles sont donc également incluses en tant que troisième partie des données de sortie (Tableaux 11, 12).
La validation des données d'exposition à haute résolution est un défi majeur en raison de la disponibilité limitée d'ensembles de données d'observation comparables29. Ici, nous utilisons les données disponibles sur la population et l'utilisation des terres pour la validation et comparons davantage les résultats avec d'autres ensembles de données modélisés publiés. La validation de la désagrégation des données économiques n'est actuellement pas possible en raison de l'absence totale de données d'observation.
Il y a un manque général de données de référence de population à très haute résolution, en partie pour des raisons de confidentialité29. La grille GEOSTAT 1 km - notre entrée pour la désagrégation de la population - est déjà artificiellement déformée dans certaines cellules de la grille en raison du "traitement de confidentialité". Il fournit la résolution la plus élevée disponible pour un produit d'observation. Par conséquent, nous avons préparé une désagrégation alternative de la population de 1 km à 100 m en utilisant la surface au sol des bâtiments résidentiels comme prédicteur, plutôt que des données agrégées sur l'utilisation des terres et l'imperméabilisation des sols. Nous utilisons des données vectorielles de construction à haute résolution (https://www.geoportal.gov.pl/dane/baza-danych-obiektow-topograficznych-bdot) pour les municipalités menacées par l'élévation du niveau de la mer en Pologne précédemment appliquées par Paprotny et Terefenko58, comme les données qu'ils ont utilisées étaient exactes en 2012-2013, ce qui est proche de notre année de référence. Dans chaque cellule de grille de 1 km entièrement dans la zone de validation, nous avons calculé la surface au sol résidentielle en m² en utilisant la surface des bâtiments résidentiels, multipliée par le nombre d'étages, par cellule de grille de 100 m de notre grille de population à haute résolution. La population a été répartie proportionnellement à la surface au sol dans chaque cellule de 100 m. Pour le calcul, nous avons exclu les résidences collectives dans lesquelles les personnes n'enregistrent normalement pas d'adresse, les résidences secondaires ou les bâtiments abandonnés.
Nous comparons nos résultats modélisés avec la désagrégation alternative et une désagrégation de 100 m précédemment publiée de GEOSTAT appelée GHS59. Ces grilles ont ensuite été recoupées avec des cartes paneuropéennes des risques d'inondation pour les côtes56 et les rivières57. Nous avons constaté que les grilles HANZE et GHS lissent trop la répartition spatiale de la population, comme l'indiquent les ratios de faux positifs (tableau 13). Près de 40 % des cellules peuplées de HANZE n'ont aucune population indiquée dans l'ensemble de données de référence, bien que dans la moitié de ces cas, la population indiquée ne soit qu'une ou deux personnes. Le taux de faux positifs est plus élevé dans GHS que dans HANZE et supérieur à 40 %. À l'inverse, HANZE indique rarement l'absence de population à tort : seulement 3,5 % des cellules non renseignées dans HANZE sont renseignées dans l'ensemble de données de référence. C'est moins que les 4,7 % du GHS (faux rapport négatif du tableau 13). L'exposition dans les zones inondables fluviales et côtières pour les municipalités de la zone côtière polonaise (avec au moins 30 personnes exposées) était généralement bien représentée, avec une erreur médiane supérieure à 10 % dans HANZE. HANZE a obtenu de meilleurs résultats que GHS pour les zones à risque d'inondation fluviale, bien que l'exposition aux inondations côtières ait été mieux modélisée par GHS. Une vérification finale des ensembles de données a été effectuée en regroupant la population par maille de 100 m dans des intervalles d'augmentation par facteur 2 : [0,1], [1,2], [2,4], [4,8] , [8,16] etc. Nous avons constaté que la population par cellule dans HANZE était à +/- 1 intervalle de l'ensemble de données de validation dans 53% des cas, ce qui est mieux que 44% calculé pour l'ensemble de données GHS.
Le niveau le plus détaillé auquel la validation des changements démographiques modélisés est possible est le niveau de la municipalité. Nous avons obtenu deux ensembles de données de référence à cette fin. Premièrement, nous utilisons l'ensemble de données paneuropéen (1960-2010) avec des données de population par unité administrative locale utilisées pour quantifier notre modèle (voir Texte supplémentaire S1). Deuxièmement, nous avons assemblé un ensemble de données avec une période plus longue pour l'Autriche sur la base des données de recensement historiques recalculées pour les municipalités actuelles par Statistik Austria (https://www.statistik.at/datenbanken/statcube-statistische-datenbank) et combinées avec un vecteur ensemble de données de leurs limites (https://www.data.gv.at/katalog/dataset/verwaltungsgrenzen-vgd-stichtagsdaten-grundstucksgenau). L'ensemble de données de population de référence qui en résulte couvre toute la durée de cette étude (1870-2020) et 2117 unités : toutes les municipalités plus les districts de Vienne (Fig. S9 supplémentaire). Pour une comparaison plus approfondie, nous utilisons le jeu de données HYDE 3.225, recalculé à partir d'une résolution de 5′ pour les municipalités. HANZE et HYDE utilisent des données démographiques infranationales désagrégées à la fois dans l'espace et dans le temps, ce qui en fait les produits d'exposition les plus comparables.
La précision de l'évolution de la population au niveau des unités administratives locales (UAL) a été analysée à l'aide de la différence absolue moyenne entre la population modélisée et observée par UAL par rapport à la population observée au cours d'une année donnée. Comme l'indique la figure 7a, l'erreur augmente à mesure que le temps s'écoule depuis l'année de référence, atteignant une moyenne d'environ 20 % en 1960 (dans les deux zones de validation) et 40 % en 1870 (en Autriche). Cependant, la majorité des UAL sont de petites communautés rurales, avec plus de la moitié des UAL en Europe comptant moins de 1000 habitants en 1960, et un tiers en Autriche en 1870 (tableau supplémentaire S7). Les LAU européennes et autrichiennes ont modifié leur population de plus d'un facteur deux depuis 1960 et 1870, respectivement. Par conséquent, les erreurs absolues sont généralement faibles (moins de 200 personnes dans la moitié des UAL en Europe). Dans les grandes LAU, les erreurs relatives sont plus faibles, bien qu'en Autriche en 1870, les erreurs en particulier les districts de Vienne dominaient le plus grand groupe de LAU. L'erreur varie selon les pays (Fig. 7b) et est en partie liée à la taille des UAL (relativement faible en France ou au Royaume-Uni, importante en Pologne et en Grèce) ou au nombre d'UAL par région NUTS3 (en moyenne 381 en France, mais seulement 28 en Allemagne). Les pays avec de grandes UAL ou de petites régions NUTS3 présentent des erreurs moins importantes. En général, HANZE présente des erreurs plus faibles que HYDE, à quelques exceptions près, par exemple en Autriche après 1980, bien que les changements de population au cours de cette période aient été plutôt faibles par rapport aux décennies précédentes. Parmi tous les grands pays, la France et la Belgique présentent des erreurs plus élevées dans HANZE que dans HYDE dans l'estimation de la population en 1960, tandis que parmi les petits pays, cela ne se produit que pour le Luxembourg et la Slovénie.
Précision de l'estimation du changement de population par rapport à l'ensemble de données HYDE. La mesure d'erreur (en %) indique la différence absolue moyenne de la population modélisée et observée par LAU par rapport à la population observée au cours d'une année donnée (a) et entre les pays en 1960 (b).
La validation de la couverture terrestre/du changement d'utilisation est basée sur des échantillons de CLC et de CLC-Changes de 2000 à 2018. Nous utilisons ces échantillons pour quantifier le modèle de transition d'utilisation des terres à l'étape 10, mais pour la validation, nous avons tiré un modèle supplémentaire sans chevauchement. échantillon aléatoire de transitions (CLC-Changes) et de non-transitions (la même classe dans différents inventaires CLC). Un total de 97 790 échantillons chacun pour les transitions et les non-transitions ont été utilisés (voir le texte supplémentaire S3 pour plus de détails sur la procédure d'échantillonnage). La quantité nette de terres qui ont fait la transition est connue à partir des statistiques historiques, par conséquent, un nombre défini de cellules avec la probabilité la plus élevée de transition selon le modèle de réseau bayésien est sélectionné. Une métrique de validation peut donc être le pourcentage de cellules les mieux classées, jusqu'à la quantité dont on sait qu'elle a fait la transition entre des classes d'utilisation des terres définies, qui a été correctement identifiée par le modèle. Comme le nombre de cellules dans différentes classes d'utilisation des terres varie, le taux de réussite doit être mis en contraste avec un résultat aléatoire, c'est-à-dire le taux de réussite de la sélection aléatoire de cellules d'utilisation des terres comme transition. Les résultats sont présentés dans le tableau 14. Dans tous les cas considérés de transitions d'utilisation des terres, le taux de réussite du modèle à identifier correctement les cellules en transition dans l'ensemble de données de validation est beaucoup plus élevé que si les cellules étaient choisies au hasard.
Les résultats globaux de la modélisation de la couverture/utilisation des terres dans HANZE sont comparés à HILDA22,23,24. Il a une résolution de 1 km, contenant les changements de couverture/utilisation des terres pour six classes (agrégées à partir de la classification CLC) de 1900 à 2010 sur un domaine de 29 pays et territoires. HILDA est principalement un modèle qui réaffecte l'utilisation des terres sur la base de statistiques historiques agrégées et de cartes de probabilité, de la même manière que HANZE et HYDE. Cependant, il intègre également, dans la mesure du possible, des cartes historiques numérisées. D'autre part, HILDA se concentre principalement sur les terres agricoles et leur interaction avec la végétation naturelle, ce qui présente moins d'intérêt dans cette étude en raison de l'exposition relativement faible liée à ces catégories de couverture terrestre.
HILDA indique quelques similitudes importantes avec HANZE. La superficie des surfaces artificielles a une tendance très similaire dans les deux ensembles de données entre 1900 et 1990 (Fig. 8a), même si HANZE n'a été calibré que pour les années 2000 à 2018. Cela indique que les processus sous-jacents ne changent pas fortement au fil du temps et que le modèle est également applicable aux périodes précédant la période d'étalonnage. HILDA indique presque aucune croissance de la surface artificielle après 1990, contrairement à HANZE. Cependant, CLC et d'autres ensembles de données indiquent une forte croissance. Par exemple, les données de l'enquête LUCAS sur l'utilisation des terres (https://ec.europa.eu/eurostat/statistics-explained/index.php?title=LUCAS_-_Land_use_and_land_cover_survey) pour 23 pays montrent qu'une expansion artificielle de la surface de 11 % dans seulement neuf ans (2009-2018). Le changement des terres cultivées est similaire dans les deux ensembles de données (Fig. 8b), car des sources de données largement similaires ont été utilisées après 1950. Avant cette date, HANZE utilisait diverses données statistiques nationales, tandis que HILDA interpolait des statistiques historiques ou des cartes de 1950 à 1900. Les ensembles de données diffèrent considérablement pour pâturages et forêts. HILDA indique une forte diminution de la superficie couverte par les pâturages, qui sont remplacés principalement par des forêts. En revanche, les statistiques historiques recueillies pour HANZE n'indiquent pas une tendance similaire trouvée dans HILDA. Cependant, cela pourrait aussi être dû en partie au fait qu'il n'y a pas de modèle détaillé pour les transitions entre la couverture forestière et les autres terres naturelles dans HANZE. Par conséquent, le reboisement de divers types de terres naturelles qui relèvent de la catégorie "pâturages" dans HILDA n'est pas pris en compte par notre modèle. En raison de la très faible exposition et de la variation négligeable de cette exposition due à de telles transitions, nous ne les traitons pas avec un modèle plus détaillé. Enfin, HILDA indique étonnamment une diminution de la superficie couverte par l'eau, ce qui est à l'opposé de HANZE, où la construction de réservoirs conduit à l'expansion globale des masses d'eau en Europe.
Surfaces artificielles en milliers de km2 (a) et autres principales classes d'utilisation des terres par rapport à l'année 2010 (b) dans HANZE (cette étude) et HILDA, pour les 29 pays et six classes agrégées de couverture/utilisation des sols CLC disponibles dans HILDA.
Aucun ensemble de données ne couvre l'imperméabilisation des sols, quelle qu'en soit la source, sur une période plus longue. Une comparaison pourrait être faite à l'aide d'un ensemble de données récemment publié sur les empreintes de bâtiments en Espagne (HISDAC60), couvrant les années 1900-2020. L'ensemble de données est basé sur des données cadastrales qui enregistrent l'année de construction des bâtiments. Même si les bâtiments ne constituent qu'une partie des surfaces étanches, nous avons comparé la couverture moyenne des bâtiments et des surfaces étanches pour 8109 municipalités en Espagne européenne (c'est-à-dire sans Ceuta, Melilla et les îles Canaries) entre 1900 et 2020 à partir de HANZE et HISDAC. À titre de comparaison supplémentaire, nous avons calculé la surface d'accumulation moyenne entre 1975 et 2020 à partir de la couche mondiale des établissements humains (GHSL61), qui tire ces informations de l'imagerie satellitaire. Dans ce domaine, la couverture moyenne en 2010 (la plus proche de l'année de référence) est de 1,17 % pour HANZE (étanchéité du sol), 0,64 % pour GHSL (surfaces construites) et 0,50 % pour HISDAC (empreinte du bâtiment). Malgré la différence de définition, HANZE est plus corrélé avec les deux ensembles de données que HISDAC avec GHSL (Fig. 9a), qui devrait être plus étroitement lié. En remontant plus loin dans le passé, les corrélations diminuent, mais pour 1975-2020, la corrélation entre HISDAC et HANZE reste plus élevée qu'entre HISDAC et GHSL. Pour les changements à court terme (Fig. 9b), les trois ensembles de données montrent une très faible corrélation, avec des augmentations avec la période de temps sur laquelle les changements sont analysés. En 1975, les changements dans HISDAC sont plus corrélés avec HANZE qu'avec GHSL. Les tendances des empreintes de construction dans HISDAC montrent une corrélation stable avec les tendances de l'imperméabilisation des sols HANZE pour la période 1900–1960. Considérant que HANZE ne modélise pas explicitement (partiellement ou totalement) les changements dans les surfaces artificielles avec une exposition relativement faible (par exemple, les routes secondaires et les voies ferrées, les décharges, les espaces de loisirs urbains, etc.), les résultats indiquent que le modèle peut capturer à long terme , variation intra-pays de l'imperméabilisation des sols.
Comparaison de la corrélation entre trois ensembles de données d'occupation des sols artificiels (% de la superficie totale) agrégées aux municipalités d'Espagne, (a) à un pas de temps donné ou (b) des différences entre un pas de temps donné et 2020.
L'objectif principal de la création de l'ensemble de données d'exposition HANZE était de calculer l'exposition aux catastrophes naturelles passées, puis d'ajuster les pertes signalées pour divers événements à une année de référence commune (communément appelée « normalisation » des données de perte17). Paprotny et al.16 ont utilisé HANZE pour normaliser les pertes pour 1564 événements d'inondation entre 1870 et 2016. Dans cette nouvelle itération de HANZE, le code est accessible au public pour des analyses plus approfondies. Tous les ensembles de données d'entrée (tableaux supplémentaires S3 à S6) sont disponibles dans un référentiel62, l'utilisateur n'a donc qu'à les télécharger et à modifier le chemin défini vers le dossier contenant les données. Ensuite, le code63 peut être exécuté en utilisant les options de base intégrées dans le code, qui sont :
générant cinq rasters d'exposition (couverture/utilisation du sol, population, PIB, immobilisations, imperméabilisation des sols) au format GeoTIFF et à une résolution de 100 m. Une seule année ou plusieurs années parmi celles incluses dans la base de données (10 ans 1870–1950, 5 ans 1950–2000, annuelle 2000–2020) pourraient être exécutées. En outre, toutes les régions NUTS3 pourraient être incluses, ou seulement une seule région NUTS3, ou plusieurs régions. Les ensembles de données d'exposition en sortie sont également disponibles dans le référentiel, car même si le modèle est plutôt efficace compte tenu de sa résolution (environ une heure pour un pas de temps pour toutes les régions NUTS3), le calcul des 39 pas de temps de l'étude nécessiterait des ressources ou du temps importants.
calcul de l'exposition (population, PIB, immobilisations) par zone de danger. Un fichier raster avec la même étendue spatiale que les autres fichiers raster en entrée est nécessaire pour cela. Des fichiers d'exemple sont fournis dans le référentiel, qui permettent de reproduire l'analyse présentée dans cette section. En utilisant cette option, un fichier texte avec des données (pour les années définies par l'utilisateur) est enregistré séparément pour chaque région NUTS3.
calculer l'exposition avec des limites d'incertitude par zone de danger. Il s'agit d'une extension de l'option précédente, qui enregistre un fichier texte par région et variable (population, PIB, immobilisations) avec les 5e, 20e, 50e, 80e et 95e centiles.
Le code permet également, pour la reproductibilité, de calculer certaines des données d'entrée. De nombreux ensembles de données d'entrée nécessitaient des préparations ponctuelles approfondies, par conséquent, seules certaines étapes de prétraitement pouvaient être incluses. Il est important de noter que la routine de désagrégation de la population décrite et validée dans cette étude peut être réexécutée. Les seuils de population pour la cartographie dasymétrique peuvent également être recalculés, ainsi que les cartes de probabilité utilisées dans la modélisation de l'utilisation des terres (étape 10). Le code permettant de reproduire la validation du changement de population et du changement d'affectation des terres est également inclus. Enfin, le code permet de visualiser des informations d'exposition sélectionnées par événement d'inondation (à partir de la base de données HANZE v1.0 des inondations passées) sous forme de graphiques et de cartes. Pour toute région NUTS3 définie par l'utilisateur, le code peut générer une carte d'exposition similaire à la Fig. 10.
Un exemple de croissance modélisée de l'exposition dans les environs de Munich (région NUTS DE212), dans le sud de l'Allemagne, entre 1870 et 2020, en contraste avec une carte des crues fluviales sur 100 ans (ombrage gris). Zone inondable selon Alfieri et al.57.
Cinq exemples illustratifs d'inondations passées sont présentés dans le tableau 15 pour souligner à quel point les changements d'exposition peuvent être variés et parfois incertains. Ils dépendent non seulement de la date à laquelle l'événement s'est produit dans le passé (l'incertitude augmente avec le temps), mais aussi du fait qu'il s'est produit dans les zones d'expansion des villes (où l'incertitude est la plus élevée) par rapport à une zone essentiellement rurale, ou dans quelle partie d'un La région NUTS 3 est à risque (la population ou les actifs par région étant définis par des statistiques historiques, il n'y aurait aucune incertitude si toute la région était une zone à risque). Les cartes des zones touchées, générées à l'aide du code du modèle, sont présentées dans la Fig. S10 supplémentaire. À l'avenir, nous prévoyons d'utiliser le modèle pour attribuer les impacts des inondations aux facteurs environnementaux et économiques en reliant plus directement HANZE aux modèles climatiques et hydrologiques64,65.
Les utilisateurs doivent être conscients des limites (par exemple, toutes les classes d'utilisation des terres ne sont pas couvertes par le modèle, seules les plus importantes) et des incertitudes (liées à la fois à l'approche de modélisation et à la qualité des données d'entrée). Ils ont été largement discutés en relation avec HANZE v1.0, nous renvoyons donc le lecteur à Paprotny et al.32. À l'avenir, nous prévoyons d'utiliser le modèle pour attribuer les impacts historiques des inondations aux facteurs environnementaux et économiques.
Le code source de HANZE v2.0 (implémenté en Python 3.9) présenté dans l'article est archivé sur https://doi.org/10.5281/zenodo.755695363. Toutes les données d'entrée nécessaires sont archivées sur https://doi.org/10.5281/zenodo.678302362. Les données sur l'impact des inondations présentées dans les notes d'utilisation, avec une description des sources des données, sont disponibles dans le référentiel HANZE v1.066, https://doi.org/10.4121/collection:HANZE.
Grant, L. et al. L'attribution des systèmes lacustres mondiaux change au forçage anthropique. Nat. Géosci. 14, 849–854 (2021).
Article ADS CAS Google Scholar
Gudmundsson, L. et al. Tendances observées à l'échelle mondiale du débit moyen et extrême des cours d'eau attribuées au changement climatique. Sciences 371, 1159-1162 (2021).
Article ADS CAS PubMed Google Scholar
GIEC. Changement climatique 2022 : impacts, adaptation et vulnérabilité. Contribution du groupe de travail II au sixième rapport d'évaluation du Groupe d'experts intergouvernemental sur l'évolution du climat (Cambridge University Press, 2022).
Metin, AD et al. Comment les changements le long de la chaîne des risques affectent-ils le risque d'inondation ? Nat. Dangers Terre Syst. Sci. 18, 3089-3108 (2018).
Annonces d'article Google Scholar
Vousdoukas, MI et al. Comprendre l'incertitude épistémique dans l'évaluation des risques d'inondation côtière à grande échelle pour les climats actuels et futurs. Nat. Dangers Terre Syst. Sci. 18, 2127-2142 (2018).
Annonces d'article Google Scholar
Carisi, F., Schröter, K., Domeneghetti, A., Kreibich, H. & Castellarin, A. Développement et évaluation de modèles uni- et multivariables de pertes dues aux inondations pour l'Émilie-Romagne (Italie). Nat. Dangers Terre Syst. Sci. 18, 2057-2079 (2018).
Annonces d'article Google Scholar
Huizinga, J., de Moel, H. & Szewczyk, W. Fonctions globales de dommages à la profondeur des inondations. Méthodologie et base de données avec lignes directrices. Rapport EUR 28552 EN (Office des publications de l'Union européenne, 2017).
Jongman, B. et al. Évaluation comparative des modèles de dommages causés par les inondations : vers une approche européenne. Nat. Dangers Terre Syst. Sci. 12, 3733–3752 (2012).
Annonces d'article Google Scholar
Paprotny, D. et al. Une approche probabiliste pour estimer les pertes résidentielles de différents types d'inondations. Nat. Dangers 105, 2569–2601 (2021).
Article Google Scholar
Barredo, JI Pas de tendance à la hausse des pertes normalisées causées par les tempêtes en Europe : 1970–2008. Nat. Dangers Terre Syst. Sci. 10, 97-104 (2010).
Annonces d'article Google Scholar
Dawkins, LC, Stephenson, DB, Lockwood, JF & Maisey, PE Le déclin du XXIe siècle des tempêtes de vent européennes dommageables. Nat. Dangers Terre Syst. Sci. 16, 1999–2007 (2016).
Annonces d'article Google Scholar
Welker, C., Röösli, T. & Bresch, DN Comparaison du point de vue d'un assureur sur les dommages aux bâtiments avec les dommages modélisés d'événements paneuropéens de tempêtes hivernales : une étude de cas à Zurich, en Suisse. Nat. Dangers Terre Syst. Sci. 21, 279–299 (2021).
Annonces d'article Google Scholar
Ganteaume, A. et al. Un examen des principaux facteurs déterminants de l'allumage des incendies de forêt en Europe. Environ. Gérer. 51, 651–662 (2013).
Article ADS PubMed Google Scholar
Barredo, JI Pertes dues aux inondations normalisées en Europe : 1970–2006. Nat. Dangers Terre Syst. Sci. 9, 97-104 (2009).
Annonces d'article Google Scholar
McAneney, J. et al. Pertes d'assurance normalisées dues aux catastrophes naturelles australiennes : 1966-2017. Environ. Dangers 18, 414–433 (2019).
Article Google Scholar
Paprotny, D., Sebastian, A., Morales Nápoles, O. & Jonkman, SN Tendances des pertes dues aux inondations en Europe au cours des 150 dernières années. Nat. Commun. 9, 1985 (2018).
Article ADS PubMed PubMed Central Google Scholar
Pielke, R. « Normalisation » économique des pertes dues aux catastrophes 1998-2020 : revue et évaluation de la littérature. Environ. Dangers 20, 93–111 (2021).
Article Google Scholar
Simmons, KM, Sutter, D. & Pielke, R. Dégâts de tornade normalisés aux États-Unis : 1950–2011. Environ. Dangers 12, 132–147 (2013).
Article Google Scholar
Scussolini, P. et al. FLOPROS : une base de données mondiale évolutive sur les normes de protection contre les inondations. Nat. Dangers Terre Syst. Sci. 16, 1049-1061 (2016).
Annonces d'article Google Scholar
Formetta, G. & Feyen, L. Preuve empirique de la diminution de la vulnérabilité mondiale aux aléas liés au climat. Environ global. Chang. 57, 101920 (2019).
Article Google Scholar
Sebastian, A., Gori, A., Blessing, RB, van der Wiel, K. & Bass, B. Démêler les impacts des changements humains et environnementaux sur la réponse du bassin versant lors de l'ouragan Harvey. Environ. Rés. Lett. 14, 124023 (2019).
Annonces d'article Google Scholar
Fuchs, R., Herold, M., Verburg, PH & Clevers, JGPW Une approche de modèle à haute résolution et harmonisée pour reconstruire et analyser les changements historiques des terres en Europe. Biogéosciences 10, 1543–1559 (2013).
Annonces d'article Google Scholar
Fuchs, R., Herold, M., Verburg, PH, Clevers, JGPW & Eberle, J. Gross changes in reconstructions of history land cover/use for Europe between 1900–2010. Glob. Changer Biol. 21, 299-313 (2014).
Annonces d'article Google Scholar
Fuchs, R., Verburg, PH, Clevers, JGPW & Herold, M. Le potentiel des anciennes cartes et encyclopédies pour reconstruire l'évolution historique de la couverture/utilisation des terres continentales. Appl. Géogr. 59, 43-55 (2015).
Article Google Scholar
Klein Goldewijk, K., Beusen, A., Doelman, J. & Stehfest, E. Estimations de l'utilisation anthropique des terres pour l'Holocène – HYDE 3.2. Terre Syst. Sci. Données 9, 927–953 (2017).
Annonces d'article Google Scholar
Frieler, K. et al. Évaluation des impacts d'un réchauffement climatique de 1,5 °C - protocole de simulation du projet d'intercomparaison des modèles d'impact inter-sectoriels (ISIMIP2b). Géosci. Modèle Dév. 10, 4321–4345 (2017).
Annonces d'article Google Scholar
Geiger, T. Série chronologique continue du produit intérieur brut (PIB) national pour 195 pays : observations passées (1850-2005) harmonisées avec les projections futures selon les voies socio-économiques partagées (2006-2100). Terre Syst. Sci. Données 10, 847–856 (2018).
Annonces d'article Google Scholar
Sauer, I. et al. Les signaux climatiques dans les dommages causés par les inondations fluviales apparaissent dans le cadre d'une désagrégation régionale solide. Nat. Commun. 12, 2128 (2021).
Article ADS CAS PubMed PubMed Central Google Scholar
Leyk, S. et al. L'allocation spatiale de la population : un examen des produits de données démographiques maillées à grande échelle et de leur aptitude à l'emploi. Terre Syst. Sci. Données 11, 1385–1409 (2019).
Annonces d'article Google Scholar
Kummu, M., Taka, M. & Guillaume, JHA Ensembles de données mondiales maillées pour le produit intérieur brut et l'indice de développement humain sur la période 1990-2015. Sci. Données 5, 180004 (2018).
Article PubMed PubMed Central Google Scholar
Eberenz, S., Stocker, D., Röösli, T. & Bresch, DN Données sur l'exposition des actifs pour l'évaluation des risques physiques mondiaux. Terre Syst. Sci. Données 12, 817–833 (2020).
Annonces d'article Google Scholar
Paprotny, D., Morales-Nápoles, O. & Jonkman, SN HANZE : une base de données paneuropéenne sur l'exposition aux risques naturels et les inondations historiques dommageables depuis 1870. Earth Syst. Sci. Données 10, 565–581 (2018).
Annonces d'article Google Scholar
Paprotny, D., Morales-Nápoles, O. & Jonkman, SN Modélisation paneuropéenne efficace des risques d'inondation fluviale grâce à une combinaison de modèles statistiques et physiques. Nat. Dangers Terre Syst. Sci. 17, 1267-1283 (2017).
Annonces d'article Google Scholar
Vousdoukas, MI et al. Évolution de la cartographie à grande échelle des risques d'inondation côtière. Nat. Dangers Terre Syst. Sci. 16, 1841–1853 (2016).
Annonces d'article Google Scholar
Barendrecht, MH et al. Intérêt des données empiriques pour estimer les paramètres d'un modèle sociohydrologique de risque d'inondation. Ressource en eau. Rés. 55, 1312-1336 (2019).
Article ADS CAS PubMed PubMed Central Google Scholar
Zanardo, S., Nicotina, L., Hilberts, AGJ & Jewson, SP Modulation des pertes économiques dues aux inondations européennes par l'oscillation nord-atlantique. Géophys. Rés. Lett. 46, 2563-2572 (2019).
Annonces d'article Google Scholar
Batista et Silva, F., Gallego, J. & Lavalle, C. Une carte quadrillée de population à haute résolution pour l'Europe. J. Cartes 9, 16–28 (2013).
Article Google Scholar
Eicher, CL & Brewer, CA Cartographie dasymétrique et interpolation surfacique : mise en œuvre et évaluation. Cartogr. Géogr. Inf. Sc. 28, 125-138 (2001).
Article Google Scholar
Gallego, FJ Une grille de densité de population de l'Union européenne. Popul. Environ. 31, 460–473 (2010).
Article Google Scholar
Contributeurs d'OpenStreetMap. OpenStreetMap https://www.openstreetmap.org/ (2022).
Paprotny, D., Kreibich, H., Morales-Nápoles, O., Terefenko, P. & Schröter, K. Estimation de l'exposition des actifs résidentiels aux risques naturels en Europe à l'aide de données ouvertes. Nat. Dangers Terre Syst. Sci. 20, 323–343 (2020).
Annonces d'article Google Scholar
Paprotny, D. Exposition résidentielle aux risques naturels en Europe, 2000–2020. Zenodo https://doi.org/10.5281/zenodo.6573503 (2022).
Gløersen, E. & Lüer, C. Collecte de données démographiques pour les unités administratives locales européennes à partir de 1960 - rapport final (Spatial Foresight GmbH, 2013).
Clark, C. Densités de population urbaine. Statistique JR. Soc. A 114, 490–496 (1951).
Article Google Scholar
Clark, C. Croissance démographique et utilisation des terres (Macmillan, 1967).
Hourihan, K. Modèles de densité de population urbaine et changement en Irlande, 1901–1979. Écon. Soc. Rév. 13, 125–147 (1982).
Google Scholar
Joe, H. Modélisation de la dépendance avec copules (Chapman & Hall/CRC, 2014).
Genest, C., Rémillard, B. & Beaudoin, D. Tests d'ajustement pour les copules : une revue et une étude de puissance. Assur. Mathématiques. Écon. 44, 199-213 (2009).
Article MathSciNet MATH Google Scholar
Eurostat. Manuel méthodologique sur les typologies territoriales, édition 2018 (Office des publications de l'Union européenne, 2019).
Klein Goldewijk, K., Beusen, A., de Vos, M. & van Drecht, G. La base de données spatialement explicite HYDE 3.1 sur les changements d'utilisation des terres induits par l'homme au cours des 12 000 dernières années. Écol mondial. Biogéogr. 20, 73–86 (2011).
Article Google Scholar
DHI GRAS. Validation statistique EU-DEM (Agence européenne pour l'environnement, 2014).
Murakami, D. & Yamagata, Y. Estimation de scénarios maillées de population et de PIB avec réduction d'échelle statistique spatialement explicite. Durabilité 11, 2106 (2019).
Article Google Scholar
Batista e Silva, F. et al. HARCI-EU, un ensemble de données maillées harmonisées des infrastructures critiques en Europe pour les évaluations des risques à grande échelle. Sci. Données 6, 126 (2019).
Article PubMed PubMed Central Google Scholar
OIT & OCDE. La part du travail dans les économies du G20. Rapport préparé pour le groupe de travail du G20 sur l'emploi (sommet du G20 à Antalya, 2015).
Paprotny, D. Cartes d'exposition paneuropéennes et estimations d'incertitude du modèle HANZE v2.0, 1870–2020. Zenodo https://doi.org/10.5281/zenodo.7885990 (2022).
Paprotny, D., Morales Nápoles, O., Vousdoukas, MI, Jonkman, SN & Nikulin, G. Précision de la cartographie paneuropéenne des inondations côtières. J. Gestion des risques d'inondation. 12, e12459 (2019).
Article Google Scholar
Alfieri, L. et al. Avancées dans la cartographie paneuropéenne des risques d'inondation. Hydrol. Processus. 28, 4067–4077 (2014).
Annonces d'article Google Scholar
Paprotny, D. & Terefenko, P. Nouvelles estimations des impacts potentiels de l'élévation du niveau de la mer et des inondations côtières en Pologne. Nat. Dangers 85, 1249-1277 (2017).
Article Google Scholar
Freire, S., Halkia, M. & Pesaresi, M. Grille de population GHS, dérivée des données de recensement EUROSTAT (2011) et ESM R2016. Catalogue de données du Centre commun de recherche http://data.europa.eu/89h/jrc-ghsl-ghs_pop_eurostat_europe_r2016a (2016).
Uhl, JH et al. HISDAC-ES : Compilation de données historiques sur les établissements humains pour l'Espagne (1900–2020), Earth Syst. Sci. Discutez des données. [preprint], https://doi.org/10.5194/essd-2023-53, en révision, (2023).
Schiavina, M. et al. GHSL Data Package 2022 (Office des publications de l'Union européenne, 2022).
Paprotny, D. HANZE v2.0 données d'entrée du modèle d'exposition. Zenodo https://doi.org/10.5281/zenodo.6583023 (2022).
Paprotny, modèle d'exposition D. HANZE v2.0. Zenodo https://doi.org/10.5281/zenodo.7556953 (2022).
Mengel, M., Treu, S., Lange, S. & Frieler, K. ATTRICI v1.1 – climat contrefactuel pour l'attribution de l'impact. Géosci. Modèle Dév. 14, 5269–5284 (2021).
Annonces d'article Google Scholar
Steinhausen, M. et al. Facteurs de changement des futurs risques d'inondation fluviale pour les bâtiments résidentiels en Europe. Environ global. Chang. 76, 102559 (2022).
Article Google Scholar
Paprotny, D. HANZE : Analyse historique des risques naturels en Europe. 4TU.ReseachData https://doi.org/10.4121/collection:HANZE (2017).
Télécharger les références
Cette recherche a été soutenue par la Fondation allemande pour la recherche (DFG) dans le cadre du projet "Décomposition des pertes dues aux inondations par les facteurs environnementaux et économiques" (FloodDrivers), subvention no. 449175973. Nous remercions Diego Rybski, Yunfei Li et Manon Glockmann pour les discussions techniques sur la méthodologie de l'ensemble de données.
Financement Open Access activé et organisé par Projekt DEAL.
Potsdam Institute for Climate Impact Research (PIK), membre de l'association Leibniz, PO Box 60 12 03, 14412, Potsdam, Allemagne
Dominik Paprotny & Matthias Mengel
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
DP a développé le concept, mis en œuvre les méthodes, écrit le code, produit les données et obtenu le financement. MM a supervisé les travaux. Tous les auteurs ont rédigé l'article.
Correspondance à Dominik Parotny.
Les auteurs ne déclarent aucun intérêt concurrent.
Note de l'éditeur Springer Nature reste neutre en ce qui concerne les revendications juridictionnelles dans les cartes publiées et les affiliations institutionnelles.
Libre accès Cet article est sous licence Creative Commons Attribution 4.0 International, qui permet l'utilisation, le partage, l'adaptation, la distribution et la reproduction sur n'importe quel support ou format, à condition que vous accordiez le crédit approprié à l'auteur ou aux auteurs originaux et à la source, fournissez un lien vers la licence Creative Commons et indiquez si des modifications ont été apportées. Les images ou tout autre matériel tiers dans cet article sont inclus dans la licence Creative Commons de l'article, sauf indication contraire dans une ligne de crédit au matériel. Si le matériel n'est pas inclus dans la licence Creative Commons de l'article et que votre utilisation prévue n'est pas autorisée par la réglementation légale ou dépasse l'utilisation autorisée, vous devrez obtenir l'autorisation directement du détenteur des droits d'auteur. Pour voir une copie de cette licence, visitez http://creativecommons.org/licenses/by/4.0/.
Réimpressions et autorisations
Paprotny, D., Mengel, M. Estimations de la population, de l'utilisation des terres et de l'exposition économique pour l'Europe à une résolution de 100 m de 1870 à 2020. Sci Data 10, 372 (2023). https://doi.org/10.1038/s41597-023-02282-0
Télécharger la citation
Reçu : 24 janvier 2023
Accepté : 31 mai 2023
Publié: 08 juin 2023
DOI : https://doi.org/10.1038/s41597-023-02282-0
Toute personne avec qui vous partagez le lien suivant pourra lire ce contenu :
Désolé, aucun lien partageable n'est actuellement disponible pour cet article.
Fourni par l'initiative de partage de contenu Springer Nature SharedIt