Estimations de la population, de l'utilisation des terres et de l'exposition économique pour l'Europe à une résolution de 100 m de 1870 à 2020

Données scientifiques volume 10, Numéro d'article : 372 (2023) Citer cet article

Détails des métriques

Comprendre l'influence du changement climatique sur les impacts météorologiques extrêmes passés est une tâche de recherche vitale. Cependant, les effets du changement climatique sont masqués dans les séries de données sur les impacts observés en raison de l'évolution rapide des circonstances sociales et économiques dans lesquelles les événements se sont produits. L'ensemble de données HANZE v2.0 (Historical Analysis of Natural Hasards in Europe) présenté dans cette étude quantifie l'évolution des principaux moteurs socio-économiques en Europe depuis 1870, à savoir l'utilisation des terres, la population, l'activité économique et les actifs. Il se compose d'algorithmes permettant de réaffecter l'utilisation des terres et la population de référence (2011) pour une année donnée sur la base d'une vaste collection de statistiques historiques aux niveaux infranational et national, puis de désagréger les données sur la production et les actifs corporels par secteur économique dans une résolution à haute résolution. grille. Les ensembles de données raster générés par le modèle permettent de reconstruire l'exposition dans l'empreinte de tout événement extrême à la fois au moment de l'occurrence et à tout moment entre 1870 et 2020. Cela permet de séparer les effets du changement climatique des effets du changement d'exposition.

La température moyenne mondiale a dépassé le réchauffement de 1 °C par rapport à l'époque préindustrielle. De plus en plus de recherches quantifient les effets du changement climatique sur les systèmes naturels, gérés et humains du monde1,2. Cependant, moins de quantification est disponible pour les systèmes avec de puissants moteurs de changement non climatiques3. Des études de cas ont indiqué une forte influence de facteurs supplémentaires, en particulier pour les inondations, où l'incertitude du risque actuel est déjà élevée. Par exemple, le risque d'inondation dans le bassin du Rhin s'est avéré le moins sensible aux changements de forçage atmosphérique, mais plus aux changements de capacité des réservoirs, de hauteur des digues, d'utilisation des sols, de valeur des actifs ou de mesures de précaution privées4. Vousdoukas et al.5 ont montré que la protection contre les inondations était la plus grande source d'incertitude dans les évaluations des risques d'inondation côtière dans les sites d'essai de la péninsule ibérique. Les estimations de la valeur des actifs dans un lieu donné (exposition) et les fonctions de vulnérabilité aux inondations, qui indiquent la part des actifs qui sont perdus à une intensité donnée d'inondation, varient considérablement d'un pays à l'autre6,7,8,9. Il a été démontré que les dommages causés par les tempêtes de vent en Europe n'augmentent pas après correction de l'augmentation de l'exposition10, l'attribution étant compliquée par des tendances contrastées des aléas11 et une très forte incertitude sur les fonctions de vulnérabilité12. Enfin, seule une petite fraction des incendies de forêt en Europe sont causés par des sources naturelles, ce qui rend les facteurs humains fondamentaux pour comprendre la fréquence de ces catastrophes13.

De nombreuses études n'ont indiqué aucune tendance à la hausse des pertes économiques directes liées aux aléas naturels en Europe, aux États-Unis ou en Australie après correction de la croissance de l'exposition14,15,16,17,18. La quantification des changements d'exposition, tels que le type d'utilisation des terres, la population, la production économique, la valeur des actifs et son incertitude est essentielle non seulement en raison de sa grande influence directe sur les impacts observés, mais également sur les effets indirects. En cas d'inondations, les zones fortement exposées ont tendance à être mieux protégées19 et moins vulnérables20, tandis que l'utilisation des terres peut moduler localement le débit des rivières plus fortement que le changement climatique21.

Les reconstructions historiques disponibles de l'exposition ont une utilité limitée pour l'attribution du changement climatique dans une perspective à long terme, soit en raison d'une faible résolution, d'une couverture spatiale limitée ou ne couvrant qu'une composante particulière de l'exposition. Par exemple, HILDA22,23,24 n'inclut que la couverture terrestre hautement agrégée pour les pays de l'Union européenne, mais avec une résolution élevée de 1 km couvrant les années 1900 à 2010. L'ensemble de données mondial HYDE25 s'étend des années 10 000 avant JC à 2017 après JC pour et la population, mais a une résolution de seulement 5 minutes d'arc (9 km sur l'équateur). HYDE est largement appliqué à la fois dans la modélisation du climat mondial et de l'impact climatique, y compris ISIMIP26. Sur la base de HYDE, une désagrégation du PIB a également été créée27 et utilisée par exemple dans l'étude d'attribution des inondations mondiales par Sauer et al.28. L'analyse des risques d'inondation et d'incendie en particulier nécessite une très haute résolution des données d'exposition car il s'agit de phénomènes très locaux. Pourtant, des données démographiques à haute résolution sont disponibles au mieux pour quelques pas de temps par ensemble de données, ne remontant pas plus loin que 197529. La désagrégation des données économiques est principalement limitée à un seul prédicteur de l'activité économique, comme la densité de population30 ou l'éclairage nocturne31.

L'ensemble de données HANZE (Historical Analysis of Natural Hazards in Europe), publié en 201732, était le premier ensemble de données d'exposition complet avec une résolution correspondant aux cartes paneuropéennes des risques d'inondation, à savoir 100 m33,34, couvrant les années 1870 à 2015 avec une projection à court terme jusqu'en 2020. Il a été conçu spécifiquement pour permettre l'analyse de l'exposition et du changement d'affectation des terres dans les empreintes d'inondation d'inondations historiques connues et a été utilisé dans ce rôle dans diverses études de suivi16,35,36. Ici, nous présentons un ensemble de données d'exposition révisé et élargi HANZE v2.0, qui intègre de nombreuses améliorations (tableau 1). Le cœur de l'ensemble de données est un ensemble de grilles haute résolution d'utilisation des terres, de population, de produit intérieur brut (PIB), de valeur des actifs fixes et de degré d'imperméabilisation des sols pour 42 pays entre 1870 et 2020. Il est complété par une grande base de données d'entrée de statistiques historiques infranationales. De plus, l'ensemble de données est la sortie d'une boîte à outils Python qui permet de reproduire les données dans leur intégralité, de les visualiser et d'effectuer d'autres analyses (voir 'Notes d'utilisation').

L'ensemble de données d'exposition a été créé avec une combinaison de méthodes statistiques et basées sur des règles. Dans certaines parties du modèle, nous avons inclus des méthodes probabilistes pour quantifier l'incertitude, en utilisant des copules pour modéliser les changements de population sous-régionaux et un réseau bayésien pour les transitions des terres agricoles. L'ensemble de données se concentre sur les zones à forte exposition qui sont les plus pertinentes pour la recherche sur les impacts sociaux et économiques des catastrophes. Par conséquent, les changements apportés à certaines des classes d'utilisation des terres les moins importantes, en particulier les zones naturelles, n'ont pas été modélisés. En outre, de grandes variations dans la disponibilité et la résolution des données historiques pour différents pays influencent directement la précision de la reconstruction maillée de l'exposition passée. La haute résolution de l'ensemble de données est fournie pour permettre une application rapide aux aléas tels que les inondations qui nécessitent des informations aussi détaillées. En raison du manque général de données comparables à la même résolution, seule une validation partielle peut être effectuée.

HANZE v2.0 est un jeu de données d'exposition historique généré par des opérations sur un grand nombre de données raster en entrée. Un résumé du flux de travail pour calculer l'ensemble de données est présenté à la Fig. 1. Le point de départ est un ensemble de rasters haute résolution avec des données sur la population et la couverture/l'utilisation des terres pour une année de référence spécifique. Ces ensembles de données « de référence » ont été créés à partir de données de résolution de 100 m, à l'exception de la population, qui a été désagrégée à partir d'une résolution de 1 km (voir la sous-section « Ensembles de données de référence »). Le modèle modifie les ensembles de données raster de référence en redistribuant l'occupation/l'utilisation des terres et la population jusqu'à ce qu'elles correspondent à la population totale et à la superficie des différentes classes d'utilisation des terres définies par unité administrative infranationale pour chaque pas de temps. Pour chacune de ces unités, nous avons collecté des statistiques socio-économiques agrégées (« données socio-économiques d'entrée »). Différents types d'utilisation des terres (urbaine, industrielle, agricole, etc.) sont modélisés à l'aide de différentes méthodes et de plusieurs jeux de données raster statiques auxiliaires ("Modèle de population et d'utilisation des terres"). En fonction des changements d'utilisation des terres, l'ensemble de données sur l'imperméabilisation des sols est modifié. Enfin, le modèle désagrège les données statistiques sur le produit intérieur brut (PIB) et le stock d'actifs fixes dans une grille de 100 m, en fonction de la répartition de la population et des différents types d'utilisation des terres ("désagrégation des données économiques"). Le modèle est appliqué à l'aide de données couvrant 42 pays et territoires sur la période 1870-2020 (voir Fig. S1 supplémentaire).

Flux de travail HANZE v2.0. Toutes les données d'entrée et le code Python nécessaires pour reproduire ce flux de travail sont accessibles au public.

Quatre jeux de données de référence sont un ensemble de couches raster couvrant la zone d'étude, étroitement alignées dans la dimension temporelle, converties de leurs résolutions natives à une grille de 100 m et ajustées à un seul masque terrestre basé sur Corine Land Cover (tableau 2).

L'occupation/l'utilisation des terres de référence est tirée de Corine Land Cover (CLC) 2012, version 20u1 (https://land.copernicus.eu/pan-european/corine-land-cover/clc-2012), avec la mer ouverte et quelques eaux de transition supprimées. L'ensemble de données CLC 2012 a été créé, en général, par classification manuelle des parcelles de couverture terrestre à partir d'images satellite recueillies en 2011-2012. L'inventaire se compose de 44 classes et la taille minimale des phénomènes surfaciques capturés est de 25 hectares. Pour les éléments linéaires (routes, voies ferrées, rivières, etc.), une largeur minimale de 100 m est utilisée. L'ensemble de données CLC ne couvre pas Andorre, c'est pourquoi une compilation de données sur l'utilisation des terres provenant d'autres sources a été reprise de HANZE v1.0 pour Andorre (voir section 2.1 dans Paprotny et al.32).

Dans de nombreux endroits, la couverture terrestre naturelle a été remplacée par des surfaces imperméables artificielles. Cette couverture imperméable a un impact significatif sur les propriétés hydrologiques d'une zone donnée et, par conséquent, sur la fréquence et l'intensité des crues. C'est aussi un prédicteur important de la répartition des actifs. L'ensemble de données de base sur l'imperméabilisation du sol dans notre modèle est l'ensemble de données Imperviousness Density 2012 du Copernicus Land Monitoring Service (https://land.copernicus.eu/pan-european/high-resolution-layers/imperviousness/status-maps/2012). Il a été créé par classification algorithmique d'images satellites à haute résolution avec un indice de végétation par différence normalisée (NDVI) calibré. La résolution native de l'ensemble de données est de 20 m, mais nous l'avons agrégée à 100 m par souci de cohérence avec l'ensemble de données sur la couverture terrestre.

L'ensemble de données démographiques de base est basé sur la grille de population GEOSTAT pour l'année 2011, version 2.0.1 (https://ec.europa.eu/eurostat/web/gisco/geodata/reference-data/population-distribution-demography/geostat ). Cet ensemble de données a une résolution de 1 km et est basé sur les résultats de la série 2011 des recensements européens de la population. 95 % de la population dans l'ensemble de données est réellement dénombrée et géoréférencée lors du recensement, la population restante étant désagrégée à partir des résultats détaillés du recensement infranational par le Centre commun de recherche de la Commission européenne. Comme dans HANZE v1.0, nous désagrégons cet ensemble de données selon une grille de 100 m en combinant les méthodes "M1" et "M3" décrites dans Batista e Silva et al.37. "M1" désigne la "méthode des variables limitantes" utilisée en cartographie pour créer des cartes asymétriques de densité de population. En bref, il classe les classes d'utilisation des terres en fonction de leur densité de population moyenne, puis redistribue la population au-dessus d'un seuil spécifique d'utilisation des terres des classes les moins denses aux classes les plus denses. La procédure est un algorithme itératif appliqué séparément pour chaque cellule de grille de 1 km. Cette procédure est la suivante :

Premièrement, une densité de population uniforme est attribuée pour chaque classe d'utilisation des terres dans une cellule de grille de 1 km :

où \({Y}_{LG}^{0}\) est la densité de population pour l'utilisation des terres \(L\in \{1,\ldots ,n\}\) dans la cellule de grille G à l'étape 0, YG est la densité de population dans la cellule de la grille, c'est-à-dire le nombre de population XG divisé par la zone SG.

Un seuil de densité de population TL est défini pour chacune des n classes d'occupation du sol.

Les classes d'utilisation des terres sont classées et le sous-indice L est renuméroté de la densité de population la plus faible à la plus élevée, c'est-à-dire que L = 1 désigne la classe d'utilisation des terres la moins densément peuplée dans la cellule de la grille

En procédant dans l'ordre en commençant par L = 1, à l'étape L la densité attribuée à la classe L à l'étape précédente est modifiée si elle est supérieure au seuil, c'est-à-dire si \({Y}_{LG}^{L-1} > { T}_{L}\). Cela crée une population excédentaire \({U}_{LG}^{L}\) :

Le surplus est ensuite redistribué entre les classes d'utilisation des terres M restantes, d'où :

Si après avoir effectué toutes les itérations il y a encore de la population excédentaire, c'est-à-dire si \({X}_{G} > \sum {T}_{L}{S}_{LG}\), elle est redistribuée proportionnellement au seuil :

L'aspect crucial de cette méthode est la définition des seuils TL. Ici, nous utilisons des seuils tels que suggérés par Eicher et Brewer38, c'est-à-dire le 70e centile de la densité de population des cellules de grille pour lesquelles une seule classe d'utilisation des terres a été signalée dans notre ensemble de données d'utilisation des terres de référence. Ces cellules "pures" constituaient environ 5% de toutes les cellules de grille de la population. Gallego et al.39 ont montré qu'une définition différente des seuils fonctionne légèrement mieux pour l'Europe ; cependant, les auteurs ont utilisé des données de population par communes, qui ne sont pas utilisées ici, et que leur méthode nécessiterait en combinaison avec des données maillées. Les seuils finaux TL sont présentés dans le tableau 3. Pour les surfaces artificielles autres que le tissu urbain, les classes CLC ont été fusionnées pour le calcul des seuils, car très peu de cellules « pures », voire aucune, n'ont pu être trouvées pour chacune de ces classes. De plus, pour toutes les zones couvertes de zones humides, d'eau, de sable, de glaciers, de roches nues ou de végétation brûlée, le seuil a été fixé à 0, car ces terrains sont en principe inhabitables.

Comme limitation supplémentaire, seules les classes d'utilisation des terres dans une cellule donnée ont été utilisées, qui contenaient des structures artificielles d'un type particulier. Trois ensembles de données maillées de télédétection (résolution de 100 m) ont été utilisés ici ; si aucune classe d'occupation des sols d'une cellule ne possédait de structure du premier jeu de données, la seconde était utilisée, puis la troisième si nécessaire, comme suit :

Bâtiments;

Surfaces imperméables ;

Routes et rues.

Les bâtiments et les rues ont été obtenus à partir de European Settlement Map 2012 Release 2017 (https://land.copernicus.eu/pan-european/GHSL/european-settlement-map/esm-2012-release-2017-urban-green) et des surfaces imperméables d'Imperviousness Density 2012. Si aucune structure n'était présente dans la cellule de 1 km (car elles n'étaient pas détectées dans les images satellites), toutes les classes d'utilisation des terres ont été utilisées.

Le résultat du calcul, cependant, n'est que la population par utilisation des terres L dans chaque cellule de grille G de 1 km. Par conséquent, la population a dû être davantage désagrégée, et pour cela nous avons utilisé une approche similaire à la méthode M3. Cette méthode redistribue la population proportionnellement à la densité des constructions humaines. Cette variable est comprise entre 0 %, qui indique une surface complètement naturelle, et 100 %, qui indique un terrain complètement scellé par une surface artificielle. Les trois ensembles de données ont été utilisés, principalement des bâtiments de la European Settlement Map (ESM) 2012. Si aucun bâtiment n'était indiqué dans une cellule de 1 km, l'imperméabilité a été utilisée à la place. Dans le cas où aucune imperméabilisation du sol n'a été détectée, les routes et les rues de l'ESM 2012 sont utilisées. Cela peut se produire principalement parce qu'ESM 2012 a combiné des données de télédétection avec plusieurs autres sources (par exemple OpenStreetMap, l'Atlas urbain de l'Union européenne et le Tele Atlas de Tom Tom), tandis que Imperviousness Density 2012 est entièrement un produit basé sur la télédétection.

Les ensembles de données ESM et Imperviousness ont des résolutions natives très élevées (2,5 et 20 m, respectivement). La version agrégée à une résolution de 100 mètres a été utilisée pour la désagrégation, tandis que pour le calcul, la dépendance entre la densité de surface et la population a été déterminée à l'aide de données rééchantillonnées sur une grille de 1 km. Dans le processus, la densité de population moyenne dans les cellules de la grille avec une densité de surface artificielle donnée a pu être calculée. Les dépendances qui en résultent peuvent être approximées sous forme de fonctions de puissance (Fig. S2 supplémentaire). Très peu de cellules avaient un pourcentage moyen très élevé de surface couverte par des structures, d'où les fonctions ont été calculées à partir de valeurs allant de 1 % à 16 % (routes et rues), 64 % (bâtiments) et 84 % (surfaces imperméables). Ainsi, la population Xg dans la maille g de 100 mètres est égale à :

où Zg est la population de la cellule de grille g obtenue à partir de la fonction puissance divisée par la population maximale :

où Vg est l'étanchéité dans la maille g. La population maximale a été définie à 8 000, car les trois ensembles de données ont atteint un pic de densité de population autour de cette valeur. Les paramètres A et B sont indiqués dans le tableau 4.

La population Xg est arrondie, car les nombres de population doivent être des nombres entiers. Par conséquent, la population a été ajoutée ou soustraite en réduisant itérativement les effectifs de la population dans les cellules de 100 mètres en commençant par les cellules dans lesquelles le plus petit changement de la valeur non arrondie modifierait la valeur arrondie. Dans certains cas, plus d'une cellule de 100 mètres avait des valeurs égales et la population de 1 km ne pouvait pas être appariée. Ensuite, la population a été ajoutée ou soustraite en réduisant itérativement le nombre de populations de 1 à la fois en commençant par les cellules de 100 mètres avec la population la plus élevée. S'il y avait à nouveau des cas de cellules multiples de valeurs égales, des cellules de 100 mètres avec un pourcentage plus élevé de surface couverte par des structures ont été utilisées. Si aucune donnée n'était disponible ou si les valeurs en % étaient identiques, la population est ajoutée ou soustraite de manière aléatoire dans les cellules égales.

Des exemples de résultats de désagrégation de la population pour une seule cellule de la grille GEOSTAT sont présentés à la Fig. 2.

Résultat de la désagrégation et données source (population dans la grille = 5230), en contraste avec le fond de carte OpenStreetMap à titre d'illustration uniquement. Fragment du centre-ville de Szczecin, Pologne (région NUTS PL424). Fond de carte © Contributeurs d'OpenStreetMap40. Distribué sous la licence Open Data Commons Open Database (ODbL) v1.0. Superficie couverte par les bâtiments de la European Settlement Map 2012.

Le modèle HANZE v2.0 redistribue la population, l'occupation/l'utilisation des sols et les variables économiques séparément pour chaque unité administrative infranationale (ci-après, les « régions »). Les frontières administratives changent fréquemment au sein des pays au fil du temps. Plutôt que de modifier les définitions des régions à chaque pas de temps du modèle, nous ajustons les données statistiques historiques à une seule classification de référence. La nomenclature des unités infranationales de l'Union européenne, la Nomenclature des unités territoriales statistiques (NUTS), version 2010, est utilisée dans HANZE v2.0. Le niveau le plus détaillé de la nomenclature, le niveau NUTS 3, est appliqué. Pour cette étude, nous avons préparé un nouvel ensemble de données vectorielles à haute résolution des régions NUTS en raison de la faible précision et de la licence non permissive de la carte NUTS semi-officielle disponible via Eurostat (https://ec.europa.eu/eurostat/web /gisco/geodata/reference-data/administrative-units-statistical-units). Nous avons compilé le nouvel ensemble de données en utilisant uniquement des données librement disponibles provenant d'agences géospatiales nationales et d'OpenStreetMap40 (tableau 5), avec des corrections manuelles des limites interrégionales effectuées si nécessaire pour l'alignement avec la classification NUTS 2010. la délimitation de la côte dans les ensembles de données source d'origine a été ajustée pour l'aligner sur l'ensemble de données de référence CLC. De plus, étant donné que le Kosovo et la Bosnie-Herzégovine ne sont actuellement pas couverts par la NUTS, nous avons codé artificiellement leurs divisions administratives d'une manière cohérente avec le système NUTS. Enfin, le jeu de données vectorielles a été converti en une grille raster de 100 m. Le domaine de notre étude contient 1422 régions au total. Comme indiqué, les statistiques historiques d'entrée qui alimentent le modèle ont été recalculées si nécessaire pour correspondre à notre carte haute résolution des régions NUTS.

La base de données d'entrée des données statistiques socio-économiques historiques a été créée en révisant les données de HANZE v1.0. Il contient des données sur les principaux facteurs socio-économiques d'exposition au niveau régional. Les variables de la base de données sont répertoriées dans le tableau 6. En outre, elle contient le stock d'actifs fixes par rapport au PIB dans six secteurs, définis au niveau national. La base de données a été compilée à partir de 375 sources différentes (contre 271 dans HANZE v1.0) : sites Web et publications d'instituts statistiques nationaux et d'agences internationales, documents de travail de banques nationales et d'instituts de recherche économique et documents de recherche universitaires, datant de 1872 à aujourd'hui. . Des informations détaillées sur la source de chaque point de données dans la base de données et les transformations effectuées pour ajuster les données à la version NUTS 2010 sont décrites dans les ensembles de données Excel (voir « Enregistrements de données »). Les données ont été compilées toutes les décennies de 1870 à 1950, tous les 5 ans jusqu'en 2000 et annuellement jusqu'en 2020. Par rapport à HANZE v1.0, les principaux changements sont : l'amélioration de la qualité des données grâce à l'inclusion de davantage de sources de données (Fig. S3 supplémentaire ); ajout de nouveaux pays (Albanie, Bosnie-Herzégovine, Kosovo, Monténégro, Macédoine du Nord et Serbie) ; ajout des biens de consommation durables (biens utilisés par les ménages pendant plusieurs années) en tant que catégorie d'actifs fixes grâce à l'intégration des données et des méthodes de Paprotny et al.41,42 ; ajout de données d'occupation du sol forestier pour l'ensemble de la zone d'étude.

L'approche générale, comme indiqué dans l'introduction, consiste à modifier l'ensemble de données raster de base sur la population et l'occupation du sol/l'utilisation pour chaque pas de temps. Cela se fait séquentiellement pour différentes classes CLC et groupes de population (régionaux, urbains, ruraux), de sorte qu'une classe modifiée à une étape donnée n'altère pas celles qui ont été modélisées au préalable. Les étapes de modélisation sont les suivantes :

Cas particuliers (polders hollandais)

Redistribution sous-régionale de la population

Tissu urbain et redistribution de la population urbaine

Aéroports et réservoirs

Redistribution de la population rurale

Unités industrielles ou commerciales

Sites routiers/ferroviaires

Sites de construction

Autre terrain artificiel

Terres cultivées et pâturages

Zones brûlées

Espaces naturels

Réglage du degré d'imperméabilisation du sol

Un résumé de l'approche de modélisation et la justification sont expliqués, par classe de couverture terrestre / utilisation à partir de l'ensemble de données CLC, dans le tableau supplémentaire 1. Il souligne également que l'utilisation artificielle des terres, bien que constituant 5% de la superficie totale des terres, contient environ 90% de la population et de la valeur des immobilisations, la reconstruction de l'exposition passée est donc largement limitée à ces zones. Des informations détaillées sont fournies dans les sous-sections suivantes, telles que référencées dans la liste numérotée ci-dessus. Il convient de noter que la méthodologie est un raffinement des méthodes largement utilisées déjà dans Paprotny et al.32.

Le modèle inclut un cas particulier, en raison de son influence sur la distribution de l'exposition aux Pays-Bas. Le Zuiderzeewerken était un projet à grande échelle de récupération des terres et de protection contre les inondations, qui a abouti à la construction de grandes digues et de polders dans le Zuiderzee entre les années 1920 et 1970 (Fig. S4 supplémentaire). Le Zuiderzee a été fermé en 1932 par une grande digue, transformé en lac et divisé en 1975 en IJsselmeer et Markermeer. Des villes, des infrastructures et des terres agricoles ont été créées sur les terres récupérées, principalement dans la province de Flevoland. Elle compte aujourd'hui plus de 400 000 habitants, mais avant 1942, elle ne comprenait que la petite ville insulaire d'Urk et l'île inhabitée de Schokland (la province elle-même n'a été créée qu'en 1986). Par conséquent, toutes les terres créées artificiellement sont retirées de la grille d'occupation/d'utilisation des terres et transformées en eaux intérieures (CLC 512) pendant des années avant l'année d'achèvement des polders néerlandais individuels. La population est également supprimée et n'est pas prise en compte dans la redistribution de la population et de l'utilisation des terres pour ces années, donc cette étape de modélisation est effectuée avant toutes les autres.

Une redistribution substantielle de la population au sein des pays européens s'est produite à l'époque moderne. Ici, nous modélisons l'évolution démographique sous-régionale (c'est-à-dire en dessous du niveau NUTS3) pour la période 1870-2020 sur la base d'observations empiriques à partir d'un ensemble de données sur l'évolution démographique entre 1961 et 2011 au niveau des unités administratives locales (UAL). Nous avons créé l'ensemble de données pour cette étude en fusionnant des données tabulaires et spatiales produites au cours de différentes années qui sont disponibles via Eurostat43 et les instituts nationaux de statistique (https://www.stat.gov.mk/OblastOpsto_en.aspx?id=2, https:/ /www.stat.gov.rs/en-us/oblasti/stanovnistvo/, https://ec.europa.eu/eurostat/web/gisco/geodata/reference-data/administrative-units-statistical-units/communes) . Des détails sur la façon dont les données ont été créées et leur visualisation sont fournis dans le texte supplémentaire S1. Les tendances démographiques pour environ 109 000 UAL indiquent :

Déclin de la population dans les noyaux urbains qui sont les parties les plus centrales et les plus densément peuplées des villes

Croissance rapide des zones suburbaines autour des noyaux urbains

Déclin de la population des zones rurales

Les deux premiers changements sont largement induits par la variation du nombre de personnes par ménage. Même lorsque la population d'une ville stagne, des familles plus petites dans chaque logement entraînent une augmentation de la demande de logements. Ces logements supplémentaires ont dû être construits principalement à l'extérieur des noyaux urbains, où l'offre de logements est en grande partie fixe. Il a été montré44,45,46 que cette tendance est présente dans les grandes villes européennes depuis le début du XIXe siècle, aplatissant la courbe de densité de population en fonction de l'éloignement des centres-villes. Dans le même temps, la migration des zones rurales vers les zones urbaines a réduit la population dans les zones rurales et exacerbé la croissance des banlieues.

Ici, nous modélisons le taux de variation de la population dans chaque région NUTS3, où la population totale est définie par des statistiques historiques, en utilisant la relation empirique entre la densité de population et les taux de variation historiques. Pour saisir l'incertitude de la corrélation, nous utilisons des copules qui corrèlent la densité de population à partir des données LAU avec la croissance démographique sont appliquées (Fig. 3). Une copule est, en gros, une distribution conjointe sur l'hypercube unitaire avec des marges uniformes (0,1). Il existe de nombreux types de copules47, et nous avons choisi les copules paramétriques optimales pour cette analyse en comparant différentes copules à l'aide du "Blanket Test" basé sur la statistique de Cramèr-von Mises discutée par Genest et al.48. En raison des modèles très différents de changement de population et des LAU à haute et basse densité, nous utilisons deux copules :

une copule gaussienne utilisant les données des UAL avec une densité de population inférieure à 1500 personnes par km2 qui corrèle la densité de population des données des UAL avec la croissance démographique (r de Spearman = 0,69)

une copule de Frank utilisant les données des LAU avec une densité de population supérieure à 1500 personnes par km2 qui corrèle la "densité d'agglomération" avec la croissance démographique (r de Spearman = −0,36).

Copules empiriques de la dépendance entre la croissance démographique (1961-2011) par rapport à la croissance nationale, et la densité de population (2011) sous deux formes différentes (a – densité locale, b – densité d'agglomération). La copule de gauche (a) s'applique aux densités de population inférieures et à droite (b) supérieures à 1500 personnes par km2. Les marges ont été transformées en distributions normales standard.

La « densité d'agglomération » par LAU est la moyenne de la densité du noyau calculée avec la grille de population GEOSTAT de 1 km et un rayon de 10 km. Par conséquent, il indique la taille de l'agglomération dont fait partie une UAL à haute densité. Cette « densité d'agglomération » est un meilleur prédicteur de l'évolution de la population que la densité de population des UAL individuelles. Seules les LAU des régions NUTS3 avec au moins 10 LAU ont été incluses pour quantifier les copules afin d'éviter d'utiliser de grandes LAU hétérogènes. Le seuil de 1500 personnes par km2 pour la sélection des copules a donné les meilleurs résultats en validation. Coïncidence, mais sans surprise, c'est aussi le seuil utilisé pour définir les grappes de population à haute densité par Eurostat49, et à son tour pour classer les UAL comme urbaines.

Les LAU de l'ensemble de données d'Eurostat appliqué ici n'ont pas une couverture complète, ont une précision géométrique inférieure à celle de notre ensemble de données vectorielles NUTS3, et la taille des LAU varie considérablement d'un pays à l'autre. Par conséquent, un ensemble de LAU "virtuelles" (ci-après, "VLAU") a été construit. Chaque VLAU se compose d'une parcelle urbaine de Corine Land Cover 2012 et de son quartier le plus proche (Fig. S5 supplémentaire). La population désagrégée à une résolution de 100 m a ensuite été attribuée à chaque VLAU pour calculer la densité de population. Pour chaque pas de temps du modèle, les copules sont échantillonnées 10 000 fois pour obtenir une estimation de la croissance annuelle de la population (moyenne géométrique du taux de croissance sur 50 ans). La population d'une VLAU à l'année t et 2011 est alors :

où A est le taux de croissance annuel (en %) du modèle de copule. Pour éviter des changements irréalistes, principalement pour les zones à très faible densité de population, la croissance de la population est plafonnée : −2,257 %

La population redistribuée au niveau sous-régional est encore ajustée spatialement, séparément pour les zones urbaines et rurales. En supposant une offre fixe de logements dans les zones déjà bâties, l'évolution de la population dans les zones urbaines et l'expansion de ces zones (c'est-à-dire le tissu urbain ou les classes CLC 111 et 112) sont entraînées par l'évolution du nombre total de ménages urbains. Comme la population a augmenté mais que le nombre moyen de personnes par ménage a diminué dans toute l'Europe depuis le XIXe siècle, la demande de logements a considérablement augmenté. Le mouvement de population vers les périphéries des villes (périurbanisation) s'accompagne d'une réduction de la densité de population dans les « noyaux » urbains où un nombre similaire de ménages contient un stock de population en déclin. Ce processus d'aplatissement de la répartition de la population en tant que fonction logarithmique de la distance aux noyaux urbains a été quantifié par Clark44 et de nombreuses études ultérieures45,46.

En prenant la population urbaine totale U et le nombre moyen de personnes par ménage H (taille du ménage) de nos statistiques historiques, nous pouvons calculer le nombre total de ménages urbains Nt = Ht/Ut l'année t pour chaque région. Nous simulons comment l'augmentation de Nt a provoqué l'expansion du tissu urbain grâce à la construction de nouveaux logements et d'infrastructures connexes dans des zones auparavant non développées. Dans de rares cas, au cours des dernières années, il y a eu une diminution du nombre de ménages urbains au fil du temps. Jusqu'à présent, cela a conduit à la vacance des logements plutôt qu'à une contraction de la surface du tissu urbain.

La modélisation opère en modifiant, pour un pas de temps t donné, la population par maille de tissu urbain P2011 définie dans la grille de population de référence. Cela se fait séparément et indépendamment pour chaque VLAU, où la population urbaine totale de référence est \({U}_{2011}=\sum {P}_{2011}\). Le but de cette étape de modélisation est de générer une nouvelle grille de population, où \(\sum {P}_{2011}\) correspond à Ut, qui à son tour est la population urbaine totale d'une VLAU au pas de temps t. Ut est défini au préalable pour chaque VLAU, car il s'agit d'un ajustement proportionnel de la population totale de toutes les VLAU d'une région NUTS3 donnée, déjà calculée à la section S2.2, à la population urbaine totale d'une région NUTS3 définie dans les statistiques historiques. Nous connaissons donc la population urbaine attendue dans une VLAU et devons modifier la grille de population pour reproduire l'évolution historique de la taille de la population urbaine et l'évolution de sa répartition au sein des villes. Les modifications de la taille des ménages sont tirées des statistiques historiques au niveau NUTS3. La procédure se fait par étapes :

Dans chaque cellule de la grille du tissu urbain d'une VLAU, la population de cellules de la grille P à l'année t est modifiée par rapport à la référence de 2011 pour tenir compte de l'évolution de la taille du ménage :

où H est la taille moyenne des ménages, déterminée pour chaque région NUTS3;

Toutes les cellules de la grille d'une région sont classées en fonction de la distance par rapport aux centres urbains (expliqué plus loin dans le texte), où les cellules les mieux classées sont les plus proches de tout centre urbain.

La population excédentaire St est calculée :

où \({U}_{t}=\sum {P}_{t}\) est la population urbaine totale dans la VLAU. La modélisation se termine ici si St = 0, mais ce n'est presque jamais le cas. St est généralement positif ou négatif et indique combien de personnes, après avoir ajusté la grille de la population à la taille du ménage du niveau historique Ht, doivent être supprimées ou ajoutées à la grille afin de correspondre à la population totale historique Ut. Selon que l'on modélise une année avant ou après la ligne de base, quatre combinaisons de St et t peuvent être distinguées, comme indiqué dans le tableau 7.

Dans les deux cas A et B, c'est-à-dire St > 0, t < 2011 et St < 0, t > 2011, le nombre de ménages, et donc l'étendue des aires urbaines, s'est élargi dans le temps. Pour les pas de temps antérieurs à 2011, cela signifie qu'une partie du tissu urbain doit être supprimée de l'ensemble de données raster d'occupation/d'utilisation du sol de référence (cas A), tandis que pour les pas de temps postérieurs à 2011, davantage de tissu urbain doit être ajouté (cas B). Les changements dans la population des cellules de la grille P dépendront de la distance des centres urbains d. La distance aux centres urbains utilisée ici est une moyenne pondérée de différentes mesures de centres de population ("distance combinée") afin de saisir les multiples niveaux de hiérarchie existant dans les réseaux urbains. Cinq ensembles de données différents ont été testés et, sur la base d'un processus d'étalonnage expliqué dans le texte supplémentaire S2 (le même que dans Paprotny et al.32), quatre de ces ensembles de données ont été sélectionnés pour la distance combinée des centres urbains. Les jeux de données et leurs poids sont les suivants :

Centres arbitraires des grandes agglomérations (plus de 300 000 personnes en 2018) et des capitales de la révision 2018 des perspectives d'urbanisation mondiale des Nations Unies (https://population.un.org/wup/), avec un poids de 1,0

Centroïdes des grappes de population à haute densité44, avec un poids de 1,5

Centroïdes des villes incluses dans l'Atlas urbain 201844, avec un poids de 2,0

Barycentres des parcelles urbaines Corine Land Cover 2012, avec un poids de 0,5.

La distance combinée est calculée pour chaque cellule de la grille. Ensuite, la modélisation se poursuit selon les cas :

Cas A : les mailles urbaines sont supprimées de manière itérative en remontant à partir de l'année de base 2011 en commençant par la moins bien classée (i = 1), et leur population est réduite de la proportion D :

La proportion D est basée sur le logarithme de la distance aux centres urbains d en hectomètres :

À chaque itération, le surplus est réduit de la quantité de population redistribuée :

Le calcul se poursuit jusqu'à ce que St,i = 0. Cependant, si à une itération, il y a plus de population dans les cellules de la grille que de surplus restant, c'est-à-dire :

la population est réduite du montant disponible, divisé proportionnellement à la population de cellules de la grille s'il y a plus de cellules avec le même rang :

Cas B : les cellules où l'expansion urbaine a le plus probablement eu lieu sont identifiées à l'aide du modèle de transition d'affectation des sols décrit à l'étape 10, en commençant par les cellules présentant la probabilité de transition la plus élevée. Si plus de cellules avaient la même probabilité de transition vers le tissu urbain qu'il n'en fallait pour affecter la population supplémentaire, les cellules de ce groupe étaient classées en fonction de la distance par rapport au centre urbain. La population dans les cellules les mieux classées, c'est-à-dire l'itération i = 1, est fixée à la population maximale par cellule de grille dans la VLAU, réduite de la proportion D de l'Eq. 12 :

À chaque itération, le surplus est augmenté de la quantité de population redistribuée :

Le calcul se poursuit jusqu'à St,i = 0. Cependant, si à une itération il y a plus de population à redistribuer que de surplus disponible, c'est-à-dire :

le surplus est réparti équitablement entre toutes les cellules qui ont été modifiées jusqu'à cette itération (notée n) :

S'il n'y a pas de cellules de grille vides disponibles dans la VLAU, la population de toutes les cellules de grille urbaines est augmentée proportionnellement de la même manière que dans l'équation. 19.

Cas C et D : dans ces cas, le nombre de ménages a diminué au fil du temps, car certains logements sont devenus vacants. L'aire urbaine est restée inchangée, le tissu urbain n'étant pas supprimé sauf cas très extrêmes. Avant 2011, la population de toutes les cellules de la grille urbaine était ajoutée à la grille (cas C), tandis qu'après 2011, elle était supprimée (cas D). La population a augmenté/diminué proportionnellement à la population dans une cellule de grille donnée en 2011 (comme dans l'équation 19).

La modélisation de la redistribution de la population dans les zones urbaines est étroitement liée à l'évolution du tissu urbain. Dans les cas A et B, l'aire urbaine change du fait de la croissance du nombre de ménages urbains, contrairement aux cas C et D, où le tissu urbain reste inchangé. Comme le tissu urbain est étroitement lié à une forte densité de population, les cellules de la grille du tissu urbain ne sont supprimées (cas A) ou ajoutées (cas B) à l'ensemble de données de référence que si les changements de densité de population sont suffisamment importants. Par conséquent, le tissu urbain est supprimé dans les pas de temps avant l'année de référence 2011 uniquement si la population dans une cellule de la grille a été réduite à moins de 9 personnes. Pour les pas de temps après 2011, seule une augmentation de la population à plus de 81 par cellule de grille de 100 m a entraîné la transition vers une classe de tissu urbain. Les deux seuils ont été obtenus en calibrant le modèle pour correspondre à l'ampleur du changement observé dans les inventaires CLC (2000-2018). Entre 2000 et 2012, le tissu urbain s'est agrandi de près de 1,88 million d'ha, alors qu'entre 2012 et 2018 seulement de 98 676 ha, selon les données du CLC. En fixant les seuils de population par calibrage, le modèle représente correctement l'effet de l'évolution de la population urbaine sur le type d'utilisation des terres. Comme le montrent les résultats, l'étalonnage était effectivement applicable jusqu'à l'année 1900.

Les aéroports et les réservoirs sont de grands éléments d'infrastructure qui sont apparus pour la première fois au cours de la période de cette étude. Comme la période de construction de ceux-ci est généralement bien connue et que leur nombre est relativement faible, ils sont supprimés ou ajoutés au jeu de données raster de référence en fonction de l'année de construction. Nous avons identifié 1598 aéroports et 1121 grands réservoirs (Fig. 4) dans la zone d'étude en combinant des ensembles de données CLC (classes CLC 124 et 512) avec des bases de données mondiales de ces objets (https://www.globaldamwatch.org/grand et https:/ /ourairports.com/data/) et complétées par une recherche en ligne de leur histoire. Bien que HANZE v1.0 comprenne également ces données, en raison de l'ajout de nouveaux pays, de l'utilisation d'un ensemble de données CLC révisé et de mises à jour des bases de données mondiales sur les aéroports et les réservoirs, nous avons recompilé les données sur les aéroports et les réservoirs à partir de zéro. Un aéroport ou des réservoirs qui sont supprimés de l'ensemble de données de référence permettent à d'autres types d'utilisation des terres de remplir l'espace vide résultant. Un ajout d'un tel objet après 2011 supprime toute population qui y était présente en 2011.

Nombre (a) d'aéroports et (b) de réservoirs construits dans la zone d'étude entre 1870 et 2020 (périodes de 5 ans se terminant par l'année indiquée).

La population rurale est recalculée séparément pour chaque VLAU, en ajustant la population de base de la cellule de grille proportionnellement à sa valeur, de sorte qu'elle soit égale à la population attendue dans cette zone. Pendant des années avant la référence, les zones dont le tissu urbain a été supprimé sont toujours considérées comme urbaines aux fins de ce calcul. Pendant des années après la référence, la population rurale dans les zones qui sont passées au tissu urbain n'est plus considérée comme rurale, par conséquent, l'ajustement n'est effectué que sur les cellules rurales restantes dans la VLAU.

Comme la population est toujours enregistrée sous forme de nombres entiers, un écart peut survenir en ajustant la population dans les cellules de la grille puis en l'arrondissant. Par conséquent, la population ajustée dans les cellules de la grille est d'abord arrondie à l'aide de la fonction "plancher", puis les cellules de la grille avec les restes les plus élevés de la division des valeurs non arrondies par 1 sont arrondies à l'aide de la fonction "plafond". Le nombre de restes les plus élevés est déterminé par la différence entre la population attendue dans la VLAU et la population totale de cellules ajustée et arrondie à l'aide de la fonction "plancher".

La zone couverte par les grandes installations industrielles/commerciales (classe CLC 121) est supposée évoluer proportionnellement au PIB généré dans une région NUTS 3 par l'industrie et les services. Les cellules de la grille industrielle situées les plus éloignées des centroïdes des parcelles d'utilisation des terres industrielles sont supprimées en premier lors d'un retour dans le temps. Pour les pas de temps après l'année de référence, les cellules de la grille industrielle les plus proches des centroïdes sont ajoutées en premier. L'utilisation industrielle des terres ne peut s'étendre que dans les cellules inhabitées de certaines classes CLC : chantiers de construction (133), agricoles (211-244) et certaines zones naturelles (311-324 et 333). Cependant, la croissance du PIB de l'industrie et des services n'est que partiellement tirée par l'expansion des installations, car la productivité du capital et du travail a tendance à augmenter. En effet, la classe CLC 121 a augmenté entre 2000 et 2018 (sur la base de CLC 2012 et CLC-Changes) de 16% dans la zone d'étude, mais le PIB de l'industrie et des services a augmenté de 32%. Par conséquent, la variation du PIB de l'industrie/des services est mise à l'échelle par une élasticité de 0,45, de sorte que les variations modélisées entre 2000 et 2018 dans la zone d'étude ont la même ampleur que celle observée dans l'inventaire CLC. La zone industrielle A dans la région r et l'année t est la suivante :

où ε est l'élasticité et Gr est le PIB régional de l'industrie/des services selon les statistiques historiques au niveau NUTS3.

La superficie couverte par les routes et les voies ferrées (classe CLC 122) avant 2000 était supposée changer proportionnellement à la longueur des autoroutes et des voies ferrées. Des données historiques sur la longueur de ce type d'infrastructure ont été incluses dans la base de données d'entrée. Comme les infrastructures ont d'abord été construites dans les grandes zones urbaines et industrielles, les mailles des infrastructures (classe CLC 122) situées les plus éloignées des centres urbains sont supprimées en premier en remontant dans le temps jusqu'à ce que la superficie totale par région corresponde à la valeur de la base de données. À l'inverse, les mailles les plus proches des centres urbains sont remplies d'infrastructures pour les pas de temps après l'année de référence. L'infrastructure n'est autorisée à s'étendre qu'à certaines classes CLC: chantiers de construction (133), agricoles (211–244) et certaines naturelles (311–324 et 333). Cependant, les chantiers de construction ont été priorisés par rapport aux autres classes CLC; toutes les cellules de la grille « construction » doivent être épuisées avant que d'autres classes CLC puissent être envisagées. En effet, en dehors du tissu urbain ou des sites industriels déjà considérés dans les étapes précédentes, les sites routiers et ferroviaires sont les aboutissements les plus fréquents de l'activité de construction. Nous avons trouvé ce modèle dans les transitions d'utilisation des terres dans les inventaires CLC ultérieurs (2000-2018) : près de la moitié de la superficie des chantiers de construction dans l'inventaire CLC qui a fait la transition vers d'autres tissus urbains ou sites industriels (considérés dans les étapes précédentes) a fait la transition aux infrastructures d'ici le prochain inventaire à 6 ans.

Les chantiers de construction (classe 131 du CLC) sont par définition une utilisation temporaire du sol, généralement pour quelques années seulement. L'inventaire CLC montre que 76 à 81 % des chantiers de construction passent à une autre utilisation des terres au cours des périodes de 6 ans entre les ensembles de données CLC (2000-2006, 2006-2012, 2012-2018). Par conséquent, pour les années 2005 à 2011, leur superficie a été supposée constante, tandis que pour les années 1870 à 2004, tous les sites de construction ont été supprimés de l'ensemble de données. Après 2011, ils ont été autorisés à faire la transition vers le tissu urbain, les sites industriels, les routes, les voies ferrées et les aéroports (CLC 111-122 et 124), mais sont par ailleurs restés inchangés.

Les espaces verts urbains, les équipements sportifs et de loisirs (classes CLC 141 et 142) sont étroitement liés aux autres surfaces artificielles. Près des deux tiers de ces parcelles CLC bordent soit le tissu urbain, soit des sites industriels, soit des sites routiers/ferroviaires, soit des aéroports dans l'inventaire CLC 2012. Par conséquent, les patchs des classes CLC 141 et 142 qui bordaient les classes CLC 111–122 et 124 dans l'ensemble de données de base sont supprimés si dans un pas de temps donné, s'ils ne bordent plus les classes CLC 111–122 et 124 en raison de l'application de la modélisation précédente pas. Les ports, l'extraction minière et les décharges (classes CLC 123, 131 et 132) sont de grands éléments d'infrastructure comme les aéroports et les réservoirs, mais ils sont trop nombreux (près de 15 000 objets) et leur histoire moins traçable pour appliquer la même approche que pour les aéroports. . Par conséquent, ils ont été maintenus constants à chaque pas de temps et n'ont pas interagi avec d'autres classes d'utilisation des terres, sauf en ce qui concerne la construction de polders (étape 1) ou de réservoir (étape 4).

Le concept général de modélisation des changements des terres agricoles a été tiré de l'ensemble de données HYDE50, c'est-à-dire que l'adéquation locale à l'agriculture détermine où cette classe d'utilisation des terres se développe (la plus adaptée des terres disponibles en premier) et se contracte (la moins adaptée tombe en désuétude en premier). L'évolution des zones agricoles et l'augmentation du tissu urbain après l'année de référence ont été calculées à l'aide d'un modèle utilisant un réseau bayésien (RN) qui combine la théorie des probabilités et la théorie des graphes afin de construire et d'exploiter une distribution conjointe. Le BN est formé avec l'ensemble de données CLC-Changes, qui enregistre 1,2 million de transitions impliquant des parcelles de terrain de plus de 5 ha, et CLC 2012 identifiant les types d'utilisation des terres qui n'ont pas connu de transition entre 2000 et 2018. The CLC-Changes et CLC 2012 inventaire ont été échantillonnés pour obtenir 513 915 cas de transition et un nombre égal de parcelles d'utilisation des terres stables entre 2000 et 2018. Jeu de données DEM51 (https://ec.europa.eu/eurostat/web/gisco/geodata/reference-data/elevation/eu-dem/eu-dem-laea, aptitude agricole de Global Agro-Ecological Zoning (GAEZ) version 4 base de données (https://gaez-data-portal-hqfao.hub.arcgis.com/) et ensemble de données de population des étapes 2 et 3. La procédure d'échantillonnage et une liste de tous les prédicteurs testés sont décrites dans le texte supplémentaire S3.

Comme l'information sur l'utilisation des terres est catégorique, un NE discret a été utilisé. Les classes d'occupation des sols ont été collectées dans 5 bacs (tissu urbain, autre artificiel, terres cultivées, pâturages, naturel). Le groupe avec terres naturelles exclut les types de couverture terrestre non utilisables (CLC 331–332, 334–335, 421–523), qui ne sont pas autorisés à interagir avec l'utilisation des terres artificielles ou agricoles. Le modèle BN a été construit de manière itérative, en commençant par un simple réseau à trois nœuds, où la « ancienne » classe d'utilisation des terres est le parent de la « nouvelle » classe d'utilisation des terres, et une seule variable prédictive est le parent des deux classes d'utilisation des terres. utiliser des nœuds. Des BN plus complexes avec plus de prédicteurs ont été respectivement validés par rapport à un sous-ensemble disjoint d'échantillons de transitions et de non-transitions non utilisés pour la formation (voir le texte supplémentaire S3 pour la procédure d'échantillonnage et la «validation technique» pour les résultats finaux de la validation). De manière itérative, les meilleurs prédicteurs, le nombre de prédicteurs et le nombre de cases (dans lesquelles les variables continues ont été discrétisées) ont été sélectionnés. Trois prédicteurs ont été choisis, qui sont tous les parents des deux nœuds d'utilisation des terres (Fig. 5) :

Densité de population par VLAU – 9 bacs ;

Indice d'aptitude pour le blé : densité de production (production potentielle divisée par la surface totale des cellules de la grille) pour le blé dans des conditions pluviales et un niveau d'intrants élevé – 5 cellules ;

Indice d'aptitude pour l'herbe : rendement potentiel agro-climatique pour l'herbe avec une teneur en eau disponible de 200 mm/m (en conditions d'irrigation) et un niveau d'apport élevé - 10 bacs.

Réseau bayésien pour les transitions d'utilisation des terres avec 5 nœuds et 7 arcs. Les nœuds indiquent le nombre de casiers des distributions discrètes et les intervalles des casiers.

Les deux indices d'aptitude agricole proviennent de la base de données GAEZ, basée sur le climat de 1971 à 2000. Comme le BN est quantifié avec une table de probabilité conditionnelle (CPT), cette configuration se traduit par un CPT ayant 11 250 cellules. Par conséquent, aucune autre variable n'a été ajoutée pour éviter trop peu de points de données quantifiant les cellules du CPT.

La figure 6 montre un exemple d'application du réseau bayésien. Dans ce cas, nous connaissons l'utilisation actuelle des terres (terres cultivées) et nous savons qu'au cours d'une période antérieure, la superficie totale des terres cultivées dans une région NUTS3 était inférieure à ce qu'elle est actuellement. Par conséquent, nous voulons connaître la probabilité que l'utilisation des terres soit différente des terres cultivées dans les cellules de la grille situées dans la région. La figure 6a montre une zone qui était très probablement une terre cultivée auparavant, en raison d'une densité de population relativement élevée et d'une bonne aptitude à l'agriculture. La zone de la Fig. 6b a une aptitude plus faible, ce qui indique une probabilité beaucoup plus élevée que la zone ait été utilisée à d'autres fins que les terres cultivées. Par conséquent, la zone de la Fig. 6b sera classée plus haut que la zone de la Fig. 6a lors de la sélection des cellules de grille des terres cultivées qui seront supprimées du jeu de données raster afin de faire correspondre la superficie totale des terres cultivées avec les données statistiques historiques.

Exemple de réseau bayésien conditionnel pour les transitions d'occupation du sol. Le panneau (a) montre une zone hautement appropriée pour les terres cultivées, et (b) une zone inappropriée. Le graphique indique la probabilité a priori (situation sur la Fig. 5) et a posteriori (les nœuds en gris étant conditionnés avec les valeurs indiquées) du type d'utilisation des terres précédent (60,8 % en (a) et 43,4 % en (b) pour être des terres cultivées).

Le BN formé est utilisé pour générer des probabilités de transitions d'affectation des terres dans neuf cas, comme suit :

de non urbain à urbain après l'année de référence ;

de terres non cultivées à terres cultivées après l'année de référence ;

de non-pâturage à pâturage après l'année de référence;

des terres cultivées aux terres non cultivées après l'année de référence ;

du pâturage au non-pâturage après l'année de référence;

de terres non cultivées à terres cultivées avant l'année de référence ;

de non-pâturage à pâturage avant l'année de référence;

des terres cultivées aux terres non cultivées avant l'année de référence ;

du pâturage au non-pâturage avant l'année de référence.

Comme indiqué à la section 2.4.3, le BN traite le cas de la transition non urbaine vers urbaine après 2011. Lorsque les besoins en logement de la population entraînent l'expansion des villes, les zones présentant la plus forte probabilité de transition de terres non urbaines vers des terres urbaines -l'utilisation est l'accumulation en premier. Le BN est utilisé de la même manière pour les huit cas restants liés à l'agriculture, c'est-à-dire qu'ils déterminent dans quelles zones agricoles ajouter ou supprimer de sorte que la superficie totale des terres cultivées et des pâturages dans le jeu de données raster de couverture terrestre/utilisation pour un pas de temps donné correspond aux valeurs obtenues à partir des statistiques historiques par région NUTS3. Cela se fait de manière itérative en commençant par les parcelles de terre avec la plus forte probabilité de transition entre des classes données (par exemple, non-pâturage à pâturage). La redistribution des terres cultivées est modélisée en premier, puis les pâturages sont redistribués dans la deuxième étape. Les terres encore occupées par des terres cultivées après la première étape ne peuvent pas passer au pâturage. Cependant, les terres vidées par la redistribution des terres cultivées lors de la première étape peuvent passer au pâturage lors de la deuxième étape.

Nous devons modéliser les transitions en arrière dans le temps pour les pas de temps avant 2011. Nous supprimons partiellement le tissu urbain ou les sites routiers/ferroviaires au cas où ils occupaient moins de terrain dans le passé et créons un espace vide, que les terres cultivées peuvent occuper. Avancer dans le temps, c'est une transition entre terres cultivées et terres non cultivées. La probabilité de transition utilisée pour déterminer les cellules à remplir avec des terres cultivées est la probabilité qu'une cellule de terres non cultivées ait été une terre cultivée auparavant. Il en est de même pour les pâturages, à condition qu'ils ne puissent pas occuper des cellules déjà affectées à des terres cultivées. La transition des surfaces artificielles restantes à cette étape du modèle vers l'utilisation des terres agricoles n'est pas autorisée.

Dans le processus itératif de redistribution de l'utilisation des terres, le nombre de cellules de grille avec une probabilité égale de transition peut dépasser le nombre de cellules qui doivent être converties pour correspondre à la superficie totale dans les statistiques historiques. Cela se produit souvent car les prédicteurs (ensemble de données GAEZ et densité de population par VLAU) ont une résolution relativement grossière avec un petit nombre de cases dans lesquelles les données sont divisées. Afin de dériver des cellules de grille exactes de 100 m à partir de parcelles de terre de probabilité égale, un autre prédicteur de l'aptitude agricole a été ajouté. La pente du terrain est un prédicteur important, également utilisé dans les deux indices d'aptitude agricole de la FAO. Il est disponible dans la résolution cible (100 m) en tant que quantité continue à partir de l'ensemble de données d'élévation EU-DEM. Une pente plus faible indique une meilleure aptitude à l'activité agricole, par conséquent, des cellules de 100 m de probabilité égale de transition sont classées en fonction de la pente de la plus faible à la plus élevée. Le nombre approprié de cellules les mieux classées est ajouté/supprimé afin que la superficie totale des terres cultivées ou des pâturages corresponde exactement à la superficie totale dans les statistiques historiques.

Les zones naturelles contiennent moins de 1 % de la population et des immobilisations, par conséquent, une modélisation limitée est effectuée pour ces classes. Les zones où la végétation a brûlé (généralement des forêts) sont par définition une utilisation temporaire des terres. Les zones brûlées ont une durée de vie très courte : presque aucune des parcelles d'occupation du sol de cette classe (CLC 334) en 2012 n'était présente dans les inventaires CLC de 2006 ou 2018. Pour les années 2007-2017, la superficie brûlée a été supposée constante, tandis que pour les années 1870-2006 et 2018-2020, toutes les zones brûlées ont été supprimées de l'ensemble de données. Comme presque toutes les zones brûlées sont anciennement ou ultérieurement des classes CLC 311 à 324, cette étape de modélisation est effectuée après la redistribution des zones agricoles. Pourtant, il n'y a pas d'exposition dans les zones brûlées, et très peu d'exposition dans l'utilisation des terres précédente, sauf dans de rares cas.

Les espaces naturels sont ce qui reste après modélisation des zones artificielles, agricoles et brûlées ainsi que des réservoirs et des cas particuliers. Les espaces naturels couvriraient tout le continent sans activité humaine. Par conséquent, si un terrain devient inoccupé à la suite de la modélisation, on lui attribue la même couverture terrestre naturelle qui est typique dans son voisinage le plus proche. La couverture végétale naturelle typique (classes CLC 311–324 et 411–422) est définie comme la plus fréquente dans la VLAU. Le calcul est effectué séparément pour les forêts (CLC 311–313) et les autres terres naturelles (CLC 321–324 et 411–422), et le plus fréquent des deux groupes est utilisé. S'il n'y a pas de couverture naturelle dans la VLAU, la couverture terrestre végétale dominante de la région NUTS3 applicable est utilisée. Si aucune couverture végétale n'était localisée dans la région NUTS3, les terres inoccupées étaient supposées être couvertes d'arbustes boisés de transition (CLC 324), car il s'agit des terres naturelles non forestières les plus courantes dans la zone d'étude.

Après la première allocation, la superficie totale des forêts est comparée aux données historiques de la base de données NUTS3. S'il y a trop de superficie forestière dans une région NUTS3 donnée, les terres qui ont été attribuées à la forêt à cette étape sont converties de manière itérative dans la classe non forestière la plus fréquente, en commençant par la VLAU la plus densément peuplée. Inversement, s'il n'y a pas suffisamment de terres forestières, les cellules qui ont été attribuées à la végétation non forestière à cette étape sont converties de manière itérative dans la classe forestière la plus fréquente, en commençant par la VLAU la moins densément peuplée.

Toutes les autres terres naturelles, sans végétation et généralement interdites à la construction ou à l'agriculture, c'est-à-dire les plages, les dunes, les sables (CLC 331), les roches nues (CLC 332), les glaciers et les neiges éternelles (CLC 335), les plaines intertidales (CLC 423) et l'eau (CLC 511-523), ont été maintenus constants tout au long. Les parcelles de ces types de couverture terrestre sont supprimées de l'ensemble de données uniquement en relation avec la construction de réservoirs (étape 4) ou de polders (étape 1).

Les changements dans l'imperméabilisation des sols sont entièrement basés sur les transitions d'utilisation des terres, donc cette étape est effectuée après la modélisation de l'utilisation des terres, mais avant la désagrégation des données économiques. L'imperméabilisation des sols dans le jeu de données raster de référence est augmentée à la valeur moyenne pour une classe CLC donnée (tableau 8) lorsque les terres non artificielles deviennent artificielles, à moins qu'elles ne soient déjà supérieures à cette valeur. Pour le calcul en arrière dans le temps pour les pas de temps avant 2011, partout où des terres actuellement artificielles sont transformées en terres agricoles, le degré d'imperméabilisation du sol est réduit à 1 %. De même, il est ramené à 0 % en cas de transformation de terres agricoles ou artificielles en terres naturelles.

La désagrégation des données économiques suit des méthodes de cartographie dasymétrique, similaires à celles appliquées dans les études européennes52 ou mondiales53, y compris HANZE v1.0. Plusieurs révisions de ce dernier ont été introduites (tableau 9). Le PIB régional est divisé en partie proportionnellement à la population et en partie en fonction de l'utilisation des terres (avec imperméabilisation des sols le cas échéant). De cette manière, la main-d'œuvre (une partie de la population totale) et le capital (lié à l'utilisation des terres) du PIB sont représentés. La part du travail dans le PIB des pays avancés est d'environ 60 % et est restée relativement stable au fil du temps54. Ainsi, 60 % du PIB sont désagrégés en fonction de la population et les 40 % restants en fonction de l'utilisation des terres. Les immobilisations en termes absolus par région sont calculées en multipliant le PIB régional, ou un secteur de celui-ci, par le ratio respectif richesse/PIB pour chaque secteur, tel que défini par les variables « Immobilisations » (tableau 6). Les logements et les biens de consommation durables sont répartis en fonction de la population totale, car ils sont les plus étroitement liés à la répartition de la population. Les autres actifs, liés aux activités économiques, sont répartis selon les classes d'occupation des sols appropriées, proportionnellement au degré d'imperméabilisation des sols. Enfin, l'infrastructure est distribuée aux terrains urbains et industriels (classes CLC 111-121) proportionnellement à la surface couverte par les routes et les rues, et aux routes/voies ferrées, ports et aéroports (classes CLC 122-124) proportionnellement au degré de sol scellage.

Il existe également des hypothèses supplémentaires sur la désagrégation du PIB et de la richesse pour deux secteurs. Le secteur agricole comprend l'agriculture, la pêche et la foresterie, tandis que le secteur industriel comprend l'exploitation minière, la fabrication et les services publics. Une ventilation détaillée de ces sous-secteurs n'est pas disponible au niveau régional pour le PIB, ou pas du tout pour les actifs fixes, sauf pour un petit nombre de pays. Ainsi, le PIB régional et la richesse provenant de la foresterie et de l'exploitation minière ont été estimés en calculant des "indices d'efficacité" au niveau national. L'indice forestier a été compilé en calculant le PIB de l'agriculture (sans la foresterie) au niveau national par ha de terres agricoles du CLC et le PIB de la foresterie par ha de terres forestières. Ces valeurs ont été calculées pour l'année 2000 pour tous les pays et présentées comme l'efficacité de l'économie forestière par rapport aux autres agricultures en %. Ce ratio a été utilisé pour calculer la part relative de la foresterie dans le PIB régional pour une année donnée sur la base de la couverture/utilisation des sols modélisée pour cette année :

où G est le PIB, A est la superficie couverte par la couverture/l'utilisation des terres dans un secteur particulier, Ec est l'indice d'efficacité pour le pays c. Le secteur forestier est désigné par f, le secteur agricole (hors sylviculture) par a, la région NUTS3 par r et le pas de temps par t. Le PIB agricole sans foresterie est donc :

Le ratio richesse/PIB pour l'agriculture est utilisé à la fois pour la foresterie et les autres activités agricoles. Les mines et les carrières sont séparées des activités industrielles restantes (fabrication et services publics) à l'aide d'un indice d'efficacité minière, calculé comme l'indice forestier. De la même manière, il utilise la proportion de zones minières (CLC 131) par rapport aux zones industrielles (CLC 121) dans chaque région NUTS3 et le pas de temps pour désagréger les deux secteurs. Les équations 21 et 22 sont applicables en substituant les différents secteurs et types d'utilisation des terres. Le ratio richesse/PIB pour l'industrie est utilisé à la fois pour l'industrie minière et les autres industries.

L'ensemble de données disponible sur Zenodo55 se compose de trois éléments (tableau 10). Le premier est un ensemble de rasters GeoTIFF couvrant l'ensemble du domaine de 42 pays. Chaque raster a une résolution de 100 m et la référence spatiale européenne standard ETRS89/LAEA (EPSG:3035). Il existe un total de 195 jeux de données raster, une de chacune des cinq variables (couverture/utilisation du sol, population, PIB, immobilisations et imperméabilisation des sols) et 39 pas de temps (décennal 1870–1950, quinquennal 1950–2000 et annuel 2000– 2020). Les variables économiques sont évaluées en euros (EUR) en utilisant le niveau de prix constant et les taux de change des autres devises en 2020. Pour une visualisation plus rapide des grilles d'occupation/d'utilisation du sol, des fichiers de légende pour ArcGIS et QGIS sont également inclus dans le référentiel.

La deuxième partie sont des estimations de l'incertitude de l'exposition passée aux inondations. Il a été créé en utilisant la capacité du modèle à calculer des sorties probabilistes basées sur l'incertitude de la reconstruction de la distribution passée de la population et des transitions d'utilisation des terres (étapes de modélisation 2 et 10). Cependant, les distributions d'incertitude des cellules de grilles individuelles ne sont pas indépendantes, mais fortement corrélées, il n'a donc pas été possible de présenter les limites d'incertitude dans le même format que les ensembles de données raster de « meilleure estimation ». Par conséquent, ils doivent être calculés en échantillonnant le modèle et en agrégeant chaque itération pour des zones de danger définies. Les estimations d'incertitude dans le référentiel ont été créées à l'aide de cartes des risques d'inondation pour les événements de période de retour de 100 ans, tirées de Paprotny et al.56 pour les risques côtiers et d'Alfieri et al.57 pour les risques fluviaux. Les 5e, 20e, 50e, 80e et 95e centiles de la population, du PIB et de la valeur des immobilisations pour les 39 pas de temps sont contenus dans des fichiers séparés pour chaque région NUTS 3, variable et type de risque.

Les données d'entrée du modèle HANZE v2.0 qui ont été utilisées pour générer cet ensemble de données sont répertoriées dans les tableaux supplémentaires S3 à S6. Les bases de données d'entrée sur l'utilisation historique des terres, la population, le PIB, les actifs fixes ainsi que d'autres variables démographiques et économiques présentent un intérêt particulier pour les chercheurs. Les statistiques sont principalement au niveau NUTS 3 (certaines variables au niveau national), compilées dans cette étude et dans une étude précédente (HANZE v1.0)32 en harmonisant près de 400 sources de données distinctes, elles sont donc également incluses en tant que troisième partie des données de sortie (Tableaux 11, 12).

La validation des données d'exposition à haute résolution est un défi majeur en raison de la disponibilité limitée d'ensembles de données d'observation comparables29. Ici, nous utilisons les données disponibles sur la population et l'utilisation des terres pour la validation et comparons davantage les résultats avec d'autres ensembles de données modélisés publiés. La validation de la désagrégation des données économiques n'est actuellement pas possible en raison de l'absence totale de données d'observation.

Il y a un manque général de données de référence de population à très haute résolution, en partie pour des raisons de confidentialité29. La grille GEOSTAT 1 km - notre entrée pour la désagrégation de la population - est déjà artificiellement déformée dans certaines cellules de la grille en raison du "traitement de confidentialité". Il fournit la résolution la plus élevée disponible pour un produit d'observation. Par conséquent, nous avons préparé une désagrégation alternative de la population de 1 km à 100 m en utilisant la surface au sol des bâtiments résidentiels comme prédicteur, plutôt que des données agrégées sur l'utilisation des terres et l'imperméabilisation des sols. Nous utilisons des données vectorielles de construction à haute résolution (https://www.geoportal.gov.pl/dane/baza-danych-obiektow-topograficznych-bdot) pour les municipalités menacées par l'élévation du niveau de la mer en Pologne précédemment appliquées par Paprotny et Terefenko58, comme les données qu'ils ont utilisées étaient exactes en 2012-2013, ce qui est proche de notre année de référence. Dans chaque cellule de grille de 1 km entièrement dans la zone de validation, nous avons calculé la surface au sol résidentielle en m² en utilisant la surface des bâtiments résidentiels, multipliée par le nombre d'étages, par cellule de grille de 100 m de notre grille de population à haute résolution. La population a été répartie proportionnellement à la surface au sol dans chaque cellule de 100 m. Pour le calcul, nous avons exclu les résidences collectives dans lesquelles les personnes n'enregistrent normalement pas d'adresse, les résidences secondaires ou les bâtiments abandonnés.

Nous comparons nos résultats modélisés avec la désagrégation alternative et une désagrégation de 100 m précédemment publiée de GEOSTAT appelée GHS59. Ces grilles ont ensuite été recoupées avec des cartes paneuropéennes des risques d'inondation pour les côtes56 et les rivières57. Nous avons constaté que les grilles HANZE et GHS lissent trop la répartition spatiale de la population, comme l'indiquent les ratios de faux positifs (tableau 13). Près de 40 % des cellules peuplées de HANZE n'ont aucune population indiquée dans l'ensemble de données de référence, bien que dans la moitié de ces cas, la population indiquée ne soit qu'une ou deux personnes. Le taux de faux positifs est plus élevé dans GHS que dans HANZE et supérieur à 40 %. À l'inverse, HANZE indique rarement l'absence de population à tort : seulement 3,5 % des cellules non renseignées dans HANZE sont renseignées dans l'ensemble de données de référence. C'est moins que les 4,7 % du GHS (faux rapport négatif du tableau 13). L'exposition dans les zones inondables fluviales et côtières pour les municipalités de la zone côtière polonaise (avec au moins 30 personnes exposées) était généralement bien représentée, avec une erreur médiane supérieure à 10 % dans HANZE. HANZE a obtenu de meilleurs résultats que GHS pour les zones à risque d'inondation fluviale, bien que l'exposition aux inondations côtières ait été mieux modélisée par GHS. Une vérification finale des ensembles de données a été effectuée en regroupant la population par maille de 100 m dans des intervalles d'augmentation par facteur 2 : [0,1], [1,2], [2,4], [4,8] , [8,16] etc. Nous avons constaté que la population par cellule dans HANZE était à +/- 1 intervalle de l'ensemble de données de validation dans 53% des cas, ce qui est mieux que 44% calculé pour l'ensemble de données GHS.

Le niveau le plus détaillé auquel la validation des changements démographiques modélisés est possible est le niveau de la municipalité. Nous avons obtenu deux ensembles de données de référence à cette fin. Premièrement, nous utilisons l'ensemble de données paneuropéen (1960-2010) avec des données de population par unité administrative locale utilisées pour quantifier notre modèle (voir Texte supplémentaire S1). Deuxièmement, nous avons assemblé un ensemble de données avec une période plus longue pour l'Autriche sur la base des données de recensement historiques recalculées pour les municipalités actuelles par Statistik Austria (https://www.statistik.at/datenbanken/statcube-statistische-datenbank) et combinées avec un vecteur ensemble de données de leurs limites (https://www.data.gv.at/katalog/dataset/verwaltungsgrenzen-vgd-stichtagsdaten-grundstucksgenau). L'ensemble de données de population de référence qui en résulte couvre toute la durée de cette étude (1870-2020) et 2117 unités : toutes les municipalités plus les districts de Vienne (Fig. S9 supplémentaire). Pour une comparaison plus approfondie, nous utilisons le jeu de données HYDE 3.225, recalculé à partir d'une résolution de 5′ pour les municipalités. HANZE et HYDE utilisent des données démographiques infranationales désagrégées à la fois dans l'espace et dans le temps, ce qui en fait les produits d'exposition les plus comparables.

La précision de l'évolution de la population au niveau des unités administratives locales (UAL) a été analysée à l'aide de la différence absolue moyenne entre la population modélisée et observée par UAL par rapport à la population observée au cours d'une année donnée. Comme l'indique la figure 7a, l'erreur augmente à mesure que le temps s'écoule depuis l'année de référence, atteignant une moyenne d'environ 20 % en 1960 (dans les deux zones de validation) et 40 % en 1870 (en Autriche). Cependant, la majorité des UAL sont de petites communautés rurales, avec plus de la moitié des UAL en Europe comptant moins de 1000 habitants en 1960, et un tiers en Autriche en 1870 (tableau supplémentaire S7). Les LAU européennes et autrichiennes ont modifié leur population de plus d'un facteur deux depuis 1960 et 1870, respectivement. Par conséquent, les erreurs absolues sont généralement faibles (moins de 200 personnes dans la moitié des UAL en Europe). Dans les grandes LAU, les erreurs relatives sont plus faibles, bien qu'en Autriche en 1870, les erreurs en particulier les districts de Vienne dominaient le plus grand groupe de LAU. L'erreur varie selon les pays (Fig. 7b) et est en partie liée à la taille des UAL (relativement faible en France ou au Royaume-Uni, importante en Pologne et en Grèce) ou au nombre d'UAL par région NUTS3 (en moyenne 381 en France, mais seulement 28 en Allemagne). Les pays avec de grandes UAL ou de petites régions NUTS3 présentent des erreurs moins importantes. En général, HANZE présente des erreurs plus faibles que HYDE, à quelques exceptions près, par exemple en Autriche après 1980, bien que les changements de population au cours de cette période aient été plutôt faibles par rapport aux décennies précédentes. Parmi tous les grands pays, la France et la Belgique présentent des erreurs plus élevées dans HANZE que dans HYDE dans l'estimation de la population en 1960, tandis que parmi les petits pays, cela ne se produit que pour le Luxembourg et la Slovénie.

Précision de l'estimation du changement de population par rapport à l'ensemble de données HYDE. La mesure d'erreur (en %) indique la différence absolue moyenne de la population modélisée et observée par LAU par rapport à la population observée au cours d'une année donnée (a) et entre les pays en 1960 (b).

La validation de la couverture terrestre/du changement d'utilisation est basée sur des échantillons de CLC et de CLC-Changes de 2000 à 2018. Nous utilisons ces échantillons pour quantifier le modèle de transition d'utilisation des terres à l'étape 10, mais pour la validation, nous avons tiré un modèle supplémentaire sans chevauchement. échantillon aléatoire de transitions (CLC-Changes) et de non-transitions (la même classe dans différents inventaires CLC). Un total de 97 790 échantillons chacun pour les transitions et les non-transitions ont été utilisés (voir le texte supplémentaire S3 pour plus de détails sur la procédure d'échantillonnage). La quantité nette de terres qui ont fait la transition est connue à partir des statistiques historiques, par conséquent, un nombre défini de cellules avec la probabilité la plus élevée de transition selon le modèle de réseau bayésien est sélectionné. Une métrique de validation peut donc être le pourcentage de cellules les mieux classées, jusqu'à la quantité dont on sait qu'elle a fait la transition entre des classes d'utilisation des terres définies, qui a été correctement identifiée par le modèle. Comme le nombre de cellules dans différentes classes d'utilisation des terres varie, le taux de réussite doit être mis en contraste avec un résultat aléatoire, c'est-à-dire le taux de réussite de la sélection aléatoire de cellules d'utilisation des terres comme transition. Les résultats sont présentés dans le tableau 14. Dans tous les cas considérés de transitions d'utilisation des terres, le taux de réussite du modèle à identifier correctement les cellules en transition dans l'ensemble de données de validation est beaucoup plus élevé que si les cellules étaient choisies au hasard.

Les résultats globaux de la modélisation de la couverture/utilisation des terres dans HANZE sont comparés à HILDA22,23,24. Il a une résolution de 1 km, contenant les changements de couverture/utilisation des terres pour six classes (agrégées à partir de la classification CLC) de 1900 à 2010 sur un domaine de 29 pays et territoires. HILDA est principalement un modèle qui réaffecte l'utilisation des terres sur la base de statistiques historiques agrégées et de cartes de probabilité, de la même manière que HANZE et HYDE. Cependant, il intègre également, dans la mesure du possible, des cartes historiques numérisées. D'autre part, HILDA se concentre principalement sur les terres agricoles et leur interaction avec la végétation naturelle, ce qui présente moins d'intérêt dans cette étude en raison de l'exposition relativement faible liée à ces catégories de couverture terrestre.

HILDA indique quelques similitudes importantes avec HANZE. La superficie des surfaces artificielles a une tendance très similaire dans les deux ensembles de données entre 1900 et 1990 (Fig. 8a), même si HANZE n'a été calibré que pour les années 2000 à 2018. Cela indique que les processus sous-jacents ne changent pas fortement au fil du temps et que le modèle est également applicable aux périodes précédant la période d'étalonnage. HILDA indique presque aucune croissance de la surface artificielle après 1990, contrairement à HANZE. Cependant, CLC et d'autres ensembles de données indiquent une forte croissance. Par exemple, les données de l'enquête LUCAS sur l'utilisation des terres (https://ec.europa.eu/eurostat/statistics-explained/index.php?title=LUCAS_-_Land_use_and_land_cover_survey) pour 23 pays montrent qu'une expansion artificielle de la surface de 11 % dans seulement neuf ans (2009-2018). Le changement des terres cultivées est similaire dans les deux ensembles de données (Fig. 8b), car des sources de données largement similaires ont été utilisées après 1950. Avant cette date, HANZE utilisait diverses données statistiques nationales, tandis que HILDA interpolait des statistiques historiques ou des cartes de 1950 à 1900. Les ensembles de données diffèrent considérablement pour pâturages et forêts. HILDA indique une forte diminution de la superficie couverte par les pâturages, qui sont remplacés principalement par des forêts. En revanche, les statistiques historiques recueillies pour HANZE n'indiquent pas une tendance similaire trouvée dans HILDA. Cependant, cela pourrait aussi être dû en partie au fait qu'il n'y a pas de modèle détaillé pour les transitions entre la couverture forestière et les autres terres naturelles dans HANZE. Par conséquent, le reboisement de divers types de terres naturelles qui relèvent de la catégorie "pâturages" dans HILDA n'est pas pris en compte par notre modèle. En raison de la très faible exposition et de la variation négligeable de cette exposition due à de telles transitions, nous ne les traitons pas avec un modèle plus détaillé. Enfin, HILDA indique étonnamment une diminution de la superficie couverte par l'eau, ce qui est à l'opposé de HANZE, où la construction de réservoirs conduit à l'expansion globale des masses d'eau en Europe.

Surfaces artificielles en milliers de km2 (a) et autres principales classes d'utilisation des terres par rapport à l'année 2010 (b) dans HANZE (cette étude) et HILDA, pour les 29 pays et six classes agrégées de couverture/utilisation des sols CLC disponibles dans HILDA.

Aucun ensemble de données ne couvre l'imperméabilisation des sols, quelle qu'en soit la source, sur une période plus longue. Une comparaison pourrait être faite à l'aide d'un ensemble de données récemment publié sur les empreintes de bâtiments en Espagne (HISDAC60), couvrant les années 1900-2020. L'ensemble de données est basé sur des données cadastrales qui enregistrent l'année de construction des bâtiments. Même si les bâtiments ne constituent qu'une partie des surfaces étanches, nous avons comparé la couverture moyenne des bâtiments et des surfaces étanches pour 8109 municipalités en Espagne européenne (c'est-à-dire sans Ceuta, Melilla et les îles Canaries) entre 1900 et 2020 à partir de HANZE et HISDAC. À titre de comparaison supplémentaire, nous avons calculé la surface d'accumulation moyenne entre 1975 et 2020 à partir de la couche mondiale des établissements humains (GHSL61), qui tire ces informations de l'imagerie satellitaire. Dans ce domaine, la couverture moyenne en 2010 (la plus proche de l'année de référence) est de 1,17 % pour HANZE (étanchéité du sol), 0,64 % pour GHSL (surfaces construites) et 0,50 % pour HISDAC (empreinte du bâtiment). Malgré la différence de définition, HANZE est plus corrélé avec les deux ensembles de données que HISDAC avec GHSL (Fig. 9a), qui devrait être plus étroitement lié. En remontant plus loin dans le passé, les corrélations diminuent, mais pour 1975-2020, la corrélation entre HISDAC et HANZE reste plus élevée qu'entre HISDAC et GHSL. Pour les changements à court terme (Fig. 9b), les trois ensembles de données montrent une très faible corrélation, avec des augmentations avec la période de temps sur laquelle les changements sont analysés. En 1975, les changements dans HISDAC sont plus corrélés avec HANZE qu'avec GHSL. Les tendances des empreintes de construction dans HISDAC montrent une corrélation stable avec les tendances de l'imperméabilisation des sols HANZE pour la période 1900–1960. Considérant que HANZE ne modélise pas explicitement (partiellement ou totalement) les changements dans les surfaces artificielles avec une exposition relativement faible (par exemple, les routes secondaires et les voies ferrées, les décharges, les espaces de loisirs urbains, etc.), les résultats indiquent que le modèle peut capturer à long terme , variation intra-pays de l'imperméabilisation des sols.

Comparaison de la corrélation entre trois ensembles de données d'occupation des sols artificiels (% de la superficie totale) agrégées aux municipalités d'Espagne, (a) à un pas de temps donné ou (b) des différences entre un pas de temps donné et 2020.

L'objectif principal de la création de l'ensemble de données d'exposition HANZE était de calculer l'exposition aux catastrophes naturelles passées, puis d'ajuster les pertes signalées pour divers événements à une année de référence commune (communément appelée « normalisation » des données de perte17). Paprotny et al.16 ont utilisé HANZE pour normaliser les pertes pour 1564 événements d'inondation entre 1870 et 2016. Dans cette nouvelle itération de HANZE, le code est accessible au public pour des analyses plus approfondies. Tous les ensembles de données d'entrée (tableaux supplémentaires S3 à S6) sont disponibles dans un référentiel62, l'utilisateur n'a donc qu'à les télécharger et à modifier le chemin défini vers le dossier contenant les données. Ensuite, le code63 peut être exécuté en utilisant les options de base intégrées dans le code, qui sont :

générant cinq rasters d'exposition (couverture/utilisation du sol, population, PIB, immobilisations, imperméabilisation des sols) au format GeoTIFF et à une résolution de 100 m. Une seule année ou plusieurs années parmi celles incluses dans la base de données (10 ans 1870–1950, 5 ans 1950–2000, annuelle 2000–2020) pourraient être exécutées. En outre, toutes les régions NUTS3 pourraient être incluses, ou seulement une seule région NUTS3, ou plusieurs régions. Les ensembles de données d'exposition en sortie sont également disponibles dans le référentiel, car même si le modèle est plutôt efficace compte tenu de sa résolution (environ une heure pour un pas de temps pour toutes les régions NUTS3), le calcul des 39 pas de temps de l'étude nécessiterait des ressources ou du temps importants.

calcul de l'exposition (population, PIB, immobilisations) par zone de danger. Un fichier raster avec la même étendue spatiale que les autres fichiers raster en entrée est nécessaire pour cela. Des fichiers d'exemple sont fournis dans le référentiel, qui permettent de reproduire l'analyse présentée dans cette section. En utilisant cette option, un fichier texte avec des données (pour les années définies par l'utilisateur) est enregistré séparément pour chaque région NUTS3.

calculer l'exposition avec des limites d'incertitude par zone de danger. Il s'agit d'une extension de l'option précédente, qui enregistre un fichier texte par région et variable (population, PIB, immobilisations) avec les 5e, 20e, 50e, 80e et 95e centiles.

Le code permet également, pour la reproductibilité, de calculer certaines des données d'entrée. De nombreux ensembles de données d'entrée nécessitaient des préparations ponctuelles approfondies, par conséquent, seules certaines étapes de prétraitement pouvaient être incluses. Il est important de noter que la routine de désagrégation de la population décrite et validée dans cette étude peut être réexécutée. Les seuils de population pour la cartographie dasymétrique peuvent également être recalculés, ainsi que les cartes de probabilité utilisées dans la modélisation de l'utilisation des terres (étape 10). Le code permettant de reproduire la validation du changement de population et du changement d'affectation des terres est également inclus. Enfin, le code permet de visualiser des informations d'exposition sélectionnées par événement d'inondation (à partir de la base de données HANZE v1.0 des inondations passées) sous forme de graphiques et de cartes. Pour toute région NUTS3 définie par l'utilisateur, le code peut générer une carte d'exposition similaire à la Fig. 10.

Un exemple de croissance modélisée de l'exposition dans les environs de Munich (région NUTS DE212), dans le sud de l'Allemagne, entre 1870 et 2020, en contraste avec une carte des crues fluviales sur 100 ans (ombrage gris). Zone inondable selon Alfieri et al.57.

Cinq exemples illustratifs d'inondations passées sont présentés dans le tableau 15 pour souligner à quel point les changements d'exposition peuvent être variés et parfois incertains. Ils dépendent non seulement de la date à laquelle l'événement s'est produit dans le passé (l'incertitude augmente avec le temps), mais aussi du fait qu'il s'est produit dans les zones d'expansion des villes (où l'incertitude est la plus élevée) par rapport à une zone essentiellement rurale, ou dans quelle partie d'un La région NUTS 3 est à risque (la population ou les actifs par région étant définis par des statistiques historiques, il n'y aurait aucune incertitude si toute la région était une zone à risque). Les cartes des zones touchées, générées à l'aide du code du modèle, sont présentées dans la Fig. S10 supplémentaire. À l'avenir, nous prévoyons d'utiliser le modèle pour attribuer les impacts des inondations aux facteurs environnementaux et économiques en reliant plus directement HANZE aux modèles climatiques et hydrologiques64,65.

Les utilisateurs doivent être conscients des limites (par exemple, toutes les classes d'utilisation des terres ne sont pas couvertes par le modèle, seules les plus importantes) et des incertitudes (liées à la fois à l'approche de modélisation et à la qualité des données d'entrée). Ils ont été largement discutés en relation avec HANZE v1.0, nous renvoyons donc le lecteur à Paprotny et al.32. À l'avenir, nous prévoyons d'utiliser le modèle pour attribuer les impacts historiques des inondations aux facteurs environnementaux et économiques.

Le code source de HANZE v2.0 (implémenté en Python 3.9) présenté dans l'article est archivé sur https://doi.org/10.5281/zenodo.755695363. Toutes les données d'entrée nécessaires sont archivées sur https://doi.org/10.5281/zenodo.678302362. Les données sur l'impact des inondations présentées dans les notes d'utilisation, avec une description des sources des données, sont disponibles dans le référentiel HANZE v1.066, https://doi.org/10.4121/collection:HANZE.

Grant, L. et al. L'attribution des systèmes lacustres mondiaux change au forçage anthropique. Nat. Géosci. 14, 849–854 (2021).

Article ADS CAS Google Scholar

Gudmundsson, L. et al. Tendances observées à l'échelle mondiale du débit moyen et extrême des cours d'eau attribuées au changement climatique. Sciences 371, 1159-1162 (2021).

Article ADS CAS PubMed Google Scholar

GIEC. Changement climatique 2022 : impacts, adaptation et vulnérabilité. Contribution du groupe de travail II au sixième rapport d'évaluation du Groupe d'experts intergouvernemental sur l'évolution du climat (Cambridge University Press, 2022).

Metin, AD et al. Comment les changements le long de la chaîne des risques affectent-ils le risque d'inondation ? Nat. Dangers Terre Syst. Sci. 18, 3089-3108 (2018).

Annonces d'article Google Scholar

Vousdoukas, MI et al. Comprendre l'incertitude épistémique dans l'évaluation des risques d'inondation côtière à grande échelle pour les climats actuels et futurs. Nat. Dangers Terre Syst. Sci. 18, 2127-2142 (2018).

Annonces d'article Google Scholar

Carisi, F., Schröter, K., Domeneghetti, A., Kreibich, H. & Castellarin, A. Développement et évaluation de modèles uni- et multivariables de pertes dues aux inondations pour l'Émilie-Romagne (Italie). Nat. Dangers Terre Syst. Sci. 18, 2057-2079 (2018).

Annonces d'article Google Scholar

Huizinga, J., de Moel, H. & Szewczyk, W. Fonctions globales de dommages à la profondeur des inondations. Méthodologie et base de données avec lignes directrices. Rapport EUR 28552 EN (Office des publications de l'Union européenne, 2017).

Jongman, B. et al. Évaluation comparative des modèles de dommages causés par les inondations : vers une approche européenne. Nat. Dangers Terre Syst. Sci. 12, 3733–3752 (2012).

Annonces d'article Google Scholar

Paprotny, D. et al. Une approche probabiliste pour estimer les pertes résidentielles de différents types d'inondations. Nat. Dangers 105, 2569–2601 (2021).

Article Google Scholar

Barredo, JI Pas de tendance à la hausse des pertes normalisées causées par les tempêtes en Europe : 1970–2008. Nat. Dangers Terre Syst. Sci. 10, 97-104 (2010).

Annonces d'article Google Scholar

Dawkins, LC, Stephenson, DB, Lockwood, JF & Maisey, PE Le déclin du XXIe siècle des tempêtes de vent européennes dommageables. Nat. Dangers Terre Syst. Sci. 16, 1999–2007 (2016).

Annonces d'article Google Scholar

Welker, C., Röösli, T. & Bresch, DN Comparaison du point de vue d'un assureur sur les dommages aux bâtiments avec les dommages modélisés d'événements paneuropéens de tempêtes hivernales : une étude de cas à Zurich, en Suisse. Nat. Dangers Terre Syst. Sci. 21, 279–299 (2021).

Annonces d'article Google Scholar

Ganteaume, A. et al. Un examen des principaux facteurs déterminants de l'allumage des incendies de forêt en Europe. Environ. Gérer. 51, 651–662 (2013).

Article ADS PubMed Google Scholar

Barredo, JI Pertes dues aux inondations normalisées en Europe : 1970–2006. Nat. Dangers Terre Syst. Sci. 9, 97-104 (2009).

Annonces d'article Google Scholar

McAneney, J. et al. Pertes d'assurance normalisées dues aux catastrophes naturelles australiennes : 1966-2017. Environ. Dangers 18, 414–433 (2019).

Article Google Scholar

Paprotny, D., Sebastian, A., Morales Nápoles, O. & Jonkman, SN Tendances des pertes dues aux inondations en Europe au cours des 150 dernières années. Nat. Commun. 9, 1985 (2018).

Article ADS PubMed PubMed Central Google Scholar

Pielke, R. « Normalisation » économique des pertes dues aux catastrophes 1998-2020 : revue et évaluation de la littérature. Environ. Dangers 20, 93–111 (2021).

Article Google Scholar

Simmons, KM, Sutter, D. & Pielke, R. Dégâts de tornade normalisés aux États-Unis : 1950–2011. Environ. Dangers 12, 132–147 (2013).

Article Google Scholar

Scussolini, P. et al. FLOPROS : une base de données mondiale évolutive sur les normes de protection contre les inondations. Nat. Dangers Terre Syst. Sci. 16, 1049-1061 (2016).

Annonces d'article Google Scholar

Formetta, G. & Feyen, L. Preuve empirique de la diminution de la vulnérabilité mondiale aux aléas liés au climat. Environ global. Chang. 57, 101920 (2019).

Article Google Scholar

Sebastian, A., Gori, A., Blessing, RB, van der Wiel, K. & Bass, B. Démêler les impacts des changements humains et environnementaux sur la réponse du bassin versant lors de l'ouragan Harvey. Environ. Rés. Lett. 14, 124023 (2019).

Annonces d'article Google Scholar

Fuchs, R., Herold, M., Verburg, PH & Clevers, JGPW Une approche de modèle à haute résolution et harmonisée pour reconstruire et analyser les changements historiques des terres en Europe. Biogéosciences 10, 1543–1559 (2013).

Annonces d'article Google Scholar

Fuchs, R., Herold, M., Verburg, PH, Clevers, JGPW & Eberle, J. Gross changes in reconstructions of history land cover/use for Europe between 1900–2010. Glob. Changer Biol. 21, 299-313 (2014).

Annonces d'article Google Scholar

Fuchs, R., Verburg, PH, Clevers, JGPW & Herold, M. Le potentiel des anciennes cartes et encyclopédies pour reconstruire l'évolution historique de la couverture/utilisation des terres continentales. Appl. Géogr. 59, 43-55 (2015).

Article Google Scholar

Klein Goldewijk, K., Beusen, A., Doelman, J. & Stehfest, E. Estimations de l'utilisation anthropique des terres pour l'Holocène – HYDE 3.2. Terre Syst. Sci. Données 9, 927–953 (2017).

Annonces d'article Google Scholar

Frieler, K. et al. Évaluation des impacts d'un réchauffement climatique de 1,5 °C - protocole de simulation du projet d'intercomparaison des modèles d'impact inter-sectoriels (ISIMIP2b). Géosci. Modèle Dév. 10, 4321–4345 (2017).

Annonces d'article Google Scholar

Geiger, T. Série chronologique continue du produit intérieur brut (PIB) national pour 195 pays : observations passées (1850-2005) harmonisées avec les projections futures selon les voies socio-économiques partagées (2006-2100). Terre Syst. Sci. Données 10, 847–856 (2018).

Annonces d'article Google Scholar

Sauer, I. et al. Les signaux climatiques dans les dommages causés par les inondations fluviales apparaissent dans le cadre d'une désagrégation régionale solide. Nat. Commun. 12, 2128 (2021).

Article ADS CAS PubMed PubMed Central Google Scholar

Leyk, S. et al. L'allocation spatiale de la population : un examen des produits de données démographiques maillées à grande échelle et de leur aptitude à l'emploi. Terre Syst. Sci. Données 11, 1385–1409 (2019).

Annonces d'article Google Scholar

Kummu, M., Taka, M. & Guillaume, JHA Ensembles de données mondiales maillées pour le produit intérieur brut et l'indice de développement humain sur la période 1990-2015. Sci. Données 5, 180004 (2018).

Article PubMed PubMed Central Google Scholar

Eberenz, S., Stocker, D., Röösli, T. & Bresch, DN Données sur l'exposition des actifs pour l'évaluation des risques physiques mondiaux. Terre Syst. Sci. Données 12, 817–833 (2020).

Annonces d'article Google Scholar

Paprotny, D., Morales-Nápoles, O. & Jonkman, SN HANZE : une base de données paneuropéenne sur l'exposition aux risques naturels et les inondations historiques dommageables depuis 1870. Earth Syst. Sci. Données 10, 565–581 (2018).

Annonces d'article Google Scholar

Paprotny, D., Morales-Nápoles, O. & Jonkman, SN Modélisation paneuropéenne efficace des risques d'inondation fluviale grâce à une combinaison de modèles statistiques et physiques. Nat. Dangers Terre Syst. Sci. 17, 1267-1283 (2017).

Annonces d'article Google Scholar

Vousdoukas, MI et al. Évolution de la cartographie à grande échelle des risques d'inondation côtière. Nat. Dangers Terre Syst. Sci. 16, 1841–1853 (2016).

Annonces d'article Google Scholar

Barendrecht, MH et al. Intérêt des données empiriques pour estimer les paramètres d'un modèle sociohydrologique de risque d'inondation. Ressource en eau. Rés. 55, 1312-1336 (2019).

Article ADS CAS PubMed PubMed Central Google Scholar

Zanardo, S., Nicotina, L., Hilberts, AGJ & Jewson, SP Modulation des pertes économiques dues aux inondations européennes par l'oscillation nord-atlantique. Géophys. Rés. Lett. 46, 2563-2572 (2019).

Annonces d'article Google Scholar

Batista et Silva, F., Gallego, J. & Lavalle, C. Une carte quadrillée de population à haute résolution pour l'Europe. J. Cartes 9, 16–28 (2013).

Article Google Scholar

Eicher, CL & Brewer, CA Cartographie dasymétrique et interpolation surfacique : mise en œuvre et évaluation. Cartogr. Géogr. Inf. Sc. 28, 125-138 (2001).

Article Google Scholar

Gallego, FJ Une grille de densité de population de l'Union européenne. Popul. Environ. 31, 460–473 (2010).

Article Google Scholar

Contributeurs d'OpenStreetMap. OpenStreetMap https://www.openstreetmap.org/ (2022).

Paprotny, D., Kreibich, H., Morales-Nápoles, O., Terefenko, P. & Schröter, K. Estimation de l'exposition des actifs résidentiels aux risques naturels en Europe à l'aide de données ouvertes. Nat. Dangers Terre Syst. Sci. 20, 323–343 (2020).

Annonces d'article Google Scholar

Paprotny, D. Exposition résidentielle aux risques naturels en Europe, 2000–2020. Zenodo https://doi.org/10.5281/zenodo.6573503 (2022).

Gløersen, E. & Lüer, C. Collecte de données démographiques pour les unités administratives locales européennes à partir de 1960 - rapport final (Spatial Foresight GmbH, 2013).

Clark, C. Densités de population urbaine. Statistique JR. Soc. A 114, 490–496 (1951).

Article Google Scholar

Clark, C. Croissance démographique et utilisation des terres (Macmillan, 1967).

Hourihan, K. Modèles de densité de population urbaine et changement en Irlande, 1901–1979. Écon. Soc. Rév. 13, 125–147 (1982).

Google Scholar

Joe, H. Modélisation de la dépendance avec copules (Chapman & Hall/CRC, 2014).

Genest, C., Rémillard, B. & Beaudoin, D. Tests d'ajustement pour les copules : une revue et une étude de puissance. Assur. Mathématiques. Écon. 44, 199-213 (2009).

Article MathSciNet MATH Google Scholar

Eurostat. Manuel méthodologique sur les typologies territoriales, édition 2018 (Office des publications de l'Union européenne, 2019).

Klein Goldewijk, K., Beusen, A., de Vos, M. & van Drecht, G. La base de données spatialement explicite HYDE 3.1 sur les changements d'utilisation des terres induits par l'homme au cours des 12 000 dernières années. Écol mondial. Biogéogr. 20, 73–86 (2011).

Article Google Scholar

DHI GRAS. Validation statistique EU-DEM (Agence européenne pour l'environnement, 2014).

Murakami, D. & Yamagata, Y. Estimation de scénarios maillées de population et de PIB avec réduction d'échelle statistique spatialement explicite. Durabilité 11, 2106 (2019).

Article Google Scholar

Batista e Silva, F. et al. HARCI-EU, un ensemble de données maillées harmonisées des infrastructures critiques en Europe pour les évaluations des risques à grande échelle. Sci. Données 6, 126 (2019).

Article PubMed PubMed Central Google Scholar

OIT & OCDE. La part du travail dans les économies du G20. Rapport préparé pour le groupe de travail du G20 sur l'emploi (sommet du G20 à Antalya, 2015).

Paprotny, D. Cartes d'exposition paneuropéennes et estimations d'incertitude du modèle HANZE v2.0, 1870–2020. Zenodo https://doi.org/10.5281/zenodo.7885990 (2022).

Paprotny, D., Morales Nápoles, O., Vousdoukas, MI, Jonkman, SN & Nikulin, G. Précision de la cartographie paneuropéenne des inondations côtières. J. Gestion des risques d'inondation. 12, e12459 (2019).

Article Google Scholar

Alfieri, L. et al. Avancées dans la cartographie paneuropéenne des risques d'inondation. Hydrol. Processus. 28, 4067–4077 (2014).

Annonces d'article Google Scholar

Paprotny, D. & Terefenko, P. Nouvelles estimations des impacts potentiels de l'élévation du niveau de la mer et des inondations côtières en Pologne. Nat. Dangers 85, 1249-1277 (2017).

Article Google Scholar

Freire, S., Halkia, M. & Pesaresi, M. Grille de population GHS, dérivée des données de recensement EUROSTAT (2011) et ESM R2016. Catalogue de données du Centre commun de recherche http://data.europa.eu/89h/jrc-ghsl-ghs_pop_eurostat_europe_r2016a (2016).

Uhl, JH et al. HISDAC-ES : Compilation de données historiques sur les établissements humains pour l'Espagne (1900–2020), Earth Syst. Sci. Discutez des données. [preprint], https://doi.org/10.5194/essd-2023-53, en révision, (2023).

Schiavina, M. et al. GHSL Data Package 2022 (Office des publications de l'Union européenne, 2022).

Paprotny, D. HANZE v2.0 données d'entrée du modèle d'exposition. Zenodo https://doi.org/10.5281/zenodo.6583023 (2022).

Paprotny, modèle d'exposition D. HANZE v2.0. Zenodo https://doi.org/10.5281/zenodo.7556953 (2022).

Mengel, M., Treu, S., Lange, S. & Frieler, K. ATTRICI v1.1 – climat contrefactuel pour l'attribution de l'impact. Géosci. Modèle Dév. 14, 5269–5284 (2021).

Annonces d'article Google Scholar

Steinhausen, M. et al. Facteurs de changement des futurs risques d'inondation fluviale pour les bâtiments résidentiels en Europe. Environ global. Chang. 76, 102559 (2022).

Article Google Scholar

Paprotny, D. HANZE : Analyse historique des risques naturels en Europe. 4TU.ReseachData https://doi.org/10.4121/collection:HANZE (2017).

Télécharger les références

Cette recherche a été soutenue par la Fondation allemande pour la recherche (DFG) dans le cadre du projet "Décomposition des pertes dues aux inondations par les facteurs environnementaux et économiques" (FloodDrivers), subvention no. 449175973. Nous remercions Diego Rybski, Yunfei Li et Manon Glockmann pour les discussions techniques sur la méthodologie de l'ensemble de données.

Financement Open Access activé et organisé par Projekt DEAL.

Potsdam Institute for Climate Impact Research (PIK), membre de l'association Leibniz, PO Box 60 12 03, 14412, Potsdam, Allemagne

Dominik Paprotny & Matthias Mengel

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

DP a développé le concept, mis en œuvre les méthodes, écrit le code, produit les données et obtenu le financement. MM a supervisé les travaux. Tous les auteurs ont rédigé l'article.

Correspondance à Dominik Parotny.

Les auteurs ne déclarent aucun intérêt concurrent.

Note de l'éditeur Springer Nature reste neutre en ce qui concerne les revendications juridictionnelles dans les cartes publiées et les affiliations institutionnelles.

Libre accès Cet article est sous licence Creative Commons Attribution 4.0 International, qui permet l'utilisation, le partage, l'adaptation, la distribution et la reproduction sur n'importe quel support ou format, à condition que vous accordiez le crédit approprié à l'auteur ou aux auteurs originaux et à la source, fournissez un lien vers la licence Creative Commons et indiquez si des modifications ont été apportées. Les images ou tout autre matériel tiers dans cet article sont inclus dans la licence Creative Commons de l'article, sauf indication contraire dans une ligne de crédit au matériel. Si le matériel n'est pas inclus dans la licence Creative Commons de l'article et que votre utilisation prévue n'est pas autorisée par la réglementation légale ou dépasse l'utilisation autorisée, vous devrez obtenir l'autorisation directement du détenteur des droits d'auteur. Pour voir une copie de cette licence, visitez http://creativecommons.org/licenses/by/4.0/.

Réimpressions et autorisations

Paprotny, D., Mengel, M. Estimations de la population, de l'utilisation des terres et de l'exposition économique pour l'Europe à une résolution de 100 m de 1870 à 2020. Sci Data 10, 372 (2023). https://doi.org/10.1038/s41597-023-02282-0

Télécharger la citation

Reçu : 24 janvier 2023

Accepté : 31 mai 2023

Publié: 08 juin 2023

DOI : https://doi.org/10.1038/s41597-023-02282-0

Toute personne avec qui vous partagez le lien suivant pourra lire ce contenu :

Désolé, aucun lien partageable n'est actuellement disponible pour cet article.

Fourni par l'initiative de partage de contenu Springer Nature SharedIt

Blog

Estimations de la population, de l'utilisation des terres et de l'exposition économique pour l'Europe à une résolution de 100 m de 1870 à 2020