par Jean Denègre Ecole Nationale des Sciences Géographiques Ecrire 
|
|
|
Présentation
des bases de données
|
| |

Le sytème de gestion
de base de données ou SGBD assure l'interface (accès, mise
à jour, conservation) entre les données et les applications
externes qui en sont faites |
|
Les bases de données géographiques sont les outils opérationnels
qui permettent d'organiser et de gérer l'information géographique sous
forme numérique.
Ce sont des ensembles structurés de fichiers décrivant les objets ou phénomènes
localisés sur la Terre (avec leurs attributs et leurs relations nécessaires
à la modélisation de l'espace géographique).
Ces ensembles sont munis d'un système de gestion permettant de les tenir
à jour, de les archiver et de les diffuser.
Les bases de données constituent le socle sur lequel s'appuient
les systèmes d'information géographique, qui analysent et exploitent les
données pour en tirer des informations utiles à la décision.
|
|
|
|
|
|
Définition
|
Qu'est-ce qu'une base de données?
|
|
Une base de données (en anglais database) est une "structure
de données permettant de recevoir, de stocker et de fournir à la demande
des données à de multiples utilisateurs indépendants" (définition
AFNOR-ISO, dictionnaire de l'informatique, 1989).
|
|
|
|
Modélisation
|
Qu'est-ce que le modèle d'une base de données géographiques?
|
|
La réalité d'un territoire peut être représentée (on
dit aussi "modélisée") par une base de données géographiques décrivant
tous les objets ou phénomènes présents sur ce territoire, ainsi que les
relations entre ces objets. Ce modèle de la réalité est en fait une schématisation
du monde réel, dont la complexité est trop grande pour être tout entière
représentée par une ou même plusieurs bases de données géographiques.
De plus, comme pour les cartes, la description des objets dans les bases
de données est étroitement liée à l'échelle de représentation à laquelle
on travaille.
|
|
Exemple : la forêt de Fontainebleau, représentée sur
un globe terrestre (échelle : 1:40 000 000), sera figurée par un simple
point. Sur une carte à petite échelle, par ex; une carte routière au 1:250
000, elle sera représentée par un ensemble de polygones de forme complexe,
avec des enclaves (les clairières, les villages, ...) et des noms correspondant
aux différents massifs forestiers. A des échelles beaucoup plus grandes
(carte forestière par ex.), on peut aller jusqu'à identifier chaque arbre,
avec son essence, son âge, sa hauteur, son volume, et ainsi de suite.
|
|
Toute base de données représente une modélisation particulière
de la réalité, et donc une généralisation plus ou moins poussée de celle-ci.
Comment décrire les objets localisés sous forme numérique ? De même que
sur une carte, interviennent trois catégories de descripteurs : la nature
et les attributs de l'objet, la localisation et la forme de l'objet et
les relations de construction
|
|
- la nature et les attributs de l'objet (la sémantique),
comme ceux qui sont définis dans la légende et les écritures de la carte,
mais qui peuvent être beaucoup plus complets et précis,
|
|
- la localisation et la forme de l'objet (la géométrie),
pour laquelle on définit trois formes principales de représentation :
point, ligne et surface, un objet pouvant d'ailleurs être représenté par
plusieurs de ces formes (ex. une route avec ses deux bords, et formée
de tronçons successifs).
|
|
|
|
|
Il faut donc assurer la correspondance entre l'objet
sémantique et sa traduction géométrique, par ce qu'on appelle les "relations
de construction". A cela s'ajoutent d'autres types de relations, qui
peuvent être évidentes ou implicites sur une carte, mais qu'il faut modéliser
explicitement dans une base de données : par ex. les relations de voisinage
ou d'appartenance.
|
|
|
|
Pour être plus précis, on distingue trois types de relations entre objets
:
|
Les relations spatiales
|
|
|
Les plus évidentes sur une carte, comme deux bâtiments
voisins (adjacence), ou deux routes qui s'intersectent (connectivité),
ou une clairière incluse dans une forêt (inclusion) (voir figure 2) ;
on les appelle aussi relations topologiques (logique de l'espace), les
termes utilisés pour les formes graphiques élémentaires dans la théorie
des graphes étant : polygones (ou faces, pour les surfaces), arcs (limites
des polygones) et nœuds (extrémités des arcs).
|
Les relations de composition
|
 |
|
La plupart des objets, relativement complexes, sont en
fait constitués d'objets plus simples, comme on le voit souvent sur une
carte. Par exemple, un aéroport est composé de pistes, de bâtiments, d'espaces
en herbe, etc. (voir figure 3). Ces relations de composition décrivent
l'appartenance d'un objet à un autre objet. Les objets dits "élémentaires"
sont ceux qui se construisent directement avec leurs formes géométriques
(relations de construction) ; cette notion dépend de l'échelle à laquelle
on travaille : dans l'exemple précédent, la forêt de Fontainebleau est
un objet élémentaire au 1:40 000 000 mais devient un objet complexe aux
échelles plus grandes.
|
Les relations sémantiques
|
 |
|
Les relations sémantiques décrivent toutes les autres
sortes possibles de relations logiques entre objets (voir figure 3) :0
elles portent généralement sur la fonction ou les attributs des objets.
Exemples : tel cours d'eau est affluent de tel autre, tel bâtiment appartient
à tel propriétaire, telle route franchit telle voie ferrée, etc.. Ces
relations peuvent être aussi nombreuses et détaillées que le permet l'informatique,
ce qui n'est pas le cas pour la carte-papier.
L'ensemble de ces quatre types de relations (de construction,
spatiales, de composition, sémantiques) permet de modéliser complètement,
selon la schématisation retenue, en termes de thèmes et d'échelle, l'espace
géographique concerné. On appelle "modèle conceptuel de données" le diagramme
représentant, avec différents symboles, l'ensemble des objets, leurs attributs
et leurs 4 types de relations.
|
|
 
|
|
Requêtes
|
Comment interroge-t-on une base de données géographiques?
|
|
Toutes les questions que l'on peut poser à une carte
doivent pouvoir être traitées de même à l'aide d'une base de données géographiques.
De plus, celle-ci peut répondre à des questions beaucoup plus complexes,
grâce à la richesse des attributs et à la souplesse des relations entre
objets, notamment sémantiques et topologiques. Exemples, en allant du
plus simple au plus compliqué :
- Où se trouve la commune de Mauperthuis ?
- Où se trouvent tous les bâtiments de la commune de Mauperthuis ?
- Quels sont les bâtiments situés à moins d'1 km de l'église de Mauperthuis
?
- Quels sont les bâtiments de plus de 2 étages et situés à moins d'1 km
de l'église ?
- Quels sont les bâtiments de plus de 2 étages, situés à moins d'1 km
de l'église, construits depuis plus de 10 ans et comprenant une cour intérieure
?
|
|
|

La réponse passe
par un calcul d'intersection de polygones puis par une méthode d'interpolation
(par exemple en supposant une densité uniforme de la population dans
chaque commune) |
|
|
|
Toutes ces questions (qu'on appelle des requêtes) peuvent
être traitées en se basant sur les attributs des objets, sur leurs relations
sémantiques, spatiales ou de composition, etc. Des langages de requête
spécialisés, tels que SQL (Structured Query Language) permettent aux utilisateurs
d'obtenir automatiquement les réponses attendues. On distingue les requêtes
attributaires (qui portent sur les attributs des objets) et les requêtes
spatiales (qui portent sur les relations de construction ou topologiques),
ces dernières étant propres à l'information géographique et exigeant des
développements spécifiques.
|
|
|
|
|
|
Gestion
|
Comment gère-t-on une base de données?
|
|
Une base de données doit pouvoir être gérée automatiquement,
c'est-à-dire modifiée en fonction des mises à jour successives des données,
résultant des changements incessants qui interviennent dans la vie courante
: aménagement, construction, urbanisation, exode rural, déprise agricole,
déforestation, sècheresse, etc. Il faut, non seulement, modifier,ajouter
ou supprimer des objets, mais mettre à jour toutes leurs relations mutuelles.
Les systèmes de gestion de bases de données (SGBD) doivent assurer les
fonctions suivantes :
- manipulation des données : recherche, modification,
insertion ou suppression de données. La sélection des données doit pouvoir
se faire soit selon un critère géographique (la zone d'intérêt), soit
selon un critère thématique (les thèmes choisis),
- maintien de l'intégrité des données,
- respect de la confidentialité des données : suivant les cas,
les données appartiennent à des utilisateurs différents, qui n'ont pas
tous les mêmes droits d'accès,
- simultanéité d'accès : plusieurs utilisateurs doivent pouvoir
accéder aux données en même temps. Les mises à jour sont sériées de façon
à assurer en permanence la cohérence de la base,
- sécurité de fonctionnement : le SGBD doit assurer la sauvegarde
des données en cas de panne (matériel ou logiciel).
Les logiciels de SGBD ont été bâtis sur des modèles logiques
tels que les modèles en réseaux et, plus récemment, les modèles relationnels.
Ceux-ci représentent les relations entre objets par des tables ainsi construites
:
- les 2 premières colonnes sont les classes d'objets en relation,
- les colonnes suivantes sont les attributs de la relation.
|
|
|
|
Exemple: relation "tel Etat possède telle population":
Etat |
Population* |
Croissance pop. |
Surface Km2 |
Capitale |
| Bulgarie |
9 |
0% |
111 000 |
Sofia |
Hongrie |
10 |
-0,3% |
93 000 |
Budapest |
Moldavie |
4 |
0,3% |
34 000 |
Kichinev |
Pologne |
39 |
0,4% |
313 000 |
Varsovie |
Roumanie |
23 |
-0,2% |
237 000 |
Bucarest |
Slovaquie |
5 |
0,5% |
49 000 |
Bratislava |
Tchèque (Rép.) |
10 |
0,1% |
79 000 |
Prague |
Ukraine |
52 |
0,3% |
604 000 |
Kiev |
*Population
en millions d'habitants
|
|
La base de données relationnelle est construite de façon
que pour chaque relation, les objets et leurs attributs soient reliés
dans une même table. Si l'on dispose de plusieurs relations, on peut former
de nouvelles tables en "fusionnant" deux relations : par ex. la relation
"tel Etat a telle production agricole" peut être fusionnée avec la relation
"tel Etat a telle population" en formant une seule table (cela s'appelle
une jointure).
| |
|
|
Il est ainsi possible de questionner la base sur n'importe quelle combinaison
de critères :
(Exemple d'après la table ci-dessus) : quels sont les pays qui ont une
population supérieure à18 millions, une croissance supérieure à 0,2 %
et une surface inférieure à 500 000 km2 ? En suivant la colonne 2 on identifie
3 pays, puis en suivant la colonne 3, on élimine l'un d'entre eux, et
la colonne 4 nous donne la réponse (la Pologne).
| |
|
|
L'inconvénient des bases de données relationnelles est d'éparpiller les
relations entre objets en un grand nombre de tables relationnelles, d'où
la difficulté de retrouver toutes les informations relatives à un objet
donné. C'est pourquoi la tendance est à l'utilisation de base de données
orientées-objets, c'est-à-dire regroupant toutes les informations (attributs
et relations) relatives à un objet donné dans un ensemble unique (processus
d'encapsulation).
| |
|
|
|
|
Echange de données
|
Comment échange-t-on des données entre producteurs et
utilisateurs?
|
|
L'échange de données est un aspect fondamental de l'information
géographique numérique. La faisabilité de l'échange est conditionnée par
la normalisation de l'information, qui est un objectif de l'ensemble de
la communauté géographique, tant nationale qu'internationale. La normalisation
porte notamment sur le format des données, ce qui permet d'éviter les
conversions de format quand on passe d'un système à l'autre, ce qui est
souvent très lourd à réaliser. Le fait de disposer d'une norme permet
de limiter le nombre de conversions. La normalisation à l'échelon national
(AFNOR, avec la norme EDIGEO) puis européen (Comité Européen de Normalisation),
a été amorcée au début des années 90 puis étendue à l'International Standard
Organisation (ISO), dans l'optique de favoriser l'inter-opérabilité des
systèmes.
| |
|

Introduction : Systèmes d'information géographique et bases de données
Présentation de logiciels SIG
Intégrer des données dans un SIG (acquisition et saisie)
Interroger le SIG (analyse)
|