Normes d'extraction de l'information
La raison d'être de tout réseau géospatial est de faciliter la
recherche d'information utile.
- La norme Z39.50 sur le protocole de recherche et d'extraction :
La norme internationale Z39.50 pour l'extraction d'information provient
de la communauté des bibliothèques numériques. C'est à la fois une norme ANSI et ISO.
Les spécifications du protocole normalisent la syntaxe de requête, l'identité des
champs de recherche et le format par défaut des réponses obtenues. Il offre aussi
les mécanismes de contrôle de l'accès et une autodescription du serveur. Le modèle
d'extraction de l'information Z39.50 est indépendant du domaine, les spécialisations
du domaine étant fournies par un autre mécanisme que l'on appelle profils d'applications.
Ces profils sont formés d'ensembles spécifiques d'attributs, d'opérateurs et de
règles d'implantations particuliers à un domaine.
La norme Z39.50 est basée sur des messages, c'est-à-dire que le protocole
utilise une paire requête-réponse pour chaque service offert. Les services essentiels
sont :
- Init,
qui établi une session entre le client et le serveur de bases de données;
- Search,
qui transporte le critère de recherche à la base de données cible et qui répond
par des statistiques de correspondances tel que le nombre de correspondances. Notons que la
réponse à une requête de recherche n'inclut pas les champs de la base de données correspondante;
- Present,
qui suit une réponse de recherche (Search) et qui est utilisée pour demander les
champs correspondants ou un sous-ensemble de champs. Le mécanisme est très puissant puisque
l'ensemble du résultat est géré par le serveur cible et qu'il n'a pas a être transmis inutilement
sur le réseau.
Il y a d'autres services qui offrent le contrôle de l'accès, la gestion des
ressources, la capacité d'autodescription pour la base de données cible, etc. Toutefois, elles
sont moins souvent supportées par les logiciels clients et serveurs que les trois services de
base décrit ci-dessus.
Le protocole Z39.50 est très complet. Malheureusement, il peut devenir très
difficile pour un fournisseur de données géospatiales d'installer le logiciel du serveur Z39.50 et de le
configurer pour qu'il puisse effectuer une recherche sur un jeu de données géospatiales. Cela va à l'encontre
des objectifs de la technologie CEONet qui vise à garder les coûts de participation du
fournisseur au minimum. Pour surmonter ce problème, on a conçu une trousse d'outils qui combine
les logiciels Z39.50 et GEO pour faciliter l'installation et la configuration par le fournisseur.
- Profil de métadonnées géospatiales (GEO) :
La norme Z39.50 supporte le concept des profils d'applications, qui sont
constitués d'un ensemble d'attributs spécifiques, d'opérateurs et de règles d'implantation.
Le FGDC a développé un profil d'application pour les métadonnées géospatiales (GEO). Le profil
GEO fournit la spécification d'implantation des éléments de métadonnées de CSDGM dans un
service Z39.50. Ce profil permet l'interopérabilité avec, entre autres, le centre de distribution
du FGDC. De plus, la communauté d'observation de la Terre, dans le cadre des activités du
Committee for Earth Observation Satellites (CEOS) travaille à assurer l'interopérabilité des
protocoles GEO et CIP (tous deux basés sur Z39.50).
Le profil GEO normalise (en se superposant à Z39.50) le modèle de données pour
la recherche et l'extraction, les opérateurs du langage de requête (incluant les opérateurs
spatiaux), etc. Le diagramme ci-dessous présente l'architecture du Z39.50/GEO, tel qu'utilise
la technologie CEONet.
- Métadonnées de service :
La technologie CEONet suit de près les activités des comités ISO/CT 211 et
Open GIS Consortium concernant les métadonnées de services, puisqu'il prévoit utiliser la
version élargie des modèles qui résulteront de ces activités.
- Protocole «Simple Search» :
Ce protocole a été conçu dans le cadre de la technologie CEONet pour en promouvoir
l'utilisation dans d'autres systèmes. Plutôt que d'être basé directement sur les prises de connexions
TCP/IP, le protocole est transporté sous HTTP. Les programmes CGI capables de répondre à une requête de
recherche réside sur le serveur Web des fournisseurs de données géospatiales. Chaque requête de recherche
est encodée comme étant un URL (Uniform Resource Locator) comprenant le nom du programme CGI et les
paramètres de requête de recherche devant y être passés. Le programme CGI retourne le résultat de la
recherche sous forme d'une suite de caractères ASCII formatés en PVL (Parameter Value Language) développé
par ISO/CCDS. L'ensemble de paramètres de requête possible y est réduit (spatial, temporel et texte libre),
ce qui explique son nom : «Simple Search». Il est relativement simple et peu coûteux (2 à 5 jours de travail)
pour un fournisseur de créer un programme CGI capable d'effectuer une recherche sur un ensemble de données
géospatiales et ainsi d'être intégré à la technologie CEONet. Le diagramme ci-dessous présente l'architecture
de «Simple Search».

|