GéoConnexions Acceuil Contactez-nous Infrastructure canadienne de données géospatiales
Cherchez des services Mettez à jour votre contenu

Survol

Normes d'extraction de l'information

La raison d'être de tout réseau géospatial est de faciliter la recherche d'information utile.

  • La norme Z39.50 sur le protocole de recherche et d'extraction :

    La norme internationale Z39.50 pour l'extraction d'information provient de la communauté des bibliothèques numériques. C'est à la fois une norme ANSI et ISO. Les spécifications du protocole normalisent la syntaxe de requête, l'identité des champs de recherche et le format par défaut des réponses obtenues. Il offre aussi les mécanismes de contrôle de l'accès et une autodescription du serveur. Le modèle d'extraction de l'information Z39.50 est indépendant du domaine, les spécialisations du domaine étant fournies par un autre mécanisme que l'on appelle profils d'applications. Ces profils sont formés d'ensembles spécifiques d'attributs, d'opérateurs et de règles d'implantations particuliers à un domaine.

    La norme Z39.50 est basée sur des messages, c'est-à-dire que le protocole utilise une paire requête-réponse pour chaque service offert. Les services essentiels sont :

    • Init, qui établi une session entre le client et le serveur de bases de données;
    • Search, qui transporte le critère de recherche à la base de données cible et qui répond par des statistiques de correspondances tel que le nombre de correspondances. Notons que la réponse à une requête de recherche n'inclut pas les champs de la base de données correspondante;
    • Present, qui suit une réponse de recherche (Search) et qui est utilisée pour demander les champs correspondants ou un sous-ensemble de champs. Le mécanisme est très puissant puisque l'ensemble du résultat est géré par le serveur cible et qu'il n'a pas a être transmis inutilement sur le réseau.

    Il y a d'autres services qui offrent le contrôle de l'accès, la gestion des ressources, la capacité d'autodescription pour la base de données cible, etc. Toutefois, elles sont moins souvent supportées par les logiciels clients et serveurs que les trois services de base décrit ci-dessus.

    Le protocole Z39.50 est très complet. Malheureusement, il peut devenir très difficile pour un fournisseur de données géospatiales d'installer le logiciel du serveur Z39.50 et de le configurer pour qu'il puisse effectuer une recherche sur un jeu de données géospatiales. Cela va à l'encontre des objectifs de la technologie CEONet qui vise à garder les coûts de participation du fournisseur au minimum. Pour surmonter ce problème, on a conçu une trousse d'outils qui combine les logiciels Z39.50 et GEO pour faciliter l'installation et la configuration par le fournisseur.

  • Profil de métadonnées géospatiales (GEO) :

    La norme Z39.50 supporte le concept des profils d'applications, qui sont constitués d'un ensemble d'attributs spécifiques, d'opérateurs et de règles d'implantation. Le FGDC a développé un profil d'application pour les métadonnées géospatiales (GEO). Le profil GEO fournit la spécification d'implantation des éléments de métadonnées de CSDGM dans un service Z39.50. Ce profil permet l'interopérabilité avec, entre autres, le centre de distribution du FGDC. De plus, la communauté d'observation de la Terre, dans le cadre des activités du Committee for Earth Observation Satellites (CEOS) travaille à assurer l'interopérabilité des protocoles GEO et CIP (tous deux basés sur Z39.50).

    Le profil GEO normalise (en se superposant à Z39.50) le modèle de données pour la recherche et l'extraction, les opérateurs du langage de requête (incluant les opérateurs spatiaux), etc. Le diagramme ci-dessous présente l'architecture du Z39.50/GEO, tel qu'utilise la technologie CEONet.


  • Métadonnées de service :

    La technologie CEONet suit de près les activités des comités ISO/CT 211 et Open GIS Consortium concernant les métadonnées de services, puisqu'il prévoit utiliser la version élargie des modèles qui résulteront de ces activités.

  • Protocole «Simple Search» :

    Ce protocole a été conçu dans le cadre de la technologie CEONet pour en promouvoir l'utilisation dans d'autres systèmes. Plutôt que d'être basé directement sur les prises de connexions TCP/IP, le protocole est transporté sous HTTP. Les programmes CGI capables de répondre à une requête de recherche réside sur le serveur Web des fournisseurs de données géospatiales. Chaque requête de recherche est encodée comme étant un URL (Uniform Resource Locator) comprenant le nom du programme CGI et les paramètres de requête de recherche devant y être passés. Le programme CGI retourne le résultat de la recherche sous forme d'une suite de caractères ASCII formatés en PVL (Parameter Value Language) développé par ISO/CCDS. L'ensemble de paramètres de requête possible y est réduit (spatial, temporel et texte libre), ce qui explique son nom : «Simple Search». Il est relativement simple et peu coûteux (2 à 5 jours de travail) pour un fournisseur de créer un programme CGI capable d'effectuer une recherche sur un ensemble de données géospatiales et ainsi d'être intégré à la technologie CEONet. Le diagramme ci-dessous présente l'architecture de «Simple Search».