Ci-dessous une proposition de sujet de thèse du laboratoire COGIT de l’Institut Géographique National – merci de diffuser aux étudiants potentiellement intéressés.
Vers la généralisation de Mashups cartographiques: prise en compte des dépendances entre données thématiques et données de référence dans un processus de généralisation automatique
Mots clés
Généralisation, Mashups, Analyse de données, Analyse spatiale, Modélisation
Contexte
L’utilisation des données géographiques est en augmentation constante. Cela est encouragé par la mise à disposition croissante de données via le web. En ce qui concerne les sources, on trouve d’une part des données issues de saisie participative, d’autre part des données institutionnelles, dont la diffusion va se généraliser pour les données liées à l’environnement du fait de la mise en œuvre de la directive INSPIRE. En ce qui concerne les thématiques, on trouve à la fois des données topographiques (données de référence) et des données thématiques. Toutes ces données décrivent la réalité avec un niveau de détail variable (finesse du schéma de données, quantité d’objets effectivement saisis, finesse de la géométrie).
Parmi les cas d’utilisation de ces données, figurent la co-visualisation à des fins d’exploration ou l’analyse numérique. Dans un cas comme dans l’autre, se pose un certain nombre de problèmes liés à la notion de niveau de détail :
1. Les données issues de sources différentes doivent être mises en cohérence, en particulier :
· les données thématiques doivent être liées aux données de référence (par exemple, des données d’accidentologie routière doivent être liées au réseau routier)
· les niveaux de détail des données issues des différentes sources doivent être rendus homogènes.
2. Le niveau de détail des données doit être adapté à l’utilisation qui en est faite.
La généralisation est un processus par lequel on diminue le niveau de détail de données géographiques pour répondre à un besoin donné (de visualisation à petite échelle ou d’analyse), tout en préservant l’essentiel de leurs caractéristiques initiales. L’automatisation du processus de généralisation a beaucoup été étudiée pour des données de type topographique (données de référence), notamment au laboratoire COGIT, avec de bons résultats à ce jour. Peu de travaux ont concerné le cas, pourtant de plus en plus courant, de jeux de données incluant une composante thématique et une composante « de référence ». Or il est souhaitable de savoir diminuer automatiquement le niveau de détail d’une partie de ces données en tenant compte du niveau de détail de l’autre partie et des relations existant entre les deux parties.
Sujet
L’objectif de la thèse est de proposer des éléments de modèle permettant de faire de la généralisation dans le cas de données géographiques :
ayant une composante thématique et une composante données de référence,
dont le niveau de détail initial n’est pas forcément homogène,
et dont les différentes composantes ne sont par forcément en cohérence initialement.
Le premier résultat attendu est un modèle relativement générique permettant de décrire les dépendances qui devront être conservées lors de la généralisation entre objets d’une couche thématique et objets des couches de référence (Figure 1). Ce modèle doit permettre de prendre en compte le mode d’implantation des données thématiques (point, ligne, surface), leur nature et le type de données de références auxquelles elles sont liées (réseaux, zones d’occupation du sol, objets isolés, etc.).
Figure 1. Exemple de dépendances entre données thématiques et données de référence
Des méthodes permettant d’instancier ce modèle seront proposées pour des cas d’application typiques. Dans le cas de jeux de données dont les différentes composantes ne sont pas en cohérence initialement, il sera nécessaire d’utiliser des outils d’appariement de données pour identifier les correspondances entre ces composantes. Des outils d’appariement existants devront alors être adaptés à ce contexte d’utilisation.
Enfin, en s’appuyant sur le modèle défini, le doctorant devra ensuite proposer des méthodes pour généraliser la composante thématique et/ou la composante topographique des données en conservant les dépendances identifiées entre les deux. Il s’agira en grande partie d’adapter, de telle sorte qu’elles tiennent compte des dépendances décrites par le modèle proposé, des méthodes de généralisation existantes (dont certaines s’appuient sur des techniques d’intelligence artificielle : résolution de contraintes, systèmes multi-agents).
Les cas d’application envisagés a priori dans un premier temps concernent les données thématiques ponctuelles saisies sur un réseau (type marqueurs kilométriques utilisés par les gestionnaires de réseau, relevés de vitesse, données d’accidentologie), et les données thématiques zonales type zones de risques naturels. Des expérimentations menées en début de thèse avec d’autres données issues du web pourront permettre d’identifier d’autres cas d’applications récurrents.
L’implémentation des modèles et méthodes proposés se fera en java sur la plate-forme de recherche en généralisation du laboratoire. L’intégration des méthodes développées à des services web de cartographie pourra être envisagée en fin de thèse.
Compétences, formation
Profil typique : master géomatique, ou master informatique (dont intelligence artificielle) avec une expérience de la manipulation de données spatiales.
Compétences en modélisation, programmation (java), anglais lu. Compétences en cartographie ou en analyse de données. Goût pour l’analyse spatiale.
Lieu, durée
Les travaux de recherche seront réalisés au laboratoire COGIT de l’IGN, à Saint-Mandé pour une durée de 3 ans (contrat de 2 ans renouvelable 1 an) à partir de fin 2010. Ils sont financés par une bourse de 1425€TTC net par mois.
Comment Candidater
Les dossiers de candidature se composent d'une lettre de candidature précisant clairement sur quel sujet porte la candidature ainsi que les motivations du candidat, un curriculum vitae, une attestation des notes obtenues dans le mastère suivi et si possible des lettres de recommandation.
Les dossiers de candidature peuvent être déposés à partir du 21 Mai 2010 et avant le 18 Juin 2010 au laboratoire COGIT de l’IGN par courrier électronique: anne...@ign.fr et cecile....@ign.fr avec une copie à la Direction des Ressources Humaines de l'IGN par courrier électronique : sr...@ign.fr
Si votre profil correspond au poste, vous serez convoqué pour un entretien à l’IGN entre le 21 Juin et le 7 Juillet 2010.
---
Cecile Duchene - Laboratoire COGIT
Institut Geographique National mel: cecile....@ign.fr
2 avenue Pasteur Tel: 01 43 98 85 43
94165 Saint-Mande CEDEX Fax: 01 43 98 85 81
http://recherche.ign.fr/labos/cogit/arGene.php