• emploi
  • Rennes

thèse :Traitement automatique du langage appliqué au Droit de l’urbanisme Rennes Métropole, Université de Bretagne Sud et b<>com

Descriptif de la mission :

La problématique générale traitée dans cette thèse est celle de la structuration automatique de document  dans le cadre de l’instruction des permis de construire. La finalité ultime est l’analyse automatique des dossiers, qui sont dorénavant soumis sous forme dématérialisée, pour vérifier leur conformité par rapport aux réglementations (Droit du sol, PLU). Le problème particulier considéré ici est celui de la structuration semi-automatique de la connaissance dans un domaine spécifique, ici le Droit de l’urbanisme, à partir multiples corpus documentaires. Les méthodes employées pourront être étendues à tout autre domaine de compétence.

En informatique, cette connaissance est communément représentée sous forme d’ontologies. Celles-ci sont des représentations formelles, structurées de concepts/relations/axiomes que l'on trouve typiquement dans un ou plusieurs domaines. Elles fournissent un moyen concret de représenter à différentes échelles des visions globales et intégrées de la connaissance; ainsi, elles simplifient ou permettent même une intégration plus poussée des données ainsi qu’une communication sans ambiguïté entre agents (humains, artificiels) employant des vocabulaires distincts. Les ressources textuelles sont aujourd'hui la première source à partir de laquelle les ontologies sont construites. Cependant, ces ressources ne pouvant généralement pas être traitées automatiquement, elles ne peuvent pas être utilisées telles quelles. Il est donc nécessaire d’expliciter les informations qu’elles véhiculent.

La construction semi-automatisées d'ontologies à partir d'un grand nombre de ressources est un besoin reconnu car il est coûteux et chronophage de réaliser ces constructions à la main, et l’opération devient difficile lorsque l’on est confronté à des sources hétérogènes. Actuellement, les outils et méthodes disponibles pour prendre en charge ces processus semi-automatisés conduisent à des ontologies de mauvaise qualité ; l'une des raisons est que même l'identification d’artefacts ontologiques simples tels que les concepts et les relations est une opération encore mal maîtrisée conceptuellement. En effet, ces outils et méthodes réutilisent souvent des résultats de recherche disparates (NLP1, minage, logiques, FCA2) mais l'intégration de ces résultats et le passage aux représentations ontologiques restent difficiles. L’enjeu de la thèse est donc de fournir des réponses originales à ces questions essentielles.
1 Traitement du langage naturel. 2 Analyse conceptuelle formelle.

L’étudiant partagera son temps entre le Service Droit des Sols de Rennes Métropole dont il sera salarié, l’université de Bretagne Sud et b<>com selon des modalités à définir.

Profil recherché :    

Etudiant Bac+5 (Master, école d’ingénieurs)
La thèse est ouverte à tout candidat faisant preuve d’un intérêt pour l’Intelligence Artificielle et leurs applications au traitement du langage. Il développera des aptitudes à la modélisation de problèmes et à la conception/implémentation d’algorithmes d’apprentissage automatique. Les développements informatiques s’effectueront en langage Python.
Intérêt pour le doctorant    L’étudiant bénéficiera d’un encadrement pluridisciplinaire solide dont l’objectif est de contribuer à des innovations majeures en traitement de données textuelles.


Modalités  

Durée : 3 ans
Date de démarrage : octobre 2022
Localisation : Cesson-Sévigné
Date de fin de dépôt des candidatures : 31 août 2022
Candidature à envoyer à : job@b-com.com avec la référence du poste