b<>com recrute son/sa doctorante en vision par ordinateur pour le laboratoire « Immersive interactions »

Cesson-Sévigné, le 15/12/17

A propos de b<>com

Grâce à ses innovations, l’Institut de Recherche Technologique (IRT) b<>com contribue à la transformation digitale européenne. Ses 230 chercheurs développent des outils, produits et services qui facilitent la vie quotidienne. Ils se concentrent sur deux domaines de recherche : l’hypermédia (images ultra haute définition, son 3D, contenus intelligents, réalités virtuelle et augmentée…) et les réseaux ultra haut débit plus agiles (cloud, cyber-sécurité, ultra haut débit mobile, résilience des réseaux, Internet des objets…). Parmi les multiples domaines d’application de ces technologies, la e-santé permet à b<>com de participer à la révolution numérique du système médical. Issu d’un partenariat public/privé, l’IRT réunit les meilleurs experts issus du monde industriel et académique sur son campus de Rennes, et ses sites de Lannion, Brest et Paris.

Au sein du domaine Hypermédia, le laboratoire Immersive Interactions conçoit les briques technologiques accompagnants la généralisation des dispositifs de réalité mixte (réalité virtuelle et augmentée), et valide l'usage de ces technologies à travers la mise en œuvre de prototypes répondant à des expressions de besoins dans divers domaines (visualisation de données issues du Big Data, smart home, smart cities, ...).

Actuellement, le laboratoire Immersive interactions se focalise sur les interactions naturelles en réalité mixte, qu’elles soient collaboratives, multimodales, utilisant des dispositifs hétérogènes, avec un soin tout particulier à valider les prototypes en termes d'utilité, d'utilisabilité et surtout d'acceptabilité physiologique et psychologique.

Thèse au sein du projet ARF « Augmented Reality Framework » visant à développer une plateforme d’estimation de pose basée vision.

La relocalisation désigne la capacité d’un système à se localiser (position et orientation) dans l’environnement réel, qu’il soit intérieur ou extérieur. De nombreux capteurs s’appuyant sur des technologies d’émetteurs/récepteurs permettent de localiser un système (Gps, Wifi, Lifi, iBeacons, Ultrasos, Pseudolite, …). Cependant, ces technologies n’offrent pas un niveau de précision de positionnement et d’orientation suffisante pour offrir un recalage non ambigu pour des applications de réalité augmentée. Seules des solutions de vision par ordinateur,  s’appuyant sur des capteurs RGB ou RGB-D permettent d’affiner cette localisation afin d’offrir aux utilisateurs de technologies de réalité augmentée un recalage précis de données contextuelles avec l’environnement réel.
De nombreuses solutions dérivées du SLAM (Simultaneous Localization an Mapping) permettent une reconstruction 3D temps réel de l’environnement pour du suivi de cible. Couplé à des solutions d’estimation de pose s’appuyant sur une connaissance à priori de la scène, ces solutions permettent de localiser un capteur vision dans l’espace.
Seulement, rares sont le cas d’usages où les scènes sont statiques. Or, nos environnements sont peuplés d’objets ajoutés, supprimés, ou déplacés (procédure d’assemblage), des entités en mouvements (utilisateurs, véhicules passant devant les capteurs vision), ou d’éléments non rigides (arbres au vent, tissus, …) dont l’acquisition à un instant donné peut perturber les solutions d’estimation de pose basées vision et générer des dérives. L’objectif de la thèse consistera à proposer une solution d’estimation de pose robuste en prenant en considération cette dimension temporelle de l’évolutivité de la scène environnante.

Approche méthodologique et technique envisagée

Les études proposées dans le cadre de cette thèse ont pour objectif de lever plusieurs verrous, reconnus comme des difficultés, sur lesquels des contributions sont attendues : 

  • Optimiser la robustesse d’une estimation de pose à partir de cibles constituées de sous-éléments indépendants les uns des autres.
  • Estimer la pertinence des primitives suivies dans l’espace en considérant leur temporalité.

Le projet global sera porté par l’IRT b<>com et la thèse sera dirigée par Eric Marchand, Professeur de L’université de Rennes 1, avec un co-encadrement assuré par Jérôme Royan, Principal Architect de l’IRT b<>com. 

Résultats attendus

  • Un état de l’art des solutions d’estimation de pose avec un focus particulier sur les techniques s’appuyant sur des scènes dynamiques.
  • Une solution d’estimation de pose robuste sur des scènes composées d’éléments mobiles, illustrée par un prototype sur un cas d’usage industriel d’assemblage et de désassemblage.
  • Une solution d’estimation de pose robuste sur des scènes évoluant dans le temps (ajout, suppression, déplacement d’éléments) composées d’éléments dynamiques (occultation, éléments mobiles), illustrée par un prototype sur un cas d’usage industriel.

Une très forte attention sera portée sur la cohérence globale des contributions au projet du laboratoire Interactions Immersives. Une approche méthodologique spécifique sera mise en œuvre pour atteindre cette cohérence.

Profil recherché

Le candidat doit posséder d’excellentes compétences en développement informatique (C++) et doit également démontrer des aptitudes en vision par ordinateur (OpenCV, PCL, …).

Modalités

  • Type de Contrat : CDD 36 mois
  • Date de démarrage : Dès que possible
  • Lieu de travail : Cesson-Sévigné
  • Candidature (lettre de motivation et CV) à adresser à job@b-com.com avec la référence bcom/2017-15