• emploi
  • Rennes

Thèse en vision par ordinateur

A propos de b<>com 

Fournisseur de technologies pour les entreprises qui souhaitent accélérer leur compétitivité grâce au numérique, b<>com est au service des industries culturelles et créatives, des infrastructures numériques, de la défense, de l’industrie 4.0 et de la santé. Ses laboratoires mixent les talents de disciplines et cultures multiples dans les domaines de l’intelligence artificielle, de la vidéo et l’audio immersif, de la protection de contenus, des réseaux 5G, de l’internet des objets et des technologies cognitives… Issus des mondes industriel et universitaire, ses chercheurs et ingénieurs évoluent sur son campus de Rennes et ses sites de Paris, Brest et Lannion. Grâce à son équipe d’ingénierie avancée et ses moyens scientifiques propres, b<>com propose à ses clients des ingrédients et des solutions qui font la différence.

Intitulé de la thèse

Vers une modélisation de scène 4D pour la navigation 6DoF dans un contenu vidéo immersif à partir d’un système de captation multi-caméras transportable.

Descriptif du poste

La crise sanitaire que nous traversons nous pousse à recourir massivement au télétravail et aux télécommunications et nous incite à reconsidérer leur utilisation. Le développement de la télé-collaboration, de la télé-assistance et de la formation à distance permettrait de réduire drastiquement les déplacements et l'empreinte carbone qui en résulte. Cependant, les outils disponibles tels que la visioconférence n’offrent qu’une expérience limitée et n’exploitent qu’une petite partie du spectre de la communication interpersonnelle réelle. Les futurs moyens de communications vidéo immersifs promettent une expérience enrichie et réaliste qui améliorera fortement la télé-collaboration, la télé-assistance et la formation à distance. Ils amélioreront d’abord l’expérience de la visioconférence (ex: Holoportation de Microsoft) en plongeant ses utilisateurs dans une salle de réunion ou une classe virtuelle où chacun pourra se déplacer librement et échanger avec les « hologrammes » de ses collègues. Un agent de maintenance profitera, en Réalité Augmentée (RA), des conseils d’un expert qui pourra s’appuyer sur une vidéo volumétrique pour guider les opérations de maintenance d’une machine. Certains examens et conseils médicaux pourront être réalisés, à distance, dans un environnement virtuel qui facilite la communication entre médecin et patient tout en réduisant les attentes et transports. Un chirurgien pourra se déplacer virtuellement autour de son confrère formateur, à distance, pour mieux appréhender les gestes réalisés dans l’environnement d’une salle d’opération. L’opérateur d’une chaîne de montage pourra se former, sans interruption de la chaîne de montage, en participant à des expériences de formation réalistes en Réalité Virtuelle (RV).

Pour concevoir ces expériences immersives, la captation, la production et la restitution à six de degrés de liberté ou 6DoF (6 Degrees of Freedom) de la vidéo volumétrique doivent être réalisées. Si les dispositifs qui permettent la restitution des vidéos volumétriques se sont démocratisés (ex : Hololens, Oculus Quest, …), un effort de recherche d’un système de captation vidéo transportable et de méthodes qui permettent la modélisation de scènes 4D (3D+t) réalistes doit encore être poursuivi. Les dispositifs de captation existants sont installés dans des studios (ex: Microsoft Capture Studio), demandent une infrastructure lourde (ex: Intel True View) ou sont transportables mais ne permettent pas la création d’expériences 6DoF. La qualité des vidéos volumétriques disponibles est encore limitée par leur incapacité à reproduire les caractéristiques des surfaces non Lambertiennes, à restituer les détails fins et par la présence d’artéfacts introduits lors de la captation ou la modélisation de la scène. En 2020, une nouvelle famille de méthodes de reconstruction de scènes multi-vues s’est illustrée. Ces méthodes reposent sur une représentation neuronale et permettent la restitution réaliste des surfaces non Lambertiennes. Cependant, leur usage est pour le moment limité à des scènes statiques du fait de leur complexité calculatoire. Le laboratoire Advanced Media Contents de b<>com est chargé du développement d'ingrédients technologiques pour la conception de nouveaux médias immersifs. Dans le cadre de ses activités en navigation vidéo 6DoF, le laboratoire AMC construit une chaîne qui comprend la capture vidéo multi-caméras transportable, la synthèse de vues 6DoF et la restitution multi-dispositifs des vues synthétisées à un utilisateur. La thèse proposée s'inscrit dans la recherche et le développement de méthodes de modélisation de scène 4D multi-représentations pour la navigation 6DoF dans un contenu vidéo immersif à partir d’un système de captation multi-caméras transportable.

Profil recherché 

De niveau Bac+5 ingénieur ou Master

  • Compétences en vision par ordinateur, mathématiques appliquées ou informatique
  • Compétences en IA (ex : apprentissage profond, réseaux de neurones,...)
  • Bonne maîtrise de Python et du langage de programmation C/C++
  • Maîtrise des environnements Windows et Linux
  • Bonne maitrise de l’anglais scientifique écrit et oral

Modalités 

  • Durée : 3 ans
  • Date de démarrage : 01/10/21
  • Localisation : Rennes