• emploi
  • Rennes

Thèse : Génération numérique d'hologrammes en temps-réel pour la visioconférence 3D immersive

A propos de b<>com
Fournisseur de technologies pour les entreprises qui souhaitent accélérer leur compétitivité grâce au numérique, b<>com est au service des industries culturelles et créatives, des infrastructures numériques, de la défense, de l’industrie 4.0 et de la santé. Ses laboratoires mixent les talents de disciplines et cultures multiples dans les domaines de l’intelligence artificielle, de la vidéo et l’audio immersif, de la protection de contenus, des réseaux 5G, de l’internet des objets et des technologies cognitives… Issus des mondes industriel et universitaire, ses chercheurs et ingénieurs évoluent sur son campus de Rennes et ses sites de Paris, Brest et Lannion. Grâce à son équipe d’ingénierie avancée et ses moyens scientifiques propres, b<>com propose à ses clients des ingrédients et des solutions qui font la différence.

Descriptif du poste
Mots-clés: Holographie, Vidéo 3D, Algorithmie, Traitement du signal, Optique, Photonique

  • Contexte scientifique

Avec les récents progrès des systèmes de capture et de visualisation 3D, les technologies immersives ont reçu une attention considérable de la communauté scientifique et industrielle au cours de la dernière décennie. En effet, les consommateurs recherchent une meilleure sensation de présence lors de leurs interactions à distance et de leurs divertissements audiovisuels. Il y a un réel besoin d’un affichage 3D capable de projeter l'utilisateur dans un environnement virtuel immersif et de donner l'illusion que des interlocuteurs situés à des kilomètres de distance sont présents dans la même salle de conférence.
Malheureusement, la plupart des systèmes de visualisation 3D actuels – tels que les casques de réalité virtuelle ou les téléviseurs 3D – utilisent la stéréoscopie, qui ne parvient pas à créer une illusion de profondeur naturelle et réaliste. En effet, la stéréoscopie ne reproduit pas tous les indices de perception de la profondeur du système visuel humain perçus en vision naturelle. En particulier, elle ne fournit pas l’indice d'accommodation, ce qui veut dire que le spectateur doit faire la mise au point sur un plan fixe dont la profondeur ne correspond pas à l'emplacement réel des objets virtuels. Cela dégrade fortement l'interaction et l'immersion et crée le conflit Accommodation-Convergence entraînant une fatigue oculaire et des maux de tête.
Pour résoudre cette limitation, plusieurs technologies alternatives ont été proposées au cours des dernières décennies. Parmi ces techniques, l’Holographie est souvent considérée comme la plus prometteuse, car elle fournit tous les indices de perception de la profondeur du système visuel humain sans provoquer de fatigue oculaire. Pour créer l'illusion de profondeur, un hologramme diffracte un faisceau de lumière pour lui donner la forme de l'onde lumineuse qui serait émise, transmise ou réfléchie par une scène donnée. Par conséquent, les spectateurs perçoivent la scène comme si elle était physiquement présente devant eux.
Grâce à ces propriétés de visualisation, l'Holographie est un candidat parfait pour un affichage 3D réaliste, créant des images virtuelles impossibles à distinguer des images réelles. Cependant, cette technique présente plusieurs limitations qui doivent être résolues. L'un des verrous les plus importants est la très grande résolution nécessaire pour l'affichage de scènes en grandeur naturelle. En effet, puisqu'il crée l'illusion de profondeur en utilisant la diffraction de la lumière, la taille des pixels d'un hologramme doit être de l'ordre de la longueur d'onde de la lumière visible. En raison de cette taille microscopique, un hologramme avec une grande taille et un grand angle de vue contient plusieurs milliards de pixels. Par exemple, un hologramme de taille 20 cm × 15 cm avec un angle de vue de 120° nécessite une résolution de 720K × 540K pixels.
Malgré l'évolution rapide des technologies électroniques, calculer un hologramme d'une telle résolution en temps réel reste un problème ouvert. Pour relever ce défi, l'objectif de cette thèse est de concevoir et développer de nouveaux algorithmes de génération d'hologrammes avec une complexité algorithmique réduite.

  • Objectifs de la thèse

Pour générer un hologramme, les méthodes de l'état de l'art représentent généralement les objets de la scène par un nuage de points ou un maillage de polygones. L'hologramme est alors calculé en additionnant les ondes lumineuses émises par l'ensemble des points ou polygones de la scène. L'inconvénient de ces méthodes est leur grande complexité algorithmique, qui est directement proportionnelle au nombre de points ou polygones ainsi qu'au nombre de pixels de l'hologramme. En effet, l'onde lumineuse émise par chaque point de la scène illumine l'ensemble des pixels de l'hologramme durant l'enregistrement. La génération d'un hologramme comprenant plusieurs milliards de pixels peut ainsi prendre plusieurs heures voire plusieurs jours de calcul sur un ordinateur de bureau. Pour contourner cette limitation, plusieurs pistes de recherche seront explorées durant cette thèse.
Une première piste concerne le calcul du flux holographique dans le domaine spatio-fréquentiel, aussi appelé espace des phases. En effet, bien qu'il n'existe que peu de corrélation entre deux pixels adjacents d'un hologramme, la distribution espace-fréquence du signal holographique met en évidence de fortes redondances d'un coefficient à un autre. En générant l'hologramme directement dans l'espace des phases, on pourrait alors tirer parti de ces redondances spatio-fréquentielles afin de réduire le temps de calcul. De la même manière, même s'il existe peu de redondance temporelle entre deux images d'une vidéo holographique, des études préliminaires menées à l'IRT b<>com montrent que la représentation du flux holographique dans l'espace des phases change peu d'une image à une autre. En caractérisant l'évolution de cette représentation en fonction du mouvement des objets de la scène, on pourrait alors prédire chaque image holographique à partir des précédentes et ainsi réduire considérablement le nombre d'opérations nécessaires au calcul du flux holographique.
Une deuxième piste concerne la prise en compte des limites du système visuel humain. En effet, notre acuité visuelle est maximale dans un cône d'une dizaine de degrés au centre de notre champ de vision (appelé zone fovéale), puis décroit rapidement lorsque l'on s'en éloigne. Afin de libérer de la puissance de calcul, il est possible de ne générer précisément le champ lumineux que dans la zone fovéale de l'utilisateur, et de réduire la précision du calcul dans la zone périphérique de son champ de vision. Si cette technique – appelée rendu fovéal – est désormais courante en réalité virtuelle, elle n'a été pour l'instant que très peu étudiée dans le cadre de l'holographie. En effet, elle nécessite un échantillonnage non-uniforme du champ lumineux, ce qui réduit drastiquement l'efficacité des opérateurs de propagation de la lumière basés sur des transformées de Fourier discrètes (propagation de Rayleigh-Sommerfeld, propagation de Fresnel, etc.) utilisées pour le calcul des ondes lumineuses émises par la scène. Néanmoins, l'application de ces opérateurs dans l'espace des phases pourrait permettre de résoudre ce verrou technologique.
Enfin, un axe important de la thèse consistera à évaluer et comparer la qualité visuelle des hologrammes générés. En effet, dans la mesure où les écrans holographiques disponibles aujourd'hui ne permettent pas d'afficher des images de plusieurs milliards de pixels, l'évaluation de la qualité subjective de tels hologrammes n'a jamais été abordée dans l'état de l'art. Pour lever ce verrou, via la collaboration et co-encadrement de la thèse avec l'IMT Atlantique et grâce à l'accès à leur plateforme technologique ARAGO, on réalisera des hologrammes physiques par photoinscription directe pour valider les algorithmes de conception et les adapter aux limitations et contraintes de la réalisation physique. Des procédures d'évaluation de la qualité subjective adaptées à l'holographie pourront ainsi être développées.

Profil recherché
•    Master ou diplôme d'Ingénieur en Informatique, Traitement du Signal et/ou de l'Image, Mathématiques appliquées ou équivalent
•    Compétences en Optique
•    Bonne maîtrise du langage C++, de Matlab et/ou Python
•    Bonne maîtrise de l'anglais, écrit et oral

Modalités
•    Type de contrat : CDD
•    Date de démarrage: Octobre 2022
•    Durée: 3 ans