Qu'est-ce que la vision par ordinateur 3D ?

La vision par ordinateur en trois dimensions (3D) est une méthode d’utilisation de caméras qui permet aux ordinateurs d’émuler la vision humaine pour créer une image 3D. Avec la vision par ordinateur 3D, un ordinateur utilise deux caméras à la fois – tout comme une personne utilise deux yeux – pour créer une image avec de la profondeur. Outre son utilisation dans la création d’images et de films 3D avec des appareils d’enregistrement, la vision par ordinateur 3D est également fréquemment utilisée avec la robotique, permettant aux robots de capturer de véritables environnements 3D. L’un des problèmes majeurs dans le développement de ce système était de s’assurer que les caméras étaient correctement alignées, mais de nombreux systèmes ont perfectionné cette technique. Cette méthode rend également la technologie 3D moins chère pour le marché grand public, car des processeurs d’image coûteux ne sont pas nécessaires pour créer l’image 3D.

Pour que la vision par ordinateur 3D fonctionne, l’ordinateur doit utiliser deux caméras différentes de la même manière que les gens utilisent deux yeux. Les deux caméras enregistrent ou capturent un environnement sous différents angles, permettant à l’ordinateur d’utiliser un algorithme pour mélanger les images et former une profondeur réelle. Les ordinateurs sont également capables de capturer des images 3D en temps réel, sans avoir besoin de beaucoup de traitement entre la capture et la construction 3D. Cela rend la vision par ordinateur 3D utile pour les marchés des jeux, du cinéma et de l’enregistrement.

En plus d’utiliser la vision par ordinateur 3D pour créer des images et des films, cette méthode est également souvent utilisée en robotique, en particulier avec des robots conçus pour se déplacer et interagir avec un environnement. En utilisant les deux caméras, le robot est capable de comprendre la profondeur d’un environnement, ce qui le rend plus apte à travailler avec d’autres objets et à surmonter les obstacles physiques tels que les lacunes et les bosses. Le mouvement robotique est également plus fluide en raison de cette compréhension de la profondeur.

Le problème majeur dans la création de la vision par ordinateur 3D était d’aligner les deux caméras afin qu’elles fonctionnent comme des yeux. De nombreux systèmes initiaux utilisant cette technologie ne pouvaient pas aligner les caméras, de sorte que les images étaient floues ou combinées de manière incohérente. En 2011, de nombreux systèmes ont surmonté ce problème et certains sont disponibles pour les consommateurs.

Avant la vision par ordinateur 3D, il existait des processeurs d’images 3D qui pouvaient effectuer la même tâche de prendre des images et de les combiner pour former la profondeur. Le problème majeur de cette technique est que les processeurs d’images sont chers, ce qui les rend largement inaccessibles pour le marché grand public. Le coût n’est pas autant un problème pour la vision par ordinateur 3D, car le processus de combinaison des images est plutôt simple. Cela permet au marché grand public de profiter de la technologie 3D sans un prix élevé.