Qu'est-ce que la robotique de vision par ordinateur ?

Un type d’intelligence artificielle, la robotique de vision par ordinateur équipe des appareils électroniques ou mécaniques avec une vue dans le but d’accomplir une tâche particulière. La technologie combine du matériel et des logiciels qui capturent des images, interprètent les données et effectuent une réponse programmée. La technologie de vision par ordinateur peut n’impliquer rien de plus qu’une caméra vidéo connectée à un ordinateur contenant un logiciel d’interprétation. Des formes plus élaborées de vision par ordinateur peuvent inclure un réseau de lasers infrarouges et de récepteurs de capteurs transmettant des informations à un logiciel d’analyse. Les applications de vision par ordinateur couramment utilisées comprennent l’inspection industrielle, l’imagerie médicale et la surveillance.

Le logiciel requis contient généralement des algorithmes de vision par ordinateur provenant souvent de l’Open Source Computer Vision Library, ou Open CV. La bibliothèque est une base de données gratuite développée par Intel Corporation pour les concepteurs de logiciels. À l’aide de ces algorithmes, les programmeurs créent un logiciel qui apprend la reconnaissance d’objets, reçoit des données visuelles et déclenche souvent une réponse mécanique. Le logiciel peut traduire les informations en images ou enregistrer des informations sur une zone particulière.

La robotique de vision par ordinateur utilisée par les fabricants industriels comprend souvent des caméras vidéo ou des faisceaux laser à grande vitesse ainsi que des capteurs capables de détecter des produits qui descendent un tapis roulant. Ces informations sont transmises à un système informatisé qui compte les articles ou contrôle la qualité du produit fini. Si une erreur se produit, le logiciel peut réagir en déclenchant une alarme. Les entreprises utilisent souvent la reconnaissance d’images combinée à une interaction mécanique pour le tri et l’emballage.

La conversion d’images bidimensionnelles en images tridimensionnelles nécessite une robotique de vision par ordinateur. Les caméras positionnées autour d’un objet ou d’un emplacement capturent des images sous différents angles. Le logiciel compile ensuite ces images et restitue une représentation multidimensionnelle. De même, la technologie informatique convertit les signaux énergétiques émis par les appareils d’imagerie médicale en images multidimensionnelles qui affichent les structures internes du corps humain.

Les systèmes de vidéosurveillance combinent des caméras vidéo, surveillant un territoire spécifique, avec un logiciel de robotique de vision par ordinateur capable d’analyser le suivi de mouvement en temps réel. Le logiciel apprend d’abord la différence entre les objets en mouvement et les objets fixes. Le programme fait ensuite la distinction entre les mouvements humains et non humains. Enfin, les programmes font la distinction entre les schémas de marche normaux et anormaux ou les mouvements particuliers des membres.

Les systèmes de jeu modernes intègrent une robotique de vision par ordinateur qui reconnaît le mouvement humain et traduit les informations en mouvements exécutés par des personnages animés à l’écran. La technologie Kinect® consiste en un appareil qui émet une grille laser infrarouge dans le terrain de jeu. Les capteurs de mouvement contenus dans l’appareil détectent les faisceaux réfléchis vers l’unité. Le logiciel interprète ces signaux en temps réel et en modèles tridimensionnels. Le programme transfère ensuite ces mouvements sur des représentations humaines à l’écran.