¿Qué es el casco visual?

En las imágenes por computadora, un casco visual es la forma tridimensional (3D) de un objeto que se extrapola de múltiples imágenes bidimensionales (2D) tomadas en diferentes ángulos alrededor del objeto que se aproxima. Los datos de superficie sobre la forma de un objeto se obtienen trazando el contorno de un objeto en una imagen, esencialmente creando una silueta del objeto sin una textura o detalle interno específico. Una colección de siluetas, todas extraídas de imágenes tomadas en diferentes ángulos, se ensamblan juntas en un espacio 3D y el área entre los puntos de contorno conocidos se interpola para formar un objeto 3D que tiene el contorno 3D general del objeto real, aunque quizás sin tanto detalle específico. El proceso utilizado para crear un casco visual, también conocido como forma a partir de silueta (SFS), puede ser más rápido, menos intensivo en el procesador y menos costoso de implementar que algunas técnicas estereoscópicas para capturar movimiento 3D o detectar la forma de objetos 3D. Algunas de las aplicaciones que utilizan el casco visual incluyen la detección de obstáculos por visión por computadora, la captura de movimiento para fines médicos u otros fines analíticos y el escaneo virtual de objetos en 3D cuando SFS se realiza en condiciones altamente controladas.

El proceso de formar el casco visual de un objeto a partir de un conjunto de imágenes implica aislar la silueta del objeto del fondo de las imágenes. La ubicación exacta y la orientación de las cámaras utilizadas para adquirir las imágenes también son importantes para el proceso. En cada imagen, se hace un camino recto desde el plano de visión de la imagen hasta el espacio de la escena y termina en los contornos del objeto que se está imaginando. Esto se hace para cada imagen y el área donde cada uno de los caminos, que se asemejan a conos en un entorno 3D, se cruzan y dan un volumen muy áspero, similar a un bloque, que contiene el objeto dentro de las dimensiones de la escena. Para algunas aplicaciones, como la visión por computadora, esta información es suficiente para permitir evitar obstáculos básicos.

Las siluetas se pueden refinar aún más para que los detalles geométricos más pequeños se traduzcan en el casco visual. Estos pueden incluir agujeros en el objeto, como podría ocurrir si el casco visual se construyera a partir de imágenes de un ser humano de pie con las piernas separadas o los brazos extendidos. Un atributo de la forma de un objeto que no se puede capturar con precisión con las técnicas SFS es una superficie cóncava, porque no contribuye a la silueta.

La técnica SFS para crear el casco visual de un objeto puede ser increíblemente detallada y precisa si se utilizan algoritmos refinados junto con condiciones controladas para crear las imágenes de origen. Estas condiciones pueden incluir una fuente de luz única y uniforme, un fondo estático y medible y cámaras calibradas con precisión. Dadas estas condiciones, se pueden construir modelos 3D de objetos muy precisos y la captura de movimiento se puede realizar sin la necesidad de marcadores, trazadores o equipos especiales más allá de las cámaras.