Cinco preguntas clave para iniciarse en Computer Vision

computer vision

Actualmente, en el mundo se están generando más de 1,2 billones de imágenes a través de los más de 3.700 millones de dispositivos móviles con cámara de fotos que hay en el mundo. Además, existen más de 350 millones de cámaras activas de vídeo vigilancia, sin contar las que se están utilizando en procesos de calidad, imágenes médicas o las que se están popularizando en el ámbito doméstico.

 Esta ingente cantidad de imágenes se está aprovechando, generando nuevo valor, a través de la Visión Artificial o Computer Vision (CV).

 

A continuación, repasaremos los cinco elementos clave a tener en cuenta en para iniciarnos en el campo de la Computer Vision, e iremos profundizando en distintos aspectos de los beneficios que aportan estos proyectos a las empresas en próximas entradas.

Si quieres saber más sobre visión artificial y costes operativos, accede al  Webinar aquí


1. ¿Qué es Computer Vision?

¿Cómo se consigue que una máquina registre su entorno visual, interprete y actúe en consecuencia a lo que está recogiendo?

La primera clave está en que las imágenes están digitalizadas, esto es, que la fotografía digital consiguió convertir las imágenes en mapas de píxeles. A cada pixel de la foto se le asigna un número, en función de la intensidad del color que tenga, y la imagen se convierte en un conjunto de números. Así lo que para los humanos es proximidad visual para las máquinas es proximidad numérica.

Un símil es cuando intentamos montar un puzle y vamos viendo si las piezas encajan o no encajan en función de su perfil y contenido. Hay piezas que son todo cielo, las que tienen trozos naranjas de ladrillos, etc. Del mismo modo la máquina, para comparar las imágenes, calcula la similitud numérica de un fragmento frente a otras imágenes. Así, la Visión Artificial es la rama de la inteligencia artificial que es capaz de interpretar las imágenes.

 

2. Relación hay entre Computer Vision y Machine Learning

Es aquí donde aprovechan técnicas que ya se están explotando para que las máquinas puedan interpretar y actuar en función de la realidad que se les presenta. El Machine Learning (ML) y una de sus ramas, el Deep Learning (DL) permiten diseñar algoritmos para hacer predicciones en entornos cambiantes en los que se dispone de mucha información. Por lo tanto podemos decir que ML y DL nutren a la Visión Artificial creando soluciones especializadas en el contexto de imágenes.

 

Algoritmos aplicados a Computer Vision

Uno de los primeros hitos que tiene que resolver la Computer Vision está relacionado con la captura de imágenes de la vida real. Estas no son precisas y tienen distorsiones, que pueden ser del tipo ruido, borrado o deformaciones. Estas deformaciones se deben corregir. 

La tecnología y técnicas aplicada a CV han evolucionado mucho, desde los primeros algoritmos basados en fórmulas sencillas a nivel de pixel, pasando por los sistemas supervisados, todavía en uso, en el que un operador humano ayuda al algoritmo en el proceso de entrenamiento hasta sistemas no supervisados que utilizan millones de imágenes para entrenar a los algoritmos.

 

3. Técnicas específicas de la Computer Vision

Las principales diferencias con otras ramas de la inteligencia artificial están en la primera fase de explotación e interpretación inicial de información que facilitan las imágenes. Podemos fijar tres técnicas clave:

  • Clasificación
  • Segmentación
  • Detección de objetos

Todas estas se apoyan en el proceso de anotación como recurso para enseñar a la máquina.

 

4. ¿Qué es una anotación en una imagen obtenida por computer vision?

La anotación es el proceso de crear el data set de entrenamiento, como cuando estamos analizando el comportamiento de la cartera de clientes y juntamos las características de los clientes con los resultados comerciales (ha comprado un nuevo producto, nos ha abandonado, etc.). Con este proceso ayudamos al algoritmo a aprender diciéndole que es lo que esperamos de cada imagen que le pasaremos.

 

anotacion-imagen-cv

 

¿Qué es la clasificación?

Una de las principales aplicaciones que aporta la CV es la clasificación de las imágenes, o bien la asignación de una categoría a la imagen en su conjunto.

 

clasificacion-cv

 

¿Qué es la segmentación?

Una vez que definimos qué objetos estamos buscando, con la segmentación de la imagen señalamos qué píxeles pertenecen a cada uno de estos. De esta manera reconocemos áreas de interés sobre la imagen.

 

segmentacion-cv

 

¿Qué es la detección de objetos?

A partir de la imagen original la visión artificial es capaz de asociar fragmentos concretos a objetos predefinidos, como por ejemplo, las gallinas que se marcan en la imagen siguiente.

 

deteccion-objetos-cv

 

Otras técnicas de la CV nos permiten diferenciar a unos objetos de otros, reconocer rostros de personas, su expresión facial o incluso acciones, como “gallinas comiendo” en la imagen anterior. En sucesivas entradas tendremos ocasión de comentarlos en más profundidad.

 

5. ¿Qué otras dimensiones se recogen en caso del vídeo por computer vision?

Al incorporar multitud de imágenes a lo largo del tiempo, en las que los ángulos de vista de los objetos cambian, nos permite reconstruir imágenes 3D o aspectos derivados del movimiento como la velocidad.

Cómo hemos visto, la Visión Artificial o Computer Vision es un campo complementario a otros de la inteligencia artificial en cuya integración está la clave de hacer operativas soluciones que mejoran los resultados de las empresas.

En el camino de conseguir sistemas cada vez más autónomos que apoyen a las empresas a ser más competitivas y eficientes, ser capaces de integrar la imagen, la información visual de nuestros clientes cuando están en nuestro local, o de nuestros equipos cuando se están exponiendo a riesgos laborales, o la supervisión de la calidad de nuestros productos resulta muy valioso. 

 

Más noticias

¿Cómo se ejecuta un proyecto de automatización de procesos con RPA?

La automatización de procesos con RPA es una de las tendencias en la transformación digital. La posibilidad de automatizar tareas, para que las personas puedan dedicar su tiempo y esfuerzo a tareas...

Leer másArrow 41

Explainability AI: cómo hacer nuestro modelo legible

A la hora de tomar decisiones, la inteligencia artificial se ha convertido en una herramienta muy útil en el día a día. Lo curioso es que esto es así tanto en el ámbito personal como en el laboral....

Leer másArrow 41

Inversión en tecnología: clave para hacer frente a la crisis económica

La crisis económica es una realidad palpable en la actualidad. La inflación de los precios, la poca disponibilidad de los combustibles, así como la lenta recuperación de la Covid-19, han hecho que...

Leer másArrow 41

Supply chain: tendencias y retos tecnológicos

En el mundo empresarial contemporáneo, la gestión efectiva de la cadena de suministro es fundamental para el éxito y la competitividad de las organizaciones. La cadena de suministro, o supply chain...

Leer másArrow 41

Cómo diseñar una estrategia de IA para incrementar el éxito de los proyectos de Machine Learning

En el Webinar “AI Strategy: Cómo diseñar una estrategia de IA para incrementar el éxito de los proyectos”, hemos compartido una visión acerca de aquellos problemas generales que hacen que proyectos...

Leer másArrow 41