Las matemáticas y el procesamiento de imágenes (I)

El procesamiento de imágenes y la visión por ordenador se han convertido en un área de investigación importante debido al rápido desarrollo de las nuevas tecnologías. Sus aplicaciones se extienden desde la visión industrial a las imágenes médicas, las imágenes satelitales, el vídeo y el cine digitales y el arte. Esta investigación está dirigida por las aplicaciones pero requiere de una discusión de sus fundamentos matemáticos para poder organizar el cuerpo de las numerosas contribuciones y algoritmos, comprender su universalidad y los límites de su aplicabilidad.

La investigación matemática puede y debe contribuir a todos los aspectos involucrados en el procesamiento de imágenes: tanto a la modelización como al desarrollo e implementación numérica de algoritmos, sin olvidar su análisis matemático. Para cubrirlos se requiere de auténticos equipos multidisciplinares que incorporen a ingenieros, informáticos, físicos y matemáticos. Los matemáticos pueden aportar su experiencia en todos los aspectos; quisiéramos señalar expresamente que su formación les permite abordar los problemas de modelización que tradicionalmente han sido objeto de mayor atención por parte de otras comunidades.

Modelo Digital de Terreno generado a partir de curvas de nivel de 20 metros

Los campos de aplicación del procesamiento de imágenes son numerosos y sin pretender ser exhaustivos podemos mencionar algunos de ellos: procesamiento de vídeo (con sus múltiples aplicaciones: vigilancia, control de tráfico, seguimiento de objetos en movimiento, etcétera) y la creación de herramientas para la postproducción de cine digital, el ámbito de las imágenes médicas (reconstrucción, interpretación y ayuda al diagnóstico), la fotografía digital, la visión estéreo y la reconstrucción tridimensional a partir de secuencias de vídeo, la restauración e interpretación de las imágenes tomadas por satélites, el reconocimiento de formas y la búsqueda de imágenes en la web, la compresión de imágenes, el procesamiento de superfícies, la síntesis de imágenes y la simulación para videojuegos y un largo etcétera tanto en los temas de investigación básica como en las aplicaciones.

Estos campos de aplicación y desarrollo de la actividad investigadora no se encuadran dentro de ninguna de las disciplinas tradicionales de las matemáticas pero requieren de todas ellas.
Ésta es la gran ventaja del procesamiento de imágenes ligada a su carácter multidisciplinar, muchas por no decir todas las áreas de las matemáticas tienen algo que decir: el cálculo de variaciones, la modelización física apoyada en ecuaciones en derivadas parciales, la geometría (diferencial, topológica, discreta …), la topología, las estructuras de datos, la estadística, la teoría de procesos estocásticos, el análisis armónico y la teoría del muestreo, la teoría de la información, codificación, el análisis numérico y la optimización, la óptica, la teoría del color, y en general, la física, sin olvidar los aspectos de ingeniería e informática. Hemos mencionado estas áreas, pero podríamos sumar muchos ámbitos de experiencia en los que las imágenes se aplican.

Por todo ello y sobre todo por sus numerosas aplicaciones este área va a adquirir un gran desarrollo en el futuro próximo y es interesante observar los movimientos dentro de la comunidad matemática que se producen en los países de nuestro entorno que afectan tanto al número creciente de investigadores dedicados a ello, como a la relación con el mundo industrial y la creación de nuevas empresas.

A título ilustrativo, vamos a describir en lo que sigue algunos de los campos de aplicación mencionados más arriba sin que los temas elegidos signifiquen más que otros sobre los que pasaremos brevemente por razones de espacio.

Algunos campos de aplicación del procesamiento de imágenes

a) Procesamiento de vídeo y cine digital

El tránsito desde el cine y la televisión analógicas a la tecnología digital plantea una serie de problemas tecnológicos de interés práctico. Los sistemas analógicos se caracterizan por tener más baja resolución, niveles más elevados de ruido y artefactos y menor flexibilidad, los sistemas digitales permiten imágenes más nítidas con menores niveles de ruido y menos artefactos, siendo más robustas a la transmisión.

La coexistencia de sistemas analógicos y digitales en TV y vídeo requiere el poder intercambiar los formatos de ambos sistemas según diferentes niveles de calidad y complejidad. A los formatos de producción hay que añadir los formatos del receptor (sistemas de display). Los receptores han de ser capaces de convertir el formato recibido en el formato del dispositivo de display, a ser posible en tiempo real. Estos formatos se definen por su muestreo espacio-temporal y su relación de aspecto [3]. La televisión usa un formato de muestreo llamado entrelazado mientras que los ordenadores personales usan el llamado muestreo progresivo. El uso del ordenador como pantalla de visualización plantea el debate entre el desarrollo algoritmos de des-entrelazado de vídeo o la producción de vídeo progresivo. La primera estrategia es de menor coste y permite la compatibilidad con los formatos tradicionales de la televisión. Se necesitan pues algoritmos eficientes que permitan la conversión de vídeo entrelazado a vídeo progresivo (IPC, Interlaced to Progressive Conversion), el aumento de la resolución espacial (scan-rate conversion) y el aumento de la resolución temporal (frame-rate conversion).

Left, original scene. Next, our results for two night simulated scenes at 1 log cd/m2 with different assumptions for the day illuminant:
D65  (middle) and D75 (right).



Some results with decreasing values of ambient luminance: 1, 0.6, 0.3, 0.1 and -0.1 log cd/m2 , 5, 8, 10, 11 and 15 iterations of
diffusion respectively from left to right and from top to bottom.

Por otra parte, en el contexto del cine, si bien la adquisición y exhibición siguen siendo primordialmente analógicas, en película de 35mm, la etapa intermedia de postproducción es cien por cien digital en la mayoría de los casos. Y la tendencia además es a migrar de película de 35mm a vídeo digital de alta resolución, por su menor costo, manteniendo la calidad de imagen y la apariencia del film.

Des-entrelazado: El formato entrelazado es una forma de muestreo espacio-temporal.
Para evitar el parpadeo el ojo humano requiere una frecuencia temporal de unos 60 Hz lo que, con la resolución espacial de 625 líneas y el ancho de banda de la TV analógica original, permitiría tan solo el display de unos 25 o 30 cuadros de imagen por segundo. Para resolver este problema cada cuadro se divide en dos campos, en el primero se muestrean las líneas pares y en el segundo las impares (o al revés). Dos campos consecutivos han de estar adquiridos en diferentes instantes de tiempo. El proceso de des-entrelazado es la operación que permite pasar del formato de vídeo entrelazado al formato progresivo duplicando la densidad de muestreo en la dimensión vertical de la imagen y eliminando el aliasing espacio temporal. Mencionemos un hecho importante: el muestreo de vídeo no cumple las demandas del teorema de Shannon ya que no se ha procedido a un filtrado antes del sub-muestreo – lo que permitiría evitar el aliasing. La razón es que la degradación del filtrado (blurring) introducido sería peor que el aliasing. Esta característica dificulta el problema de la conversión de formatos que no puede abordarse con métodos lineales de interpolación. Los métodos usados en la actualidad incorporan tanto la interpolación espacial (que tiene en cuenta los contornos de la imagen) como la compensación o adaptación al movimiento y las restricciones dadas por el teorema generalizado del muestreo. Éste es un ámbito perfecto para el trabajo de un matemático, pudiendo abordarlo en dos frentes: el análisis de las restricciones físicas impuestas por el proceso de adquisición de las imágenes con el objetivo de mejorar los modelos y determinar los márgenes de calidad que pueden obtenerse, y el desarrollo de algoritmos que incorporen las restricciones de funcionamiento en tiempo real. El trabajo [1] contiene una revisión excelente sobre la relevancia del problema y las técnicas más comunes empleadas en los algoritmos de des-entrelazado.

Aumento de resolución espacial: El aumento de resolución espacial de una imagen a partir de varias de ellas tiene muchas aplicaciones además de la conversión de formatos de vídeo [3], desde las imágenes médicas a las imágenes satelitales, pasando por la mejora de la calidad de impresión o las aplicaciones de vídeo-vigilancia donde interesa magnificar objetos (como matrículas de coche o caras) para reconocerlos. El aumento de resolución es posible cuando se dispone de varias imágenes diferentes de la misma escena u objeto que cuando son registradas (puestas en el mismo sistema de referencia) presentan desplazamientos con precisión por debajo del píxel. Si estos desplazamientos existen y si además hay aliasing presente, no podemos deducir una imagen a partir de la otra, lo que permite construir una imagen de mayor resolución [16,  17]. Las secuencias  de vídeo, las imágenes adquiridas por satélites orbitando alrededor de la tierra, o diversas vistas de una escena adquiridas con una cámara proporcionan las diferentes imágenes con el movimiento relativo necesario para construir una imagen de mayor resolución. La estimación del desplazamiento relativo entre las diversas imágenes (digamos k de ellas de tamaño N x M) permite compensar ese desplazamiento, lo que proporciona k x N x M valores en una retícula irregular que hay que transformar en una imagen definida en una retícula regular cuadrada. De lo dicho se deduce que este problema está ligado a muchos otros: el cálculo del desplazamiento relativo entre dos imágenes, problemas de restauración, de muestreo y de interpolación, por destacar algunos de los ingredientes principales.

Aumento de resolución temporal: Otro caso relevante en las aplicaciones es el del aumento de resolución temporal de una secuencia de vídeo, ya sea para conversión de formatos (pasar de los 25 cuadros por segundo del sistema PAL a los 30 de NTSC, por ejemplo), o en postproducción para generar efectos como el de cámara lenta [16,  17]. Problemas análogos se plantean si queremos cambiar el aspect-ratio de la secuencia.

Efectos en post-producción digital de cine: Como mencionamos antes, la práctica habitual es que la post-producción de cine se haga digitalmente aún cuando tanto el material original como el de exhibición sea película analógica 35mm. El metraje filmado se escanea a alta resolución, se procesa digitalmente, y se transfiere de nuevo a film para su proyección en cines. Tanto el escaneado de alta resolución como la transferencia a film son procesos muy costosos, pero que se justifican por la versatilidad que permite la post-producción digital frente a la clásica postproducción de laboratorio óptico: procesos como el dosificado de color, zooms, re-encuadres, se pueden hacer digitalmente en mucho menos tiempo, con mucho mejores resultados y a un coste virtualmente independiente de la cantidad de pruebas (mientras que en efectos de laboratorio cada prueba tiene el costo -nada despreciable- de la impresión de una copia). Por otro lado hay efectos que sólo se pueden hacer bien digitalmente: noche americana [3], eliminación de objetos, dosificado no lineal de color, dosificado de color para objetos particulares de la secuencia, modificación de la profundidad de campo, eliminación de ruido y restauración de películas rayadas (scratches), restauración de películas con color desvaído, etc. Ello plantea una necesidad real de buenos y eficientes algoritmos de segmentación, tracking, restauración (inpainting), estimación de la profundidad de la escena (depth from shading), corrección de color, etc. ([18]).

 

Compartir:

3 comentarios

Deja un comentario