
En el mes de junio publicamos la primera parte de un este artículo
Las matemáticas y el procesamiento de imágenes (I).
En esta segunda entrega haremos referencia a
la fotografía digital, el procesamiento de imágenes satelitales, la reconstrucción tridimensional a partir de imágenes estéreo o vídeo, el reconocimiento de formas y búsqueda de imágenes en bases de datos, el campo del procesamiento y análisis de las imágenes médicas, la codificación y compresión de imágenes y los gráficos por ordenador y procesamiento de superfícies.
La fotografía digital
El auge de la fotografía digital (con cámaras o teléfonos móviles) y
las posibilidades que con ella se abren es un campo fértil para el
desarrollo de herramientas de software dirigidas a la mejora de la
calidad de las imágenes, a la mejora del contraste de color, la
corrección de distorsiones, la mejora de la nitidez, el aumento de
resolución, etc
[4].
Con estas herramientas técnicas los usuarios pueden conseguir con el
teléfono móvil fotografías de gran calidad. Este campo permite
desarrollar y hacer efectivos muchos de los algoritmos básicos de
procesamiento de imágenes.
Procesamiento de imágenes satelitales
Ésta es una de las áreas tradicionales del procesamiento de imágenes
para la que se han desarrollado y se siguen desarrollando muchos
algoritmos: deconvolución y eliminación de ruido, fusión de imágenes
multiespectrales, reconstrucción de modelos digitales de elevación de
terreno y de topografía urbana. Por otro lado, el uso de imágenes
satelitales en agricultura o teledetección plantea problemas de
segmentación y de reconocimiento de patrones, sean éstos ríos,
carreteras, zonas urbanas, o rurales, por no hablar de las numerosas
aplicaciones militares [19,
20].
Fusión de imágenes multiespectrales
Reconstrucción tridimensional a partir de imágenes estéreo o vídeo
Ésta es otra de las áreas clásicas de la visión por ordenador, el de la
reconstrucción tridimensional de una escena a partir de pares de
imágenes estéreo o de secuencias de imágenes. Buscar la imagen
La base de estas aplicaciones es la
geometría proyectiva y la calibración de cámaras y sus desarrollos han sido espectaculares en los últimos 15 años
[5].
Entre otras múltiples aplicaciones mencionemos la de la reconstrucción
tridimensional de sitios históricos o cascos urbanos a partir de vídeo
lo que ofrecería posibilidades de navegación mucho más sofisticadas que
las que podemos tener actualmente con
Google Earth [6].
Finalmente y en el ámbito de las aplicaciones médicas, podemos
mencionar a título de ejemplo la reconstrucción - y visualización - del
tracto digestivo a partir de las imágenes obtenidas por endoscopia
[7].
Reconocimiento de formas y búsqueda de imágenes en bases de datos
El reconocimiento de formas es uno de los objetivos fundamentales del
análisis de imágenes y, a pesar de los desarrollos espectaculares que
se han producido en tiempos recientes, aún estamos lejos de poseer
algoritmos industriales, por ejemplo, para la detección de logos en la
publicidad [8].
Las numerosas aplicaciones industriales van a ser un motor de
desarrollo de este campo: piénsese en la necesidad de buscar imágenes
por su contenido en la web (compárese con la facilidad para buscar
textos) u otras bases de datos (piense en la posibilidad de identificar
un objeto concreto en una base de datos de objetos robados)
[9].
Entre otras posibles aplicaciones industriales mencionemos las ligadas
al control de calidad, piénsese en el control automático de la calidad
en industrias de azulejos por análisis de los patrones de textura de
los mismos.
Por otra parte, el reconocimiento de formas o patrones es el hecho
clave de la visión humana y su estudio está relacionado con la
psicología y la neurociencia [21]. La interacción de estas disciplinas
es fundamental para el avance de la visión computacional.
El campo del procesamiento y análisis de las imágenes médicas
Éste es uno de los campos más vastos dentro del procesamiento de
imágenes y abarca desde su adquisición hasta su procesamiento e
interpretación como ayuda al diagnóstico. Aunque existen numerosos
equipos de investigación dentro de las empresas que construyen los
aparatos de adquisición, el análisis de estas imágenes como ayuda al
diagnóstico es un campo en el que queda mucho camino por recorrer.
Existen grupos de investigadores especializados en el estudio de
imágenes de cada uno de los órganos del cuerpo humano: cerebro,
corazón, hígado, sistema vascular, etc. En muchos de estos casos, el
primer paso es la segmentación para la reconstrucción tridimensional
del órgano en cuestión a partir de las imágenes dadas. Para mencionar
un ejemplo que ilustra las múltiples implicaciones del problema,
mencionemos el caso del estudio del sistema vascular: este estudio
requiere la obtención de modelos anatómicos individualizados, el
estudio y caracterización morfológica del dicho sistema o alguna de sus
partes donde haya un problema, y eventuales simulaciones de dinámica de
fluidos para comprender las presiones a que se ve sometida la
estructura en cuestión [
10,
11]. Hemos mencionado este caso para dar a entender la complejidad del
problema y la necesidad de una interacción multidisciplinar que sólo
está al alcance de equipos muy potentes y estructurados.
Imagen de un cerebro cuando sufre una intensa migraña
Codificación y compresión de imágenes
Este área es una de las que han tenido un desarrollo más espectacular
en los últimos 20 años llevando al desarrollo de los estándares
actuales de compresión tipo JPEG o MPEG [
13,
14].
Los desarrollos en compresión de imágenes han estado ligados a la
palabra clave "wavelets" (ondículas, en castellano) y el actual JPEG
2000
[12] está basado en esta herramienta de compresión.
Las
wavelets
se desarrollaron a partir de una interacción fructífera entre
ingenieros, físicos y matemáticos, y podemos decir en este caso, que
los matemáticos jugaron un papel fundamental
[15]. Los nombres de
Jean Morlet,
Alex Grossman,
Yves Meyer,
Stéphane Mallat,
Ingrid Daubechies
son nombres de actores principales en este capítulo. Actualmente, la
compresión sigue atrayendo la atención de muchos investigadores (como
se refleja en las numerosas publicaciones en revistas y congresos)
debido a la cantidad inmensa de datos que almacenar.
Gráficos por ordenador y procesamiento de superfícies
Ésta es un área muy desarrollada con fuertes conexiones industriales
como por ejemplo con la industria del automóvil, la industria del cine
o los videojuegos. Existen ya múltiples herramientas para crear
imágenes sintéticas o representar y visualizar superfícies de objetos
industriales con la iluminación adecuada
[7].
Algunos de los problemas arriba mencionados, como la reconstrucción del
tracto digestivo a partir de endoscopias, o la reconstrucción de zonas
urbanas o sitios históricos a partir de vídeos reales, plantean
numerosos problemas de reconstrucción y visualización de superfícies,
que atraen la atención de los investigadores
[22], y que merecen ser
impulsados en el contexto nacional.
Digamos, finalmente, que estos ejemplos son sólo eso, ejemplos en un
vasto mar de aplicaciones en las cuales interviene el procesamiento de
imágenes y la visión por ordenador, y esto no es más que un ejemplo de
procesamiento de datos siendo éstos datos con estructura geométrica
bidimensional (como es el caso de las fotografías), tridimensional
(caso de imágenes 3D o secuencias de vídeo), o incluso
tetra-dimensional (para el caso de imágenes 3D en movimiento).
[4] DXO: Photography, D-SLR and high end digicam automatic image
quality enhancement,
http://www.dxo.com/en/photo/home/default.php
[5] Hartley, R.; Zisserman, A.; Multiple View Geometry in Computer Vision, Cambridge University press, (2004).
[6]
Dick, A.R.; Torr, P.H.S.; Cipolla, R.; Modelling and Interpretation of
Architecture from Several Images. International Journal of Computer
Vision archive 60(2), (2004), (111-134).
[7] Greiner, G.; Personal communication.
http://www9.informatik.uni-erlangen.de
[9]
Sagarmay, D.; Zhang, Y.; An overview of content-based image retrieval
techniques, Advanced Information Networking and Applications, 2004.
AINA 2004. 18th International Conference, (2004), (59-64).
[10]
Frangi, A.F.; Niessen, W.J.; Viergever, M.A.; Three-dimensional
modeling for functional analysis of cardiac images, a review, Medical
Imaging, IEEE Transactions on Volume 20, Issue 1, (Jan 2001), (2-5).
[11] Frangi, A.F.; Laclaustra, M.; Lamata, P.A.; A registration-based
approach to quantify flowmediated dilation (FMD) of the brachial artery
in ultrasound image sequences; Medical Imaging, IEEE Transactions on
Volume 22, Issue 11, (2003), (1458-1469).
[12]
Rao, K.R.; Huh, Y.; JPEG 2000, Video/Image Processing and Multimedia
Communications 4th EURASIP-IEEE Region 8 International Symposium on
VIPromCom 16-19, (2002), (1-6).
[13] Wallace,
G.K.; The JPEG still picture compression standard, Consumer
Electronics, IEEE Transactions on Volume 38, Issue 1, (Feb. 1992),
(27-34).
[14] Sikora, T.;MPEG digital video-coding standards, Signal Processing Magazine, IEEE Volume 14, Issue 5, (1997), (82-100).
[15] Mallat, S.; A Wavelet Tutorial of Signal Processing, Academic Press, (1999).
[19] Remote Sensing and Image Processing, http://www.landcareresearch.co.nz/services/remotesensing/
[20] TTI Production, Earth Sciences and GIS, Satellite Mapping.
http://www.tti.fr/
[21] Deco, G.; Rolls, E.; Computational Neuroscience of Vision. Oxford University Press, (2001).
[22] Rumpf, M.;
http://numod.ins.uni-bonn.de/people/rumpf/rumpf.shtml.