Cifras Publicadas de Calidad de Imagen


Recientemente el fotógrafo Francesc Muntada me pedía opinión sobre una nueva cifra de medida de la calidad publicitada por la web dpreview a través de su partner DxO Labs, llamado Perceptual MPix. Supongo que mi dedicación a la medida de calidad de imagen en el Image Quality Laboratory de la Universidad Politècnica de Catalunya y la profusión de datos y opiniones que se publican al respecto, es lo que provoca la consulta. Aunque la respuesta no es sencilla, intentaré aquí contestar a su petición y razonar algunos argumentos de mi opinión al respecto de la medidas de calidad que se publican en general en diversa páginas web.

En los tiempos de la fotografía foto-química, los ensayos sobre cámaras y objetivos solían ser, con pocas excepciones, más artículos de opinión que otra cosa. De hecho, el problema de base residía en que la calidad de imagen obtenida con una determinada combinación de cámara, objetivo y película no era fácil medirla numéricamente al ser necesario un instrumental específico para acceder a la información contenida en la imagen, fuese ésta un negativo, una diapositiva o una copia sobre papel. Miras de resolución, microscopios, microfotómetros y microdensitómetros estaban sólo al alcance de laboratorios especializados de los propios fabricantes o centros de investigación.

Si sumamos a todo ello que la combinatoria resultante de la interrelación entre objetivo, iluminación, apertura de diafragma, tipo de película y procesado de la misma, arrojaba un sin fin de posibilidades, la única vía en términos prácticos se reducía a comparar e intentar combinar los resultados de resolución publicados por los fabricantes de las ópticas y de las películas con la calidad percibida en las imágenes resultantes. Con el riesgo implícito que conlleva cualquier apreciación visual, se conseguía un cierto consenso cuando esas observaciones las realizaban personas relacionadas con el medio y conocedoras de la problemática implicada en la calidad percibida en las imágenes en el estadio final de aplicación.

La consecuencia de estas dificultades generaba un cierto consenso en equipos y películas para el trabajo profesional que, aunque basado en criterios relativamente subjetivos, era seguro. Así las cámaras Nikon, Hasselblad o Rollei y Sinar o Linhof, los objetivos Nikkor, Carl Zeiss y Schneider o Rodenstock junto a las emulsiones PlusX, TriX, Kodachrome y Ektachrome de Kodak o Fuji Velvia de Fujifilm, acababan por ser la meta de la mayoría de profesionales. Por una parte les aseguraba un nivel de calidad unificado en el sector alto y por otra les permitía centrarse en todo aquello relacionado con la imagen en sí misma, eje central de su actuación profesional.

Actualmente, el carácter discreto de los sensores por un lado y numérico de la información contenida por otro,  permiten el acceso a dicha información por medio de un ordenador. De hecho, la única forma de acceder a ella es mediante la descodificación en un programa de ordenador adecuado al formato y organización de los datos de la imagen. Este acceso prácticamente universal, asociado a los usos técnico científicos de la imagen electrónica, ha permitido un desarrollo sin precedentes de los métodos de medida de la calidad proporcionada por los sistemas de captación de imagen. En esta línea y desde hace ya algún tiempo, diversas páginas web publican resultados de ensayos de cámaras y objetivos con el fin de orientar a los potenciales compradores sobre la decisión más acertada.

En este sentido, podemos encontrar desde páginas web, blogs o foros de opinión basados en una buena voluntad que, en principio, no se les puede negar, aunque con poca fiabilidad sobre los resultados que muestran a interfaces de usuario sofisticadas como la de dpreview (Figura 1) en la que el usuario puede combinar cuerpos de cámara, objetivos y aperturas de diafragma para observar resultados numéricos y objetivos en todo el campo imagen relacionados con la MTF del sistema, la distorsión, la aberración cromática lateral (TCA) y el viñeteado. Estos resultados, derivados del software suministrado por DxO Labs  permiten tener una opinión de conjunto muy bien relacionada con algunos de los problemas prácticos más habituales en fotografía tanto profesional como doméstica.

dpreview_interficie
Figura 1. Interfaz de dpreview donde se evalúa el conjunto de cámara Nikon D3x equipada con el objetivo Nikon AF-S Nikkor 70-200mm 1:2.8 VR II, ajustado a la longitud focal de 70mm y con la apertura de diafragma en f/2.8. Nótese como la posición del cursor muestra ampliada la porción del test en el que puede apreciarse la existencia o no de TCA y un arco de posición sobre el campo imagen que se corresponde con la línea roja vertical que señala en qué porción de los gráficos de la derecha se muestran las medidas. (Hacer click sobre la imagen para observar una ampliación de la misma)

Poco antes de Navidad, la misma página  dpreview anunció la introducción de un nuevo concepto en las medidas proporcionadas, el llamado Perceptual MPix que tiene en cuenta la acutancia (contraste local) y la función de sensibilidad al contraste humana (Human CSF) para determinar una cifra global de la calidad proporcionada por un sistema cámara-objetivo. La idea subyacente es relacionar los resultados puramente numéricos con aquéllos que son realmente trascendentes en relación con los observadores finales de las imágenes. En la anterior versión del programa, el resultado numérico se basaba no en el conjunto de la MTF del sistema sino en la MTF medida como aquella frecuencia para la que el sistema retiene al menos un 50% del contraste presente en la escena u objeto fotografiado. A esta medida se la denomina genéricamente MTF50. En la versión actual se ha sustituido este criterio por uno corregido según la ya mencionada Human CSF. Al menos hasta donde yo he sido capaz de encontrar en la página web de DxO Labs, no se ofrece ninguna explicación precisa sobre cómo se aplica esta corrección. De todos modos, este factor corrector se ha venido utilizando desde hace ya bastantes años en sistemas de evaluación de calidad de pantallas de ordenador para uso médico o en pantallas de guiado de armas donde, tanto en un caso como en el otro, la percepción del observador puede ser un factor determinante.

En el caso que nos ocupa, la evaluación de equipos de fotografía profesional, la incorporación de este factor corrector debe valorarse en positivo ya que finalmente, las imágenes están destinadas a ser observadas por personas y por lo tanto, cualquier relación con los parámetros que rigen esta observación ha de mejorar el criterio de evaluación. ¿Dónde está el problema, pues? En mi opinión, sea cual sea el parámetro que se utilice para determinar una medida de calidad instrumental, la dificultad real reside en la complejidad de las interrelaciones que se producen entre las propiedades de las ópticas, sus aperturas de diafragma, las características del sensor, el tipo de procesado que se haga de las imágenes obtenidas y el método de visualización que se emplee en el estadio de aplicación final. Esta complejidad no debe valorarse sólo en sí misma sino sobre todo en relación a los múltiples campos de aplicación de la imagen fotográfica. Estas aplicaciones son tan variadas que resulta complicado establecer cuáles son los criterios a tener en cuenta para decidir si una determinada combinación de equipo es adecuada o no en cada caso. Este razonamiento invalida por sí mismo las comparaciones entre equipos similares si no se especifica previamente para qué aplicación se establece la comparación.

Sobre lo expuesto en el último párrafo, consideremos un ejemplo. En las Figuras 2 y 3 se muestran los resultados de la MTF del sistema, determinada para cada apertura de diafragma en el caso de una cámara PhaseOne 645 equipada con un objetivo Schneider 120mm Macro y un respaldo PhaseOne P40+; la Figura 2 corresponde al modo de utilización Estándar y la Figura 3 al modo Sensor+. Aclaremos que el modo Estándar proporciona una imagen con un número de píxeles que se corresponde con el número de foto-receptores del sensor, mientras que el modo Sensor+ proporciona un píxel para cada cuatro foto-receptores. Este sistema permite evitar la interpolación del color en la operación de desmatrizado del filtro Bayer al crear los canales RGB a cambio de obtener una imagen con un volumen en píxeles cuatro veces menor, 10 millones de píxeles frente a los 40 millones del modo Estándar.

MTF_Standard
Figura 2. MTF de sistema a todas las aperturas de diafragma de una cámara PhaseOne 645 equipada con un objetivo Schneider 120mm Macro y un respaldo PhaseOne P40+ en el modo Estándar. (Hacer click sobre el gráfico para ver una versión ampliada)
MTF_SensorPlus
Figura 3. MTF de sistema a todas las aperturas de diafragma de una cámara PhaseOne 645 equipada con un objetivo Schneider 120mm Macro y un respaldo PhaseOne P40+ en el modo Sensor+. (Hacer click sobre el gráfico para ver una versión ampliada)

Si se observan en conjunto ambos gráficos, resulta evidente que el de la derecha (modo Sensor+) muestra un mayor contraste a todas las frecuencias; por lo tanto, el resultado es mejor para cualquier valor de apertura del diafragma. Pero si en lugar de expresar la frecuencia en unidades relativas (ciclos/píxel), lo hacemos en unidades absolutas, pares de líneas por milímetro (lp/mm), el resultado es completamente distinto (Figura 4). Ahora las curvas MTF del modo Estándar muestran más resolución que las del modo Sensor+ y para las mismas frecuencias, siempre un mayor contraste.

PhaseOne_2modes
Figura 4. Conjunto de MTF de sistema para los modos Estándar (trazos continuos) y Sensor+ (trazos discontinuos) de la misma configuración de cámara y objetivo de las Figuras 2 y 3. Las unidades de frecuencia son, en este caso, absolutas. (Hacer click sobre el gráfico para ver una versión ampliada)

¿Significa esto que los gráficos de las Figuras 2 y 3 son erróneos? De ningún modo. Simplemente, están expresados en unidades relativas, lo que significa que cada valor de frecuencia en las unidades expresadas tiene una significación distinta en valor absoluto para cada modo de funcionamiento del sensor. Si el observador de los gráficos no lo tiene en cuenta, el juicio puede ser erróneo. Por otra parte, ¿para qué proporciona PhaseOne un modo de funcionamiento, el Sensor+, que da peor resultado en la MTF a todas las aperturas de diafragma si se le compara con el modo Estándar? Una posible respuesta consiste en poder disponer de una opción si se debe diafragmar mucho que evite los problemas causados por la difracción a aperturas pequeñas de diafragma. Si se usa este modo, además, no se interpola ninguno de los colores al crear los canales de color RGB  a partir del mosaico Bayer en el estadio raw y ello puede ser decisivo en determinados casos y aplicaciones como por ejemplo, en tomas con colores críticos adyacentes. En ambos casos corresponde al usuario valorar si el plus añadido de calidad compensa la pérdida de resolución.

Sigamos con los ejemplos. Observemos ahora los gráficos de las Figuras 5 y 6. Ambos corresponden a un trazado de valor de gris de píxeles obtenido a partir de la imagen de una mira sinusoidal para analizar la respuesta de la cámara al aliasing. Ambas tomas se han realizado a la apertura de diafragma que mostraba el mejor resultado en las MTF correspondientes y mientras el de la Figura 5 pertenece al modo de funcionamiento Estándar del sensor, el de la Figura 6 es el correspondiente al modo de funcionamiento Sensor+.

Sinus_LQI_080_II
Figura 5. Gráfico de valor de gris de píxel obtenido de la captación de una mira sinusoidal con el equipo PhaseOne descrito anteriormente en modo de funcionamiento Estándar. (Hacer click sobre el gráfico para ver una versión ampliada).
Sinus_Sensor+_f080_II
Figura 6. Gráfico de valor de gris de píxel obtenido de la captación de una mira sinusoidal con el equipo PhaseOne descrito anteriormente en modo de funcionamiento Sensor+. (Hacer click sobre el gráfico para ver una versión ampliada).

Dado que según los datos del fabricante, el sensor PhaseOne P40+ no equipa filtro anti-aliasing (LPF por low pass filter), analizar la respuesta a una frecuencia de entrada superior a su límite de resolución puede ser indicativo de la propensión a mostrar fenómenos de moiré asociados al aliasing o respuesta falsa. Dicha frecuencia la proporciona una mira sinusoidal adecuada, la disposición en relación al aumento de la toma y la apertura del diafragma del objetivo, relativamente grande, que implica un alto poder de resolución al estar poco afectado por la difracción. En relación con este riesgo, los tres patrones de la izquierda deberían ser resueltos por la cámara siendo el central el que se corresponde con la frecuencia límite en cada caso, 84lp/mm para el modo Estándar y 42lp/mm para el modo Sensor+. Los dos patrones de la derecha, exceden en frecuencia el límite del sensor y en condiciones normales, no debería producirse en su imagen ningún tipo de respuesta. Como puede observarse, este no es el caso. En el ejemplo del modo Sensor+ además, la respuesta falsa o aliasing tiene mayor amplitud (contraste) y afecta a los dos patrones de la derecha. Por lo tanto, resultará más visible en la imagen. Ello no es de extrañar ya que el objetivo y su poder de resolución es el mismo en ambos casos mientras que el modo Sensor+ tiene un poder de resolución sólo la mitad del que ostenta el modo Estándar que, en este caso, presenta una respuesta falsa de menor amplitud y localizada en el patrón inmediatamente posterior a la frecuencia límite. Más allá de este patrón, a su derecha en el gráfico, la respuesta es casi nula.

Pero la cuestión es, ¿hasta dónde es importante este aliasing? La respuesta no la tenemos en los gráficos de las Figuras 5 y 6, pero si analizamos las imágenes de donde provienen los gráficos (Figuras 7 y 8), resulta más fácil formarse una opinión.

Sinus_Estandar
Figura 7. Imagen de los patrones de la mira sinusoidal correspondiente al gráfico de la Figura 5. (Hacer click sobre la imagen para ver una versión ampliada sin aliasing de muestreo de pantalla).
Sinus_SensorPlus
Figura 8. Imagen de los patrones de la mira sinusoidal correspondiente al gráfico de la Figura 6. (Hacer click sobre la imagen para ver una versión ampliada sin aliasing de muestreo de pantalla).

Para juzgar los resultados, ambas imágenes deben observarse en sus versiones ampliadas (haciendo click sobre ellas se abren en una nueva pestaña o ventana según la configuración del navegador). Ello evita visualizar fenómenos de aliasing a causa del tamaño y resolución de las pantallas. En ambas imágenes se ha respetado también el tamaño original, sin interpolar al alza o sub-muestrear para no interferir en la visualización de la información captada. Si se procede de este modo, los patrones correspondientes al modo de funcionamiento Estándar no muestran fenómenos de moiré claramente perceptibles a excepción del patrón correspondiente a la frecuencia límite, el central. Aunque la baja frecuencia de la réplica no debería tener consecuencias graves en las imágenes tomadas en este modo, conviene estar atento a la aparición de respuestas falsas coloreadas si se toman imágenes de objetos con patrones periódicos. El modo Sensor+, en cambio, muestra claramente moiré tanto en los dos patrones anteriores a la frecuencia límite como en los dos posteriores. Ello indica un alto riesgo de observar este tipo de artefactos en las imágenes.

¿Hemos contestado con ello la pregunta anterior, “hasta dónde es importante este aliasing“? Evidentemente no. Si la aplicación de la cámara es la toma de paisajes, este comportamiento respecto del aliasing no nos deberá preocupar demasiado dado que es muy difícil que en una escena de paisaje haya presencia de patrones periódicos y en caso de que los hubiera, el cierre del diafragma para conseguir profundidad de campo haría aumentar la tasa de difracción, reducir en consecuencia la resolución del objetivo y evitar que se dé el problema. Si usamos la misma cámara para tomar bodegones y necesitamos profundidad de campo, el diafragmado necesario producirá el mismo efecto que en el paisaje y el problema no existirá. Pero si nuestra tarea es la reproducción de originales planos con texturas periódicas, el problema será evidente en el modo Sensor+ a menos que cerremos el diafragma aunque no necesitemos profundidad de campo. Si por el contrario, la tarea es reproducir originales fotográficos antiguos, placas de vidrio en negativo o también copias de época, su bajo poder de resolución impide que estos problemas sean relevantes dado que el objeto no contiene la frecuencia que puede causarlos. Aunque el poder de resolución del objetivo para una apertura de diafragma dada sea muy alto, éste no transmitirá al sensor una frecuencia que no esté presente en el objeto.

Resumiendo y para contestar al buen amigo Francesc Muntada suponiendo que haya tenido la paciencia de leer hasta aquí, intentaré ser conciso:

  • Cualquier aportación de mejores medidas de calidad al alcance de los fotógrafos creo que debe ser bien recibida por el colectivo pues, con el grado de conocimiento necesario, ha de permitir discriminar la utilidad de determinados equipos en cada caso.
  • Los intentos de reducir la medida de la calidad de los equipos a una única cifra puedo entenderlos en términos de cuota de mercado pero les confiero poca utilidad real. No hay que olvidar que el público potencial de estas páginas web es muy amplio y diverso y que detrás están los fabricantes y distribuidores ejerciendo su legítima presión sobre los posibles compradores.
  • Los fotógrafos profesionales son una parcela extremadamente pequeña de este mercado potencial al que se dirigen estas informaciones “reduccionistas”.
  • Finalmente, la interpretación de los resultados en función de la aplicación es la clave, más que la clasificación en mejores o peores equipos.

Como siempre, ésta es sólo mi opinión y no pretende sentar cátedra. Aún así, os invito a visitar las galerías de este blog, Shapes & Shadows y Silent Places para que juzguéis si se aprecia la diversidad de cámaras, objetivos y películas que se utilizó en la toma de las imágenes. Para evitar efectos de aliasing por sub-muestreo, activar siempre la opción View full size, sobre todo en pantallas pequeñas. Si la memoria no me falla, la lista de equipos es la siguiente:

  • Nikon FM2, diversos objetivos y películas en formato 135 Kodak TriX y Technical Pan.
  • Zenza Bronica RTS, diversos objetivos y películas Kodak TriX-P y PlusX en formato 120.
  • Hasselblad 500CM, diversos objetivos y película Kodak TriX-P en formato 120.
  • Linhof Tecknika IV, diversos objetivos y película Kodak TriX-P en formato 120.
  • SinarF, diversos objetivos y película Kodak TriX-P en formato 4×5″.
  • Canham DLC45, diversos objetivos y película Fuji Provia ISO100 en formato 4×5″.
  • Nikon D70 con zoom Nikkor 18-70mm.
  • Nikon D700 con diversos objetivos de longitud focal fija.

Al margen de la consideración que os merezcan las imágenes en sí mismas, las diferencias en calidad percibida creo que estaréis de acuerdo en que son mínimas. Quizá no lo serían tanto si observásemos las mismas imágenes impresas a un determinado tamaño o incluso cada cual impresa al tamaño mayor que permite su resolución. En fin, que hay que hablar siempre de condiciones de toma, aplicación de las imágenes y condiciones de observación. No existen problemas sencillos, que para eso son problemas, ni por lo tanto, respuestas simples.

2 Replies to “Cifras Publicadas de Calidad de Imagen”

  1. Molt bon article. Una lliçò de MTF, freqüència absoluta, freqüència relativa, aliasing i condicions de presa de la imatge.

    Felicitats Carles.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s