Estrategias de los dispositivos visuales

Este post no estaba planeado, ha surgido a raíz de un artículo muy interesante de Xatakafoto, el cual recomiendo encarecidamente que leáis (por cierto, gracias @manu_lazarus por enlazármelo). En el artículo comparan los sistemas ópticos artificiales de las cámaras fotográficas con el ojo humano. En general me parece que está muy bien escrito, fácil de entender e interesante. No he encontrado errores que merezcan ese nombre, algo que me parece meritorio siendo un tema complejo. Quizás alguna imprecisión cuando habla del tiempo de exposición, pero no hablaré de ello hoy porque el tema es otro.

Voy sin embargo a quedarme con el apartado donde habla del “sensor” de nuestro dispositivo visual natural, la retina. El autor nos explica que nuestro sensor es muy superior al de cualquier cámara fotográfica, porque tenemos muchos megapixeles, pero el cerebro sólo procesa una mínima parte, por lo que cualquier cámara aporta aporta más información que nuestro ojo. Siendo más exactos, sí que es cierto que tenemos muchos “pixeles”, en concreto unos 100 ó 120 millones de pixeles, a veces más. Pero no se trata exactamente del que el cerebro no lo procese (aunque es cierto que no guarda en memoria cada punto por separado, sino “conceptos visuales” complejos). El nervio óptico transmite información de no más de millón y medio de puntos, con lo cual la el descenso súbito de megapixeles ocurre en la retina, no en el cerebro. Pasamos de más de un centenar de megapixeles, superior a cualquier cámara, a menos de dos, menos que cualquier cámara moderna.

Pero la afirmación de que el cerebro sólo procesa una pequeña parte de la información es bastante atinada. No es que se desperdicie la información visual que trae el ojo: al contrario, está muy bien aprovechada como veremos en seguida. Pero para los distintos usos simultáneos que tiene esta información en el cerebro, la llamada visión discriminativa utiliza una pequeña porción de la realidad.

Pero para entender esto, tenemos que explicar en qué consiste realmente ver.

Función de la visión

Puede parecer de perogrullo, pero la verdad es que el uso que damos a nuestros ojos no es tan evidente. Voy ha hacer un pequeño listado, ni mucho menos exhaustivo, del uso que hace nuestro cerebro de la información que llega de los ojos.

  • Iluminación media: nos sirve entre otras cosas para ajustar a tiempo real el tamaño de las pupilas, y desencadenar reflejos de protección adicionales si es necesario.
  • Protección frente a la proximidad: se desencadena un reflejo de cerrar los párpados si algo se acerca rápidamente al ojo. Esta función y la anterior son involuntarias, se producen sin que seamos conscientes de ello.
  • Creación y mantenimiento del esquema tridimensional próximo. El cerebro “virtualiza en 3D” nuestro entorno cercano gracias a las diferentes “capturas de imagen” que realizan nuestros ojos. Con un barrido constante de la realidad que nos rodea, creamos ese espacio virtual en el que nos movemos. Así, esquivamos o manipulamos objetos con seguridad, incluso aunque no los estemos viendo en ese instante.
  • Cálculo de distancias y velocidades. Este entorno tridimensional virtual se enriquece y actualiza constantemente con la información dinámica. Somos capaces de estimar velocidades y predecir dónde va a estar un objeto en los instantes siguientes. Igualmente, sin necesidad de estar mirando constantemente el objeto que se mueve. En esto consisten los deportes de pelota. Un tenista no tiene que estar mirando constantemente la pelota. Cuando la golpea con la raqueta está mirando de frente, calculando a dónde va a ir. Ya ha calculado dónde tiene que poner la raqueta unos momentos antes, y ya no tiene que mirar dónde está la pelota.
  • Percepción tridimensional aumentada por la estereopsis. Gracias a la pequeña disparidad de información entre ambos ojos, la información del relieve se ve mejorada.
  • Cálculo de la horizontal. Además de ser una parte esencial de nuestro sentido del equilibrio, los ojos calibran la “horizontal retiniana” con el horizonte visual, de forma que corregimos la posición de los ojos cuando inclinamos la cabeza (como si fuera un giroscopio).
  • Percepción del color. Aunque sea difícil de entender, el color de los objetos que vemos va en cierta medida separado de la información de la silueta y la forma.
  • Percepción del movimiento. Al igual que decíamos con el color, la información del movimiento viaja por otras redes y a diferente velocidad que el color o la forma.
  • Percepción fina o discriminativa: la que nos permite averiguar perfiles, formas y siluetas con nitidez. Es la que utilizamos para leer, reconocer caras y objetos, etc.

De estos 9 elementos, cuando hablamos de “ver” o de la información que nos da el ojo, habitualmente nos referimos sólo al último apartado. Y sin embargo, estamos constantemente utilizando de forma paralela toda la información para funciones diversas.

Podemos entenderlo con un ejemplo, el de una persona con una pérdida visual grave de la visión central, como ocurre con la degeneración macular asociada a la edad. Al estar dañada la retina central (la mácula, y dentro de ésta, la fóvea), la visión fina se deteriora mucho, hasta el punto que muchas personas están en rango de ceguera legal. Sin embargo otras funciones visuales están relativamente conservadas. Son pacientes técnicamente ciegos, que sufren porque sus actividades están seriamente limitadas (leer, reconocer caras, cocinar, manipular con las manos; todo esto requiere la visión fina); y sin embargo no se tropiezan con los objetos, deambulan con relativa normalidad, abren puertas, etc. Su percepción del entorno, aunque muy empobrecida en detalles, se conserva en lo esencial. También perciben los colores y el movimiento.

Visión y atención

Siguiendo con el ejemplo de nuestro paciente con degeneración macular asociada a la edad, aunque su vivencia es que apenas ve, para muchas cosas se sigue comportando como una persona visualmente competente. Eso es porque las funciones visuales que conserva (lo que decíamos antes de deambular, visualizar los objetos cercanos, coordinar sus movimientos con el entorno, etc), son digamos, automáticos. No son involuntarios o inconscientes como puede ser un reflejo, pero no ocupan una posición relevante en nuestra consciencia. Coordinamos nuestra motricidad con la información visual con naturalidad sin prestarle atención.

Y esa es la clave: atención. Todo el desarrollo cerebral en el ámbito visuoespacial, fruto de incontables años de evolución, lo desarrollamos en nuestra primera infancia y de adultos apenas necesita nuestra atención. Somos muy buenos manejando tanta información de forma rápida porque tiene grandes áreas cerebrales dedicadas sólo a ello.

Volviendo al tenista, en un vistazo rápido calcula dónde va a botar la pelota y lo rápida que va; en seguida generamos el movimiento que va a colocar la raqueta en el lugar adecuado. Ya antes de que hayamos golpeado la pelota estamos mirando a dónde queremos lanzarla, no tenemos que seguir mirando la pelota cómo se acerca a la raqueta. Nuestra atención está tomando decisiones, intentando decidir dónde es mejor lanzar la pelota. Los cálculos de velocidades y posiciones parecen hacerse solos.

Sin embargo, la visión discriminativa, la visión fina para reconocer formas y objetos, sí requiere nuestra atención. Se procesa en áreas cerebrales más exigentes desde el punto de vista cognitivo. Exige comparar con patrones de memoria, tomar decisiones. Requiere, en suma, nuestra atención. Por lo tanto, en cada instante, sólo podemos hacer caso a un detalle pequeño de la imagen para procesar esa visión fina.

Si resumimos y simplificamos lo que hace el cerebro con un fotograma del ojo, con la información de un instante concreto, resulta que hay una serie de información que recoge de toda la imagen (iluminación, situación de objetos, movimiento, color, situación de la horizontal, etc) y que se procesa de forma paralela sin que casi nos demos cuenta. Y luego una pequeña parte de la imagen en donde nos fijamos en el detalle exacto, y que acapara nuestra atención.

La calidad de imagen que necesitamos

Esta visión discriminativa, tan voraz de nuestra atención, tan exigente a nivel cerebral por abarcar funciones superiores (memoria, abstracción de conceptos, etc), también es exigente a nivel ocular. Necesitamos detalles, por lo que requiere una gran resolución de imagen. Eso se traduce en una gran densidad de pixeles: los fotorreceptores deben estar muy juntos, así los pixeles son más pequeños.

De esto hemos hablado en numerosas ocasiones: desde la vieja serie de los megapixeles del ojo (uno, dos, tres y cuatro) a otros artículos modernos como el de la mancha ciega. Efectivamente, tenemos mucha densidad de pixeles en el centro de la retina, superior a cualquier cámara fotográfica existente. Pero conforme nos alejamos del centro, la densidad de fotorreceptores baja mucho, muy por debajo de la calidad de las cámaras modernas.

La aparición de la fóvea en los animales que la poseemos es una ventaja evolutiva grande, nos ofrece esa visión fina superior a los animales que carecen de fóvea. La fóvea es la pequeña depresión en la retina en donde se concentran los fotorreceptores. La visión de alto detalle que nos ofrece la fóvea da ventajas claras de supervivencia (reconocemos depredadores y presas, frutas para comer, mejora el comportamiento social, etc). Y cuanto más detalle, mejor, así las fóveas se han ido especializando y haciéndose más densas, como en el caso de las aves.

Pero la evolución no ha favorecido que esa mayor densidad de fotorreceptores se extienda por toda la retina. Casi toda la retina ha mantenido una concentración de receptores relativamente baja  en comparación con los sensores de las cámaras fotográficas, porque no hay ventajas evolutivas para ello. Para “ver” los objetos de nuestro entorno, calcular posiciones y velocidades, no necesitamos ver con gran detalle en todo nuestro campo visual. Con una pequeña área de detalle es suficiente. Ya iremos desplazando el ojo por donde nos interese. Los fotorreceptores son muy caros a nivel energético, y no hay una contraprestación clara a nivel evolutivo para que una retina con más fotorreceptores tenga lugar.

Un ojo concreto para un cerebro concreto

Nuestro cerebro sólo puede prestar atención a pocos detalles a la vez. Así que nuestro ojo ofrece mucha información general para los múltiples circuitos que la pueden procesar, pero información detallada muy acotada a lo que nuestra atención puede atender. Lo que por otra parte es lógico: no tiene sentido que el ojo desarrolle unas capacidades visuales que nuestro cerebro no vaya a aprovechar.

Y es que nuestro ojo no tiene como función capturar toda la información posible, sino sólo la que vamos a utilizar. La realidad va a seguir ahí fuera el próximo instante, ya moveremos el ojo hacia el detalle que queremos ver después. De manera con rápidos movimientos oculares, en pocos instantes hemos recogido toda la información que nos interesa. Y no tenemos la sensación de que nos falta resolución en nuestra imagen. Ésa es la estrategia de nuestro ojo. Cuenta con el aspecto dinámico y un alucinante sistema motor que multiplica su capacidad al barrer nuestro entorno con rápidos saltos.

Una cámara fotográfica es totalmente diferente. No se trata, como nuestros ojos y cerebro, de hacer innumerables “fotografías” y luego hacer una composición con pequeños pedazos de cada una. Se trata de capturar el máximo de detalles de la imagen que tenemos delante en una sola instantánea. La estrategia de la fotografía es imitar la realidad, aunque sea congelándola en un instante. Porque una fotografía no es un “fotograma” del ojo, válido sólo para un instante. En una fotografía nos recreamos, la recorremos con numerosos saltos (movimientos sacádicos) de nuestros ojos. Por lo tanto, una cámara necesita una densidad de sensores homogénea y lo más alta posible.

Estrategias diferentes: Una cámara tiene que capturar el máximo de detalles a la vez, porque queremos atrapar la información visual para un futuro. Un ojo no almacena la información para después, eso lo hará la memoria y para ello utilizará todas las “capturas de imagen” que necesite. Un ojo atrapa la información en un instante que el cerebro puede atender, ni más ni menos, y el instante siguiente está listo para mirar a otro sitio.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *