Imprimir Republicar

Ciencia

Programados para ver

Animales les enseñan a las computadoras a identificar objetos

¿Qué se puede aprender con animales tan diferentes como una salamandra, un gato o una araña? Pues científicos de la Universidad de São Paulo en São Carlos están aprendiendo a ver. El estudio de modelos biológicos ha sido indispensable para develar los secretos de una de las más complejas atribuciones del cerebro – la visión -, para después enseñárselos a una computadora. Y se está avanzando tanto en la teoría como en la práctica. Podemos todavía estar lejos de HAL, la sagaz computadora de 2001, Una Odisea Espacial, o incluso de los androides casi humanos de Blade Runner, pero el Grupo de Investigación en Visión Cibernética ya puede exhibir neuronas virtuales, que crean vida propia dentro del ambiente virtual y pueden ser controladas de acuerdo con las reglas inferidas en la investigación con células reales. Es un camino que debe ser desandado: entender – a partir del modelo matemático – cómo las neuronas naturales interactúan, una tarea casi imposible a través los medios habituales, ya que las neuronas en laboratorio solo pueden ser estudiadas aisladamente.

El conocimiento acumulado por el equipo ha servido para el desarrollo de proyectos aplicados. Posibilitó la construcción de un ojo mecánico, terminado el año pasado, con base en el sistema visual de una araña. Y en medicina subsidia el desarrollo de un sistema de diagnóstico de la leucemia, que debe concluirse en cuatro años. El coordinador del grupo, Luciano da Fontoura Costa, ingeniero electrónico con especialización en Física, ha prestado servicios de consultoría para las industrias nacionales y extranjeras. Dos ejemplos: creó un sistema de control de calidad de monitores de video para Hewlett Packard de Brasil, y un programa de reconocimiento de patrones e inteligencia artificial en redes de computadoras e Internet para Intelligent Network de Estados Unidos.

Naranjas y manzanas
Las aplicaciones prácticas de la visión computacional, en los más diversos sectores, son inmensas, y atraen el interés de empresas y universidades en todo el mundo. Se estima que fuera de Brasil ese área mueve cerca de 5 mil millones de dólares, a pesar de que los mecanismos de visión computacional todavía sufren limitaciones. Las máquinas de inspección visual ya pueden, por ejemplo, reconocer galletas quebradas entre medio de otras enteras, pero aún tienen dificultades para distinguir objetos con contornos similares, como naranjas y manzanas, o rostros masculinos y femeninos.

Conscientes de la importancia estratégica que tiene ese área de investigación, el grupo asentado en São Carlos se ha consolidado como uno de los más destacados de Brasil, con base en la multidisciplinariedad. Forman parte del equipo especialistas en Computación, Matemática, Física, Ingeniería Electrónica y Mecánica. Hay también neurocientíficos, médicos, psicólogos e incluso filósofos. La mayoría de ellos ya se ha doctorado, por eso puede parecer extraño que una araña o una salamandra le enseñe a un grupo calificado de Homo sapiens algo acerca de una capacidad innata y aparentemente tan sencilla como la visión. Al fin y al cabo, ver parece exigir menos esfuerzo que hacer cálculos o tomar decisiones, por ejemplo.

Pero no es tan así. “Existe una tendencia a considerar la visión como si fuera un proceso simple y la imagen que vemos como una impresión directa del mundo a nuestro alrededor”, dice Costa, que coordinó el recientemente finalizado proyecto Investigación en Visión Cibernética, financiado por la FAPESP. “En realidad, la visión es un proceso sofisticado, que requiere cerca de la mitad de la capacidad del córtex cerebral de un primate y consiste en el pasaje de la imagen física a la interpretación”. Se trata de un conjunto de procesos capaces de identificar y localizar los objetos existentes en el mundo a partir de la información visual captada por sensores, una habilidad que ni siquiera las máquinas más sofisticadas lograron conquistar todavía.

Forma y función
Costa está seguro de que encontrará en la naturaleza las soluciones para el desafío de enseñar a una máquina a ver. “Si comparáramos el sistema de nervios a una máquina”, dice Costa, “el programa de la visión estaría totalmente codificado en las neuronas”. De esa manera, el primer paso en la investigación consiste en conocer y clasificar las células nerviosas. “Antes de crear un buen modelo matemático-computacional, debemos conocer la anatomía y la fisiología de esas células, y develar la relación entre sus formas y funciones”, comenta. El cerebro humano tiene centenas de tipos de neuronas y todo indica que esas diferencias son determinadas por las interacciones internas y externas del individuo, toda vez que nuestro material genético no es suficiente como para justificar un número tan alto de formas.

La teoría no es original. En las postrimerías del siglo XIX, el médico español Santiago Ramón y Cajal (1852-1934), pionero en el estudio de tejidos neuronales, atribuía la propia inteligencia humana a la forma de las neuronas. Cajal ganó, junto al italiano Camillo Golgi (1843-1926), el Premio Nobel de Medicina y Fisiología de 1906, y pasaría a la posteridad como creador de la neurociencia moderna; pero su interés por la forma neuronal no recibiría mayor atención en el transcurso del siglo XX.

En Brasil, la llamada neuromorfometría continuaría como un campo de investigación prácticamente inédito hasta que el Grupo de Visión Cibernética iniciara sus estudios acerca de cómo la forma puede influir en el comportamiento de las neuronas. “La definición de la forma de una neurona puede estar directamente relacionada con el establecimiento de conexiones sinápticas. Células más complejas, con mayores ramificaciones dendríticas, se conectan a un número mayor de células. Uno de nuestros objetivos es obtener parámetros que puedan clasificarlas”, dice Costa.

El estudio se concentró en dos tipos de neuronas, las células ganglionarias y las piramidales, las primeras de la retina del gato y de la salamandra y las otras del ratón. Como el laboratorio del grupo en el Instituto de Física de São Carlos no trabaja con animales, las imágenes de neuronas reales fueron aportadas por socios en la investigación, como el Departamento de Fisiología de la Universidad de Minnesota, en Estados Unidos, y la Universidad Federal de Río de Janeiro (UFRJ). A partir de las imágenes reales, analizadas con métodos estadísticos y de computación gráfica, los investigadores construyeron sistemas neuronales virtuales. Con ellos, pueden conocer mejor el funcionamiento de las neuronas, fundamentales para la visión, y simular situaciones reales. Ésta es la llamada visión cibernética, la expresión que los investigadores adoptan, debido a que el área representa la interfaz entre la visión biológica y la computacional.

Simulaciones
Pero lo que realmente se pretende es generar neuronas realistas, estadísticamente similares a las naturales. Para llegar a ello, el primer desafío – y quizás el más difícil- consiste en establecer patrones de clasificación. ¿Qué es lo hace que una neurona de la célula ganglionaria de la retina del gato se diferencie de cualquier otra? Fue necesario escoger un conjunto de medidas que representaran a cada grupo de neuronas, tales como el tamaño, el ancho, su orientación y ángulos de los segmentos de las dendritas y las ramificaciones de ese tipo de célula. Según Costa, la elección de esos parámetros representa un problema en abierto, que debe tener en cuenta qué es lo que se pretende estudiar.

La cuestión de la extracción de medidas, punto clave para la creación del sistema nervioso virtual, también es fundamental para el desarrollo de un mecanismo visual cibernético. A partir de una escena cualquiera, la computadora tendrá que captar la imagen que le interesa – como hace el ojo biológico – y extraer de ésta los atributos (o medidas) necesarios para su reconocimiento. El secreto es saber cuáles medidas son capaces de transformar la imagen en eficientes algoritmos (modelos o expresiones matemáticos) de identificación. En medio de un grupo de personas, por ejemplo, ¿qué es lo que hace que hombres y mujeres sean estadísticamente diferentes entre sí? ¿Altura, largo del cabello, ángulos de las facciones? Aquello que en el animal parece instintivo, la computadora deberá aprenderlo paso a paso.

El ojo de la araña
El desarrollo de un sistema de reconocimiento más eficiente fue el objetivo de uno de los primeros trabajos prácticos realizados por el Grupo de Investigación en Visión Cibernética: la construcción de un ojo mecánico. El trabajo comenzó en 1993, cuando Costa volvió después de doctorarse en el King’s College, en Londres, y terminó el año pasado. El modelo utilizado fue el sistema visual de varias especies de araña saltadora, de la familia Salticidae, escogida por tener una visión bastante evolucionada. Según Costa, esa especie posee el sistema visual más desarrollado entre los invertebrados terrestres e, incluidos los acuáticos, solo está atrás del pulpo. Además, logra detectar segmentos de recta, una habilidad ideal para el desarrollo de un ojo mecánico, debido a que facilita el almacenamiento de información.

Visión selectiva
El trabajo comenzó con la observación del comportamiento de la araña. Cautiva delante de la pantalla de una computadora,veía imágenes de hipotéticas presas y depredadores, y los investigadores observaban sus reacciones. Costa ahora reconoce que ese tipo de abordaje tenía una falla: la observación humana es subjetiva, es decir: diferentes observadores pueden llegar a diferentes conclusiones. Por eso el trabajo debió sofisticarse, con la inclusión de un estetoscopio electrónico. Colocado sobre el abdomen de la araña, el aparato midió los micromovimientos abdominales – donde se aloja el corazón del animal – y obtuvo una medición más objetiva de la respuesta a los estímulos. Los investigadores observaron que la araña saltadora era capaz de reconocer rápidamente si la imagen proyectada en la pantalla era de otra araña o no.

La retina de la araña saltadora, que tiene una forma alargada como la de un boomerang y capacidad de movimiento, mientras que la córnea permanece fija (al contrario que en el ojo humano), sirvió de modelo para la creación de un prototipo de ojo mecánico que detectase rectas con gran eficiencia para reconocer objetos de inmediato. Ese abordaje llevó también a la interpretación del reconocimiento de rectas como un problema de optimización matemática. Otra aplicación práctica de la investigación de visión cibernética involucró aplicaciones experimentales en las estaciones ferroviarias de Londres, en un trabajo en colaboración con el King’s College.

Se trata de un sistema de estimación de densidad poblacional para monitorear áreas donde se agrupan multitudes. Como en una multitud aparecen apenas pedazos de cuerpos, la computadora no reconoce seres humanos individuales. La técnica se basa en las diferencias de patrones de textura. Imágenes de baja densidad de personas tienden a presentar textura gruesa, mientras que las imágenes más densas presentan texturas más delgadas. De esa manera, las imágenes son clasificadas en diferentes categorías de texturas. Después, se emplean estadísticas de esas clases para estimar el número de personas.

La computadora también opta
Aún más sorprendente es el programa que evalúa la percepción visual, un atributo aún poco conocido por científicos y bastante influido por el ambiente, el contexto sociocultural y las emociones. “La imagen de televisión es enviada a los aparatos con pérdida de calidad”, ejemplifica Costa. “Si nuestra percepción fuese lineal, bastaría medir la imagen original, sacar la diferencia y establecer patrones de calidad”. Pero la imagen puede tener distorsiones y aun así ser agradable. Un modelo adecuado para evaluar la calidad de las imágenes debería ser capaz de considerar las sutilezas del sistema visual humano.

Fue exactamente eso lo que la computadora hizo. El año pasado, los investigadores invitaron a un grupo de 20 personas de diferentes segmentos sociales a atribuir notas a cerca de 50 imágenes. A partir de dichas notas, asociadas a medidas tales como dimensiones, contraste y color, los especialistas elaboraron un algoritmo que le permitiera a la computadora evaluar otras imágenes. Luego compararon los dos dictámenes. Humanos y máquinas valoraron puntos tales como calidad artística y originalidad, atributos directamente relacionados con el contexto cultural. La mayor sorpresa consistió en que las notas dadas por los humanos y por el modelo computacional fueron bastante parecidas.

Respuestas rápidas
Como las imágenes permanecían en la pantalla por pocos segundos, una justificación posible para la increíble concordancia es que puedan haber sido valoradas medidas más primitivas. En el ser humano, la información visual pasa primero por la base del lóbulo occipital, región de la corteza cerebral localizada cercade la nuca y responsable por el reconocimiento de segmentos de recta, que efectúa el procesamiento primario de la información visual. Si la imagen permaneciera en la pantalla durante más tiempo, la información se dirigiría hacia regiones cerebrales más influidas por las emociones y los contextos culturales, lo que podría causar distorsiones con relación a la evaluación de la computadora. Según Costa, ese detalle no inviabiliza una posible aplicación del experimento, sobre todo para la evaluación de contenidos visuales que deben provocar impacto o agradar de inmediato, como afiches en las calles, páginas de Internet o incluso anuncios publicitarios de televisión. “Uno de losbeneficios de esta investigación consiste en la identificación de la importancia específica de los diversos atributos visuales en el proceso de percepción”, dice Costa.

Actualmente, el grupo de São Carlos trabaja en un programa de diagnóstico de leucemia semiautomático en colaboración con los hematólogos Marco Zago, de la Facultad de Medicina de la USP de Ribeirão Preto, y Sérgio Martins, del Hemocentro también de Ribeirão. El objetivo es crear un software de apoyo para los médicos, para el reconocimiento de células anormales diferenciadas por alteraciones de formato. “Primero la computadora debe separar los tipos de célula de la sangre y reconocer los leucocitos, solo después de eso podrá efectuar las mediciones”, dice Costa. Hoy en día el diagnóstico es realizado de manera visual, y un tanto subjetiva.

Facilidades
Costa cree que el diagnóstico se tornará no solamente más rápido, sino también más preciso y objetivo. “Ciertos tipos de leucemia se asocian a alteraciones morfológicas bastante típicas, como anormalidades en la forma del núcleo y del citoplasma de la célula”, comenta. Por tal motivo, parece posible relacionar rápidamente la forma de la célula al tipo de enfermedad y, cruzando el resultado con los datos clínicos, tomar decisiones aún más precisas respecto a la forma de tratamiento.

Recientemente, el grupo de São Carlos se integró al Proyecto Genoma Humano del Cáncer. Algunas de sus tareas ya definidas consisten en aplicar técnicas de procesamiento de señales e imágenes, reconocimiento de patrones, inteligencia artificial y procesamiento de datos en el análisis de las informaciones obtenidas en el marco de ese proyecto financiado en conjunto por la FAPESP y el Instituto Ludwig.

Parte de esa trayectoria de ocho años está reunida en el recientemente lanzado Shape Analysis and Classification: Theory and Practice, escrito por Costa en sociedad con Roberto Marcondes César Jr., del Instituto de Matemática y Estadística de la USP de São Paulo, por invitación de la editorial norteamericana CRC Press. Mirando hacia adelante, el dúo de investigadores pretende ahora avanzar en estudios de visión cibernética con aplicaciones en análisis de imágenes de microscopía, inspección visual y reconocimiento de faces, a partir del proyecto temático recientemente firmado, que será desarrollado en los próximos tres años.

LOS PROYECTOS
Investigación en Visión Cibernética
Modalidad
Programa de Apoyo a JóvenesInvestigadores
Inversión
R$ 81.300,00 y US$ 5.000,00

Desarrollo y Evaluaciónde Métodos Originales y Precisosen Análisis de Formas e Imágenesy Visión Computacional
Modalidad
Proyecto temático
Inversión
R$ 325.000,00 y US$ 130.000,00
Coordinador
Luciano da Fontoura Costa -Instituto de Física de São Carlosde la Universidad de São Paulo

Republicar