MONTAGEM SOBRE FOTOS DE EDUARDO CESAREl tiempo que tarda un cajero de un supermercado de la localidad paulista de Campinas para ubicar en una lista impresa los códigos referentes a frutas y legumbres llamó la atención del profesor de ciencia de la computación Anderson de Rezende Rocha, de la Universidad Estadual de Campinas (Unicamp). Mientras que los productos con códigos de barras en sus embalajes eran registrados rápidamente, la identificación de los vegetales trababa el movimiento de la cola. Tuvo entonces la idea de desarrollar un sistema capaz de distinguir entre vegetales, que se venden a granel y es difícil identificarlos con el lector electrónico de la caja, porque no portan códigos.
La solución que halló Rocha junto a los investigadores Daniel Hauagge, Jacques Wainer y Siome Goldenstein, también del Instituto de Computación de la Unicamp, fue desarrollar un sistema, mediante empleo de una cámara instalada sobre la balanza de la caja, destinado a analizar las imágenes del producto que será clasificado. Esta invención tiene en cuenta diversos tipos de informaciones, tales como por ejemplo el color, la forma, la textura, la silueta, la apariencia de frutas y legumbres, y los cruza de manera tal de crear poderoso discriminador para cada uno de esos productos. El software que ellos desarrollaron es capaz de diferenciar los diversos vegetales con base en la combinación de características de cada uno.
Rocha explica que la cámara captura exclusivamente la imagen del producto. Las informaciones se extraen del sistema mediante algoritmos (cálculos matemáticos) de procesamiento de imágenes y reconocimiento de patrones. Pese a que parece complicado, el funcionamiento de la invención desarrollada durante el doctorado de Rocha –dirigido por el profesor Siome Goldenstein y con beca de la FAPESP– es sencillo. Posee dos etapas: entrenamiento y prueba. Durante la capacitación, varias imágenes de productos vendidos en el supermercado se cargan en el sistema, de manera tal que éste pueda aprender las características descriptivas de cada uno. Esto se hace identificando especificidades de cada tipo de fruta o legumbre. “Posteriormente, cada tipo de producto es entrenado [comparado] contra otro, en lugar de entrenar a todos contra todos juntos.”
El sistema se vale de un método que divide el problema de categorizar muchos productos distintos en problemas menores y más tratables. “Esto se puede entender mejor si se considera una situación con tres cosas, como por ejemplo tres frutas diferentes: naranja, manzana y ananá”, dice Rocha. En este ejemplo, se pueden definir dos cosas por vez y decir que una de ellas será considerada como tipo virtual positiva y la otra como negativa, o simplificando: que una es manzana y la es otra naranja. Esto se hace con las diversas combinaciones de productos, tomando dos por vez. Pueden ser “naranja versus manzana”, “naranja versus ananá” y “manzana versus ananá”. Pueden existir otras posibilidades distintas. Por ejemplo, el sistema podría ser entrenado para comparar un tipo de producto contra todos los otros. En ese escenario sería posible tener “naranja versus el resto”, “manzana versus el resto” y “ananá versus el resto”. “Lo importante acá es abordar el problema dividiéndolo en partes menores”, dice Rocha.
Postulantes en la balanza
Cuando el sistema entra en actividad comienza la fase de pruebas. De cada imagen capturada y suministrada para su clasificación, extrae el mismo conjunto de características del vegetal. Y las compara con las que han sido almacenadas previamente en la etapa de entrenamiento. Así podrá suministrarle al operador de la caja una lista de posibilidades de que sea una determinada fruta o legumbre. Una vez confirmado esto por parte del cajero, basta con verificar el precio del kilogramo del producto y multiplicarlo por su peso. En esta forma de resolver el problema radica la gran innovación del sistema, que resultó en una patente depositada en el Instituto Nacional de la Propiedad Industrial (INPI). Según Rocha, los sistemas existentes son distintos y menos precisos. Hay uno en Estados Unidos, por ejemplo, llamado VeggieVision. “Ese sistema extrae el fondo, detecta el tamaño de los objetos independientemente de su cantidad en la escena y los compara con las referencias”, explica Rocha. “Se basa en las propiedades de color, textura y densidad, lo que requiere informaciones extras de la balanza.”
En la comparación del índice de acierto en la clasificación de frutas y legumbres, el VeggieVision pierde con relación al sistema brasileño. “El índice de acierto del similar norteamericano, mostrando los cuatro productos más probables al cajero, es del 95%”, dice Rocha. “Mientras que el nuestro, al mostrar las dos respuestas más probables, es del 99%”. Para Rocha, una comparación más completa también debería tener en cuenta otros factores. Otra desventaja del VeggieVision consiste en que incorpora en el aparato de adquisición de datos mecanismos especiales para operar con variaciones de iluminación y supresión de los reflejos provocados por la luz en la balanza y en las bolsas plásticas. En un escenario real, tales mecanismos pueden encarecer la adopción del producto por parte de los supermercadistas.
El próximo paso consiste en desarrollar un prototipo físico. Por ahora, lo que se ha desarrollado es un software y los algoritmos para la identificación de las frutas y legumbres. Para verificar la eficiencia de este sistema, Rocha y el equipo se valieron de una cámara digital para capturar 2.633 imágenes de 15 diferentes especies, entre las cuales estaban la cebolla, la naranja, el limón, la sandía, la pera, la manzana, el cajú, el kiwi y la papa, expuestas a la venta en la Central de Abastecimientos de Campinas (Ceasa). “En estos momentos estamos negociando una asociación con una empresa estadounidense para darle continuidad al proyecto”, revela Rocha.
El objetivo ahora consiste en mejorar las etapas de separación de variedades dentro de un mismo tipo de producto, para que el sistema se vuelva capaz de diferenciar por ejemplo entre dos tipos de bananas, como la ‘nanica’ y la ‘prata’. Asimismo, los investigadores pretenden incorporar el aprendizaje en tiempo de operación, es decir, que con cada respuesta que confirma el operador de la caja, el sistema aprenda, de manera tal de dotar de mayor calidad a las clasificaciones futuras. “La última etapa del proyecto consistirá en integrar a nuestro sistema a los existentes en los supermercados, que se basan en códigos de barras y que van conectados a las impresoras de comprobantes”, explica Rocha.
El proyecto
Clasificadores y aprendizaje en procesamiento de imágenes y visión computacional (nº 05/58103-3); Modalidad Beca de doctorado; Director de tesis Siome Klein Goldenstein – Unicamp; Becario Anderson de Rezende Rocha – Unicamp; Inversión R$ 95.443,92 (FAPESP)
Artículo científico
ROCHA, A. et al. Automatic fruit and vegetable classification from images. Computer and Electronics in Agriculture (Compag). v. 70, n. 1, p. 96-104. 2010.