Imprimir Republish

INVESTIGACIÓN EMPRESARIAL

Quien busca encuentra

El Centro de Ingeniería de Google de Brasil es responsable de modificaciones relevantes en su sistema de búsqueda

A partir de la izquierda, Berthier Ribeiro-Neto, Bruno Pôssas, Paulo Golgher, Bruno Fonseca y Hugo Santana (parado)

Léo Ramos A partir de la izquierda, Berthier Ribeiro-Neto, Bruno Pôssas, Paulo Golgher, Bruno Fonseca y Hugo Santana (parado)Léo Ramos

Dos guiños de ojo ‒el tiempo correspondiente a un cuarto de segundo‒, es el intervalo promedio que Google, la principal herramienta mundial de búsqueda en internet, tarda para suministrarle una respuesta al internauta. Se realizan mensualmente 100 mil millones de consultas en ese buscador, a un promedio de 3.300 millones de búsquedas por día, 137,5 millones por hora y la increíble cifra de 2,3 millones por minuto. Cada 24 horas, Google analiza más de 20 mil millones de direcciones en la web, y se topa diariamente con 500 millones de búsquedas inéditas, es decir, que nunca antes se habían realizado. En Brasil, el sitio posee un 91% de la participación en el mercado de búsquedas por internet. Lo que pocos saben es que, para trabajar con ese volumen de información, la empresa de tecnología cuya matriz se encuentra en Mountain View, una de las mayores ciudades del Silicon Valley, en California, Estados Unidos, cuenta con el talento de un equipo de investigadores brasileños en el Centro de Ingeniería de Google para América Latina, con sede en Belo Horizonte, Minas Gerais.

La unidad, que funciona en un edificio del centro de esa capital de estado, fue creada en 2005 y actualmente es uno de las más importantes entre alrededor de 30 centros de investigación y desarrollo que la empresa posee distribuidos por ciudades tales como Nueva York (Estados Unidos), Zúrich (Suiza), Tokio (Japón) y Bangalore (India). “El 100% de los resultados de las búsquedas realizados globalmente, cada día, son mejores, en términos de relevancia para la consulta, gracias a proyectos que viene desarrollando el equipo de Belo Horizonte”, dice el científico de la computación Berthier Ribeiro-Neto, director de ingeniería en Google y uno de los líderes del equipo brasileño. “Somos los responsables de la segunda modificación más relevante en la mejora de la búsqueda en la historia de Google. Además, cinco de los 30 principales proyectos experimentales con usuarios del buscador surgieron de nuestra oficina”, dice el investigador, de 53 años. Esa segunda innovación más importante ‒que no se puede describir minuciosamente pues se trata de información secreta‒ está relacionada con dos problemas básicos de los mecanismos de búsqueda: la comprensión precisa de lo que el usuario está expresando en la consulta y la interpretación correcta de lo que cada uno de los documentos en la web quieren expresar. Es la confluencia entre esos dos “entendimientos” lo que, al fin y al cabo, logra que la información que ofrece el buscador sea lo más cercana posible a lo que el internauta quiere encontrar.

Google:
Centro de Ingeniería para América Latina Belo Horizonte, Minas Gerais
Cantidad de empleados:
500
Principales productos:
Buscador en internet, Gmail y red social G+

La principal área de actuación de los investigadores de Belo Horizonte es la clasificación ‒core ranking, en inglés‒, que es el orden en el que se presentan los enlaces en la página de resultados. “La meta de nuestro grupo es la calidad de la búsqueda”. Trabajamos para garantizar que el resultado de la consulta del usuario sea el mejor posible, y que la primera respuesta en el ranking que presenta Google responda efectivamente a lo que el internauta está buscando”, dice el científico de la computación Hugo Pimentel de Santana, de 32 años. “Uno de nuestros mayores esfuerzos consiste en entender que ciertas consultas escritas en forma diferente representan una misma intención del usuario”, añade. Pimentel de Santana se graduó en la Universidad Federal de Pernambuco (UFPE) y cuenta con un máster por la misma institución, en el área de inteligencia artificial. Se desempeña como ingeniero de software en Google desde hace seis años y encabeza un grupo integrado por 16 personas del equipo de ranking. Viaja dos o tres veces por año hacia Mountain View con el objetivo de participar en capacitaciones y encuentros con el equipo global de la empresa. La sede alberga el principal centro de la maquinaria de búsqueda de Google.

El desafío para mejorar el core ranking es enorme y cada sugerencia es sometida a un largo y detallado proceso de evaluación. Tan sólo en 2012, los ingenieros de la empresa en todo el mundo presentaron 118.812 ideas para dotar de mayor eficacia a la herramienta del ranking. Del total, menos de un 10% (10.391) fueron analizadas por un grupo de usuarios contratados por Google, los raters. Alrededor de un 30% de esas novedades no prosperaron y 7.018 pasaron a la fase siguiente, de implementación parcial, donde fueron evaluadas por grupos de usuarios reales. Al finalizar el proceso, solamente se aprobaron 665 cambios y se los incorporó a la arquitectura de búsqueda de Google.

Relajación y trabajo en las unidades de Minas Gerais y São Paulo

Léo RamosRelajación y trabajo en las unidades de Minas Gerais y São PauloLéo Ramos

Una señal de la importancia del Centro de Ingeniería de Belo Horizonte radica en que algunos de sus investigadores poseen acceso irrestricto al algoritmo de búsqueda de Google, la enorme secuencia numérica que logra que el mecanismo funcione. El algoritmo es un código altamente confidencial y para la empresa tiene la misma importancia que la fórmula de la Coca-Cola para el fabricante de ese refresco, porque en ello se basa su éxito. “Son pocos los grupos externos a la matriz en Mountain View que trabajan para la mejora del algoritmo de búsqueda”, dice Bruno Pôssas. A sus 36 años, con título de grado, maestría y doctorado en ciencias de la computación por la Universidad Federal de Minas Gerais (UFMG), Pôssas es el responsable de todas las mejoras propuestas por el equipo de Belo Horizonte para el algoritmo de Google.

Para Pôssas, el conocimiento de los investigadores brasileños en un área teórica con importancia fundamental para la construcción de las maquinarias de búsqueda, conocida como “recuperación de la información” (information retrieval, en inglés), explica la buena reputación de la que goza la unidad de Minas Gerais ante la oficina central del Valle del Silicio. “Google comenzó a trabajar en Belo Horizonte con un grupo muy bueno en recuperación de la información, que era reconocido por la comunidad científica internacional por la calidad de los artículos que publicaba”, informa Pôssas. Se refiere al equipo que, en el año 2000, fundó en Minas Gerais la empresa Akwan Information Technologies, que cinco años más tarde fue adquirida por Google para transformarla en su centro de investigación en Brasil.

Empresas Google_214-02La maquinaria de búsqueda
Akwan era la propietaria de un motor de búsqueda basado en la web brasileña, denominado TodoBr, que había sido desarrollado por un grupo de docentes del Departamento de Ciencia de la Computación de la UFMG. “TodoBr poseía una calidad mucho mejor que la que tenía entonces el buscador de Google en Brasil. En poco tiempo, nuestro buscador se expandió y decidimos crear una empresa”, recuerda Ribeiro-Neto, uno de los seis fundadores de Akwan; los otros fueron los profesores Nívio Ziviani, Alberto Laender e Ivan Moura Campos, todos de la UFMG, y los inversionistas de mercado Guilherme Emrich y Marcos Regueira. Con el crecimiento de la empresa, Ribeiro-Neto decidió jubilarse de la universidad para ocuparse plenamente del negocio.

“Al principio surgieron dificultades pues no conseguíamos financiación a bajo costo. Golpeamos la puerta del BNDES [el Banco Nacional de Desarrollo Económico y Social] y recibimos un ‘no’ por respuesta. Sobrevivimos vendiendo soluciones en el mercado corporativo de São Paulo, hasta que, a finales de 2004, un colega nos vinculó con un vicepresidente de ingeniería de Google. En pocos meses cerramos negocio”, dice Ribeiro-Neto. El objetivo de Google al adquirir Akwan, según Ribeiro-Neto, consistía en la construcción de un centro de I&D en el país. Cuando los estadounidenses compraron la empresa brasileña cancelaron todos sus contratos, pero conservaron a los empleados. “Google vislumbró que aquel grupo de académicos había creado una herramienta situada en la frontera del conocimiento. Contábamos con ideas propias acerca de cómo lidiar con el problema de los dispositivos de búsqueda. Fuimos la primera adquisición global de la empresa fuera de Estados Unidos”, dice Ribeiro-Neto, resaltando que “el objetivo del trabajo del grupo siempre fue el desarrollo de innovaciones globales”. El investigador fue el único de los seis fundadores de Akwan que permaneció en Google.

Desde que comenzó con sus operaciones en 2005, el Centro de Ingeniería ha recibido inversiones por un valor superior a 150 millones de dólares. En la actualidad trabajan allí alrededor de 100 ingenieros, de los cuales, un 75% cuenta con máster o doctorado en ciencia de la computación. La mayoría de los investigadores son brasileños, pero también hay profesionales de otros países, entre ellos, Estados Unidos, India, Chile, Colombia y Venezuela. “Buscamos ingenieros con buena formación técnica, proactivos, creativos y con iniciativa propia”, dice Ribeiro-Neto, quien es coautor del libro Modem information retrieval. La obra, publicada originalmente en 1999, es de importancia para los científicos de la computación y fue fuente de consulta para los fundadores de Google, Larry Page y Sergey Brin, durante sus posgrados en la Universidad Stanford, cuando desarrollaron el proyecto que originó la empresa de búsqueda.

Empresas Google_214-03En Brasil, son más de 500 empleados, repartidos entre el centro de I&D de Belo Horizonte y la oficina central en São Paulo. Los empleados gozan de un ambiente relajado, con espacios para la relajación dedicados al ocio creativo, equipados con hamacas de descanso, reposeras, mesas de billar, videojuegos, biblioteca de cómics y pufs para relajarse con las formas de las teclas ctrl, esc, alt y del.

El equipo de Belo Horizonte también se ocupa de la investigación y el desarrollo de productos para la red social Google+, lanzada en 2011 para competir con Facebook, y es responsable de la gestión de Orkut, que en su momento fue el sitio web más popular de encuentros virtuales del país. Cuando Google adquirió Akwan, en 2005, Brasil constituía el principal mercado mundial de Orkut, y tres años después, la subsidiaria brasileña pasó a ser la responsable global de la plataforma, que llegó a registrar 30 millones de usuarios en el país. “El sector que dirijo está integrado por unas 40 personas y es uno de los tres más relevantes, junto con los equipos de Mountain View y Zúrich”, dice el director de ingeniería de G+, Paulo Golgher, de 36 años. El trabajo cotidiano de los ingenieros consiste en la creación de nuevas funcionalidades para el Google+ y el desarrollo de programas que hagan más segura a la red social para situarla fuera del alcance de los hackers. “Concebimos sistemas automáticos para que la propia plataforma detecte amenazas y abusos, tales como contenidos pornográficos, virus y spam”, comenta el ingeniero de software Bruno Maciel Fonseca, de 32 años.

Investigación académica
Más allá de invertir en innovaciones volcadas a sus propios productos, Google también financia proyectos académicos en universidades brasileñas. El programa Google Brazil Focused Research Grants, lanzado en 2013, reparte alrededor de 1 millón de reales entre cinco investigaciones doctorales que buscan comprender de qué manera se comporta la gente en el ámbito virtual de internet. La empresa se caracteriza por fomentar la investigación en áreas de su interés en instituciones americanas y europeas de educación superior, pero esta es la primera vez que subvenciona proyectos brasileños. La financiación no establece como contrapartida la cesión de los derechos de propiedad sobre las investigaciones. “En el proceso de selección, enviamos invitaciones a 25 investigadores y recibimos 20 propuestas. Seleccionamos las cinco que poseían una calidad compatible con la marca Google”, explica Ribeiro-Neto.

Uno de los proyectos contemplados es una investigación del Instituto de Posgrado e Investigación en Ingeniería (Coppe) de la Universidad Federal de Río de Janeiro (UFRJ), cuyo objetivo final es mejorar la calidad de la enseñanza a distancia en el país. El proyecto pretende analizar las reacciones de los alumnos de esos cursos durante las videoclases y determinar su nivel de atención. El estudio, liderado por el profesor Edmundo de Souza e Silva, coordinador del grupo de investigación del Coppe, se realiza por medio de una serie de sensores y dispositivos conectados al alumno, que suministran información sobre su estado mental durante la clase a distancia. Mientras tanto, una webcam filma sus expresiones faciales y el tamaño de sus pupilas, una pulsera con biosensores incorporados mide la conductividad de la piel, una vincha en la cabeza capta sus ondas cerebrales y un sensor detecta la movilidad del mouse. “El nivel de conductividad de la piel y la dilatación de las pupilas indican si el individuo se encuentra más o menos atento”, explica Silva. Según él, en una clase tradicional, el docente puede observar las reacciones de los alumnos y percibir cuán atentos o desatentos se encuentran. En tanto, en los cursos a distancia, eso resulta imposible. “El sistema que estamos desarrollando pretende ayudar cubrir esa laguna”, dice Silva.

Un experimento realizado en la UFRJ analiza el nivel de atención en alumnos de educación a distancia

Léo RamosUn experimento realizado en la UFRJ analiza el nivel de atención en alumnos de educación a distanciaLéo Ramos

En una clase virtual, y en el caso de que el sistema determine, por medio de los datos enviados por los dispositivos (webcam, pulsera y sensores), que el alumno no presta atención, automáticamente modifica el cariz de la clase, por ejemplo, solicitándole al estudiante la realización de alguna tarea o modificando los contenidos que se están exhibiendo. La investigación, conducida en conjunto por la profesora Rosa Leão, del Coppe, el doctorando Gaspare Bruno y el maestrando Thothadri Rajesh, tiene como principal objetivo a los alumnos de la carrera de sistemas de computación del Cederj, un consorcio integrado por siete institutos públicos de enseñanza superior de Río de Janeiro, entre los que se encuentran la UFRJ y la Universidad Federal Fluminense (UFF).

Otro proyecto financiado por el programa de Google en el país apunta a comprender qué es lo que determina que un contenido posteado en el canal de videos compartidos YouTube se torne popular. “Intentamos entender cuáles son los distintos factores que pueden afectar la visualización de un video y, así, predecir su curva de popularidad en el tiempo”, informa la profesora Jussara Almeida, del Departamento de Ciencia de la Computación de la UFMG. La investigación forma parte del trabajo de doctorado del científico de la computación Flavio Figueiredo. La metodología creada en la UFMG es capaz de mejorar en más de un 30% el promedio de previsión de popularidad de los videos en relación con la técnica más famosa utilizada para tal fin, desarrollada por Bernardo Huberman, investigador del HP Labs, con sede en Palo Alto, California. Durante la investigación, se monitorearon cientos de miles de videos en YouTube y se recogieron informaciones diversas en el sitio, entre ellas, la categoría del video, su curva de visualización en el tiempo, desde que se lo subió, y el origen de los enlaces utilizados para acceder a ese video.

“Al analizar la curva de visualizaciones de estos videos, notamos que hay un número pequeño de patrones de curvas de popularidad que se reitera. Percibimos que, si logramos prever esa curva, podemos mejorar la predicción y determinar cómo evolucionará la popularidad de cierto contenido a lo largo del tiempo”, dice Almeida. Una de las conclusiones del estudio fue que la calidad del contenido del video no siempre resulta determinante para su popularidad. Muchas veces, un video “explota” en la web luego de que algún sitio externo postea un enlace hacia él, tal como ocurre cuando lo hace un blog o incluso desde el propio Facebook. La comprensión de esta dinámica puede aportar información importante para los anunciantes de bienes y servicios en internet, más allá de los productores de contenidos.

El mismo Departamento de Ciencia de la Computación de la UFMG contempló otro proyecto con los recursos de Google. El profesor Marcos André Gonçalves y el doctorando Daniel Hasan se valieron de algoritmos y técnicas informáticas para cotejar automáticamente la calidad de artículos y contenidos posteados en la web 2.0, que es aquélla cuyas páginas se generan a partir de la colaboración de los internautas. La enciclopedia virtual Wikipedia, con más de 14 millones de artículos, constituyó el enfoque inicial de la investigación. “Comenzamos con Wikipedia y extendimos el estudio hacia los foros de preguntas y respuestas”, explica Gonçalves. Para determinar el grado de confiabilidad de las páginas, los investigadores elaboraron un conjunto de 68 criterios de calidad, tales como legibilidad del texto, estructura y organización de los artículos y el historial de revisiones de los contenidos posteados. “Creamos una aplicación, todavía no comercial, que otorga un puntaje a cada uno de los criterios”, dice el profesor de la UFMG. Entre las diversas metodologías existentes que se proponen realizar algo similar, la que él proyectó junto con su alumno brinda los mejores resultados cuando se la pone a prueba. “Nuestra metodología puede funcionar como una brújula, que le muestra al internauta cuáles son los contenidos de la web con mayor calidad y credibilidad. Imaginamos que, en el futuro, podría utilizársela para ordenar las páginas ya consultadas con algún criterio de confiabilidad”, sostiene Gonçalves.

Republicar