DANIEL JACOBINO¿Cómo cuantificar algo tan volátil y multifacético como la cultura? ¿Cómo arribar a un denominador común que indique una tendencia o un cambio en el transcurso del tiempo en áreas tan sujetas a truenos y tormentas como la gramática, la literatura, la censura y el comportamiento?
Éste es el objetivo del ambicioso programa Culturomics, que desde hace tres años opera mediante una colaboración entre docentes, investigadores y alumnos de la Universidad Harvard y del Instituto de Tecnología de Massachusetts, ambos de Estados Unidos. Una parte de los resultados está condensada en el artigo “Cuantitative analysis of culture using milions of digitized books” (“Análisis cuantitativo de la cultura empleando millones de libros digitalizados”), el segundo del programa, publicado en enero pasado en Science.
Firmado por nombres de peso, como el psicolingüista Steve Pinker, este trabajo se abocó a un corpus de 5.195.769 libros digitalizados por Google Books, equivalente, según los coordinadores, al 4% de todos os libros impresos en la historia. La empresa californiana, por extensión, se convirtió “en la mayor y más importante fuente de financiamiento del proyecto”, afirma Adrian Veres, uno de los signatarios del artigo.
Liderado por Jean-Baptiste Michel y Erez Lieberman Aiden, del Departamento de Dinámica Evolucionaria de Harvard, este artículo de la revista norteamericana es fruto de la investigación que ambos realizaron con miras a cuantificar la evolución de los verbos irregulares ingleses a partir de fuentes secundarias. “De algún modo”, afirma Veres, “esto sirvió para consolidar la idea de que podrían obtenerse resultados importantes y significativos en un nivel cuantitativo por medio de datos tales como la repetición de una determinada palabra a lo largo del tiempo”.
Alcir Pécora, docente de teoría literaria de la Universidad Estadual de Campinas (Unicamp), también está entusiasmado con el proyecto: “Me interesante este tipo de investigación, pues las máquinas permiten en la actualidad trabajar con enormes cantidades de datos. Es una masa fabulosa de información”. Pero pondera: “Cuando se trata de entender qué significan, estos datos requieren de un intérprete calificado, y no de un analista de banco de datos. Esto que no significa que este tipo de investigación sea inútil, ni mucho menos ofensiva, como parecen pensar a veces en los medios humanistas tradicionales”.
Dentro de un universo bastante amplio de variaciones culturales que el Culturomics pretende relevar, la lengua se mostró como uno de los más seguros en lo que hace a su medición, “un modelo clásico de cambio gramatical”. Sucede que, según dicen los autores, “a diferencia de los verbos regulares [en inglés], cuya forma pretérita se construye con el agregado de la partícula ‘ed‘ al final, los verbos irregulares son conjugados idiosincráticamente”.
De este modo, mientras que en Estados Unidos se diseminó el uso de formas regulares pretéritas de ciertos verbos (como “burn“/”burned” y “spell“/”spelled“), en la matriz europea se mantuvo más frecuente el uso de sus formas irregulares (“burnt” y “spelt“, respectivamente).
Sin embargo, el estudio cuantitativo de la gramática inglesa apuntó un cambio de paradigma cultural y geopolítico, debido a la creciente influencia del patrón norteamericano sobre los usuarios británicos de la lengua inglesa. Pues con el tiempo, los británicos también empezaron a adoptar las formas de los hablantes de la ex colonia, según apunta la cuantificación realizada por Culturomics.
“Las formas irregulares terminadas en ‘t‘ también pueden estar muriendo en Inglaterra. Cada año, una población equivalente a la de la ciudad de Cambridge adopta burned en vez de burnt.”
Pero los hablantes norteamericanos también rescataron formas irregulares un tanto olvidadas en la metrópoli que serían, posteriormente, reincorporadas por los ingleses a su lenguaje cotidiano.
Estas estadísticas llevaron a los autores del estudio a decir que Estados Unidos es “el mayor exportadores tanto de verbos irregulares como de verbos regulares”.
Y no es solamente el idioma: también la fama puede medirse mediante estas tabulaciones. “Es posible medir cuán rápido alguien se vuelve famoso, cuán rápidamente deja de serlo, cuál es la intensidad de esta fama y en qué momento de la vida determinada persona se volvió famosa o dejó de serlo”, explica Veres, cuya línea de investigación es precisamente la “dinámica de la fama”.
Una de las conclusiones más impactantes –y crueles– sobre la sociedad contemporánea que se desprende del artigo de Science es la que muestra de qué modo las personas se vuelven famosas cada vez más tempranamente; pero, en contraposición, caen en el olvido también de manera mucho más veloz.
Daniel JacobinoNotas o acepciones
Para arribar a esta conclusión, el estudio tomó como punto de partida a 740 mil personas cuyos nombres constaban en notas de Wikipedia, descartando únicamente los casos en que los nombres eran los mismos. Tabularon el resto tomando como base la fecha de nacimiento y la frecuencia con que determinado nombre era mencionado. Luego, considerando el período entre 1800 y 1950, crearon un grupo con las 50 personas más famosas nacidas en cada uno de esos años. De ese modo, en 1882 figura, por ejemplo, la escritora Virginia Wolf, y en 1946, aparecen el ex presidente de Estados Unidos Bill Clinton y el director de cine Steven Spielberg.
Las estadísticas apuntaron que el período en que las celebridades alcanzan su pico se mantuvo regular, es decir, alrededor de 75 años después de su nacimiento. Pero los otros parámetros experimentaron un cambio drástico en el transcurso del período analizado: “Las personas más famosas de los últimos tiempos son más famosas que las personas famosas de las generaciones anteriores. Con todo, esta fama tiene una vida cada vez más corta. El período posterior al ápice de la fama cayó de 120 a 71 años durante el siglo XIX”.
Estos datos “son particularmente impresionantes porque estamos midiendo la fama a partir de libros publicados, los cuales evidentemente constituyen un medio mucho más lento que los diarios, las revistas o incluso los periódicos que cubren música”, advierte Veres.
Indagado acerca de si Culturomics terminó convalidando la profecía del artista Andy Warhol en 1968 –de que “en el futuro todo el mundo será famoso por 15 minutos”–, Veres responde con humor: “Si consideramos a la sociedad actual, creo que en muy poco tiempo serán sólo 7,5 minutos de fama”. Y concluye: “Definitivamente, el ritmo se está acelerando y la sociedad se mueve cada vez más rápido”.
Como consecuencia de ello, la percepción de lo que es viejo y lo que es joven también se está modificando a la misma velocidad, con un énfasis mucho mayor en el tiempo presente. Un año cualquiera, como por ejemplo “1880”, experimentó una caída del 50% en la cantidad de citas 32 años más tarde, es decir, en 1912. En tanto, una fecha más reciente, como “1973”, experimentó una caída equivalente en cantidad de citas en un lapso de tiempo mucho más corto, es decir, 10 años después, en 1983.
“Año a año nos vamos olvidando del pasado de manera mucho más rápida”, afirman los autores.
¿Pero ciertas conclusiones del artigo no serían demasiado obvias, como la de afirmar que “el año ‘1951’ fue raramente discutido hasta los años que inmediatamente lo sucedieron?”
Veres asume que “ése es de efectivamente un riesgo en investigaciones de esta índole. Por ejemplo, es obvio que, cuando un país cambia de nombre (Rodesia por Zimbabwe por ejemplo), en un corto período de tiempo se registrará una declinación del nombre antiguo y una expansión del nuevo”. No obstante, pondera, “la existencia de tales ‘conclusiones obvias’ es muchas veces útil, pues sirve como control para el banco de datos”, precisamente porque llama la atención de los investigadores sobre ese riesgo.
Control
“Lo que podría ser una conclusión sin ninguna importancia se convierte en una forma de control sumamente importante.”
Y en esto los investigadores corren el riesgo de caer en otra trampa, que es la de atravesar el límite entre el hecho y la interpretación. Y ellos mismos lo admiten al final del artículo: “el desafío del Culturomics reside en la interpretación de sus evidencias”.
Veres explica la metodología que el grupo siguió para superar esta dicotomía. “Los datos son la frecuencia con que las palabras surgen en el correr del tiempo. Quizá, aún hablando de los datos, sea necesario hacer algunas correcciones menores, tales como en lo que hace a anotaciones erróneas o fallas en la lectura óptica. En tanto, la interpretación es el proceso que apunta a explicar qué llevó a los datos a cobrar la forma que tienen. El reto entonces reside en encontrar el hogar que mejor se ajuste a ellos”; y por hogar, Veres entiende a las diferentes historias y visiones de mundo disponibles.
En efecto, existen muchos tópicos apuntados en el artigo que siguen en abierto y habrá que explorarlos durante las próximas etapas del proyecto. Por ejemplo, la incidencia de la censura de ideas y de personas. ¡Durante el nazismo, en Alemania, los miembros del partido registraron un crecimiento en cantidad de menciones de alrededor del 500%! En contrapartida, la mención de los grandes nombres del arte denominado “degenerado” durante el régimen –el pintor español Pablo Picasso o el arquitecto de Bauhaus Walter Gropius– cayó vertiginosamente.
Según los autores, estos datos pueden desembocar en la creación de un “index de la supresión”, “formulando una estrategia rápida destinada a identificar a las probables víctimas de censura”.
Por ejemplo, “Freud” parece estar más entrañado en el imaginario que “Galileo”, “Darwin” o “Einstein”; “Dios”, igualmente, no ha andado demasiado en alza; también se deduce, según la cuantificación, que la dieta típica norteamericana es a base de “bifes”, “embutidos”, “helados”, “hamburguesas”, “pizzas“, “pastas” y “sushi“. Por último, el feminismo muestra que echó raíces antes en Francia, pero fue en Estados Unidos donde se desarrolló más. Y en la pelea entre los sexos, la “mujer” derrota al “hombre”, al menos en cantidad de menciones.
Desafortunadamente, hasta ahora la lengua portuguesa no ha sido contemplada en el proyecto. Y la razón de ello tiene que ver no solamente con su relativa escasa penetración cultural y geopolítica, sino también con el tamaño y la digitalización de las bibliotecas locales.
Veres argumenta que el portugués no formó parte del proyecto debido a que no se encuadra en los criterios establecidos. “Pero la idea en el futuro es incluir en el banco de datos del Cultoromics tanto al portugués como a otros diversos idiomas”, concluye.
Republicar