Imprimir Republish

BUENAS PRÁCTICAS

El error de la hoja de cálculo

La multinacional tecnológica estadounidense Microsoft ha anunciado modificaciones en una de las características de las planillas de cálculo del software Excel, en el que los usuarios a partir de ahora podrán desactivar fácilmente las funciones de formateo automático que han ganado notoriedad por introducir errores en los datos de investigaciones entorpeciendo el trabajo de los genetistas. La función original de conversión automática del Excel es facilitar la introducción de datos normalizados que se repiten con frecuencia y una de estas funciones convierte el texto en fechas. El problema radica en que el programa interpretaba la abreviatura SEPT1, que suele utilizarse para designar al gen septin-1, como si fuese el primer día de septiembre y la transformaba en 01/09. A otro gen, el MARCH1, lo transformaba en 1º de marzo.

El problema se generalizó tanto que, en 2020, el Comité de Nomenclatura de Genes de la Organización del Genoma Humano (Hugo) modificó la forma en que se escriben algunos genes. El SEPT1 pasó a escribirse SEPTIN1, mientras que MARCH1 cambió a MARCHF1, para eludir la conversión automática en la planilla.

Un estudio publicado por investigadores australianos en la revista Genome Biology en 2016, analizó archivos Excel que sirvieron como contenido complementario de 3.587 artículos sobre genética publicados en 18 revistas científicas e identificaron errores atribuibles a conversiones erróneas del nombre de genes en el 19,6 % de las planillas. Las revistas en donde se detectaron mayores porcentajes de artículos con archivos afectados fueron Nucleic Acids Research, Genome Biology, Nature Genetics, Genome Research, Genes and Development y Nature. El problema podía manifestarse de diferentes maneras dependiendo de la configuración del idioma en la planilla. En el caso del español, el gen AGO2 se convertía en el 2 de agosto. En tanto, el gen MEI1 podía convertirse en 1º de mayo si la configuración del idioma estaba en neerlandés.

“No hay casos documentados en los que el nombre del gen haya afectado las conclusiones de un estudio. Pero si un investigador guardara sin saberlo una planilla con tales errores, alguien que importara esos datos para un análisis posterior se enfrentaría a un problema de reproducibilidad”, explicó Mandhri Abeysooriya, investigadora de la Universidad Deakin, en Geelong (Australia), participante en el estudio publicado en la revista Genome Biology, según un texto publicado en el sitio web Retraction Watch.

En un comunicado divulgado en el blog de Microsoft, el ingeniero de la computación Chirag Fifadra, gerente de producto de Excel, informó que el programa ahora mostrará un mensaje de advertencia cuando detecte que se encuentra habilitada la conversión automática de datos y dijo que las opciones para desactivarla estarán más visibles.

Republicar