Imprimir Republish

Archivología

Un esfuerzo para ampliar el acceso a documentos valiosos

El Archivo Público del Estado de São Paulo lanza una plataforma computacional cuyo objetivo es preservar y dejar disponible su extensa colección digital

Escáner de digitalización del Apesp

Léo Ramos Chaves / Revista Pesquisa FAPESP

El Archivo Público del Estado de São Paulo (Apesp) estrenó en noviembre una plataforma informática que les permitirá a investigadores y ciudadanos un acceso más ágil y vasto al archivo digital de la institución. Actualmente el patrimonio institucional está compuesto por más de 700.000 documentos producidos por organismos de la gobernación del estado o de interés histórico, como las colecciones de los antiguos gobernadores o personalidades que participaron en la vida política y cultural paulista, de instituciones tales como el Instituto Histórico y Geográfico de São Paulo y la Maternidad de São Paulo, periódicos y partidos políticos.

Una inversión de 6,9 millones de reales para ampliar la capacidad de almacenamiento y procesamiento de datos, la adquisición de equipos y la mejora de la red eléctrica le dio forma al Archivo Público Digital, puesto en marcha en una versión beta y al que puede accederse en: atom.arquivoestado.sp.gov.br. Los archivos digitales ya disponibles estarán concentrados en una plataforma única que también albergará las nuevas colecciones. El paso siguiente consistirá en ampliar el volumen de documentos disponibles y almacenarlos de forma tal que se los pueda consultar con facilidad.

Una de las colecciones más solicitadas es la del Departamento de Orden Político y Social del Estado de São Paulo (Deops), incorporado al archivo en la década de 1990, con más de 300.000 expedientes disponibles para consulta (lea en Pesquisa FAPESP, edición nº 207). Una parte del trabajo de digitalización se realizó en el marco de proyectos de investigación sobre temas tales como la inmigración, la represión política y la presencia de judíos en Brasil, algunos financiados por la FAPESP, como los que dirigieron las historiadoras Maria Luiza Tucci Carneiro y Maria Aparecida Aquino, de la Universidad de São Paulo (USP), entre finales de la década de 1990 y los primeros años de este siglo XXI. Ahora, otros 2,5 millones de archivos del Deops tendrán sus copias electrónicas.

El Archivo ha creado un nuevo repositorio preparado para recibir, además de las reproducciones de registros en papel, los documentos llamados nato digitales, que solo existen virtualmente y están siendo producidos por organismos del Ejecutivo paulista, como los expedientes electrónicos de las reparticiones públicas y la información tributaria. En 2019, la gobernación de São Paulo creó el programa SP Sin Papel, que regula la gestión y el control de los documentos digitales, que han comenzado a clasificarse al momento de elaborarlos. “Entre los registros producidos por el Poder Ejecutivo, un 20 % corresponde a archivos históricos que deben ser identificados y puestos a resguardo, un 50 % puede eliminarse a corto plazo, en un máximo de 2 años, y un 30 % debe quedar disponible por plazos más largos, que van de 5 a 80 años. El propio Archivo se encarga de gestionar todo eso”, explica el historiador Thiago Nicodemo, coordinador de Apesp y docente en la Universidad de Campinas (Unicamp). Los plazos de disponibilidad se definen según las llamadas tablas de temporalidad, elaboradas por el Archivo junto con representantes de los organismos públicos.

Léo Ramos Chaves / Revista Pesquisa FAPESPLos documentos del consejo estadual del patrimonio histórico (Condephaat), incorporados al núcleo cartográfico de la instituciónLéo Ramos Chaves / Revista Pesquisa FAPESP

Parte de la inversión se destinó a la creación o mejora de más de 70 programas de software libre que ayudan a reordenar las colecciones. Los programas fueron desarrollados bajo el formato de script y permiten la ejecución de un amplio conjunto de tareas repetitivas con un solo comando. Uno de ellos permite cambiar el nombre en forma automática a grandes volúmenes de archivos para agilizar su registro y mejorar su accesibilidad.

A grandes rasgos, las colecciones del Archivo se digitalizaron en momentos distintos y cada una se encuentra disponible en un sitio web específico. La nueva plataforma permitirá rastrear todo lo que existe sobre un tema determinado, ya que su registro se ajustará a un patrón común. “Una investigación sobre las revoluciones de 1924 o de 1932, por ejemplo, brindará acceso a ejemplares de los periódicos de los batallones, las cartas y los telegramas conservados en la colección del Instituto Histórico y Geográfico de São Paulo, y a un gran archivo de casos del Tribunal de Justicia de São Paulo, que incluso contiene fotos. Habrá una integración similar con las colecciones que se refieren al ferrocarril, entre otros temas”, dice el sociólogo y archivista Carlos Menegozzo, director del Centro de Divulgación y Apoyo a la Investigación de Apesp. No todas las colecciones estarán disponibles en internet. Las historias clínicas del Hospital Psiquiátrico de Juquery, incorporadas recientemente al Archivo, contienen información sensible y no se incluirán en la plataforma, pero podrán consultarse en forma presencial.

La investigadora Claudia Bauzer Medeiros, del Instituto de Computación de la Unicamp e integrante de la coordinación del Programa FAPESP de Investigación en eScience y Data Science, dice que la propuesta del Archivo es llamativa por el volumen de información y la metodología rigurosa adoptada para organizarla. “Hay una enorme cantidad de documentos de todo tipo que deben clasificarse siguiendo estándares internacionales que garantizan su conservación a largo plazo. Al mismo tiempo, es necesario que estén disponibles de manera eficiente, incluso en internet, sin vulnerar el eventual derecho a la privacidad y la confidencialidad de las personas mencionadas”. A su juicio, los repositorios creados por las universidades y otras instituciones enfrentan retos similares para almacenar y preservar los datos de las investigaciones. “No basta con guardarlos: deben estar acompañados de una documentación acorde con los estándares internacionales para que sean fácilmente identificables y se los pueda cotejar con otras bases”, explica Bauzer Medeiros. “La disponibilidad de los datos en forma abierta y bien documentada forma parte de la ciencia abierta, hoy en día preconizada en todo el mundo como parte de las buenas prácticas de investigación. La Asamblea General de la Unesco ya votó en noviembre de 2021 un documento al respecto, con recomendaciones para todos los países miembros. La FAPESP es pionera en iniciativas de ciencia abierta en América Latina”.

El mantenimiento de las colecciones ha impuesto un aprendizaje a los administradores del Archivo. “En principio, la reserva digital se almacenaba en carpetas, sin seguir patrones ni criterios técnicos preestablecidos”, dice la socióloga Camila Brandi, directora técnica del Departamento de Preservación y Divulgación de la Colección del Apesp. “Quedó en evidencia que íbamos a necesitar soluciones tecnológicas y una política de gobernanza capaces de asegurar la buena conservación de los documentos y un análisis de su autenticidad. Tienen que adecuarse a un formato de preservación y los procedimientos ejecutados deben controlarse y documentarse. Solo así será posible auditarlos para saber si alguien accedió a una carpeta, si borró algo accidentalmente o ex profeso, y poder recuperar sus características originales”.

Léo Ramos Chaves / Revista Pesquisa FAPESPListas de embarque de los inmigrantes que arribaron a São Paulo en el siglo pasado, en fase de digitalizaciónLéo Ramos Chaves / Revista Pesquisa FAPESP

Para el caso de los registros en papel digitalizados, tales como los ejemplares de periódicos como Última Hora, las historias clínicas relacionadas con la historia de la lepra en el estado de São Paulo o los prontuarios de la Comisaría de Extranjeros, el reto del Archivo consiste en procesarlos y dejarlos disponibles de manera que puedan conservarse intactos y accesibles por mucho tiempo. Algunas colecciones, por ejemplo, fueron procesadas utilizando herramientas de Reconocimiento Óptico de Caracteres (ROC), que permiten la búsqueda de palabras en su contenido. Otras no lo han sido, y en estos casos al usuario o investigador le resulta mucho más difícil encontrar y extraer la información que está buscando. “Tras más de dos décadas de proyectos de digitalización, ahora sabemos más sobre los riesgos y beneficios de esta tecnología”, dice Brandi. “Todos hemos perdido un pendrive con información importante o una fotografía familiar que se deterioró y quedó arruinada. En el caso de las instituciones no es diferente. Han aprendido que no basta con digitalizar las colecciones. Es esencial cuidarlas de manera perenne para conservar su autenticidad y su integridad”. Según Thiago Nicodemo, este aprendizaje está ayudando a debatir y a reflexionar mejor acerca de lo que debe convertirse o no al formato electrónico. “Tanto en Brasil como en el resto del mundo hemos gastado mucho dinero para digitalizar las colecciones y ahora vemos que esto hay que hacerlo con mucho más criterio”.

La historiadora Ieda Bernardes, directora del departamento de Gestión del Sistema de Archivos del Estado de São Paulo puntualiza que la transformación del Apesp apunta a evitar repetir errores del pasado. “La idea de que la tecnología serviría para organizar el desorden de las colecciones no es nueva. En los años 1950 surgieron los microfilmes para resolver los problemas de acceso, pero estos continuaron. La digitalización promovida en los últimos veinte años ha seguido el mismo camino. El problema radica en que las colecciones se reprodujeron en forma desorganizada a partir de las versiones en papel, como un espejo del mundo físico”, afirma. Según ella, algunos gestores han cometido el error de desechar los archivos físicos, reemplazándolos por sus versiones electrónicas, que acabaron deterioradas o inaccesibles debido a la obsolescencia de los soportes tecnológicos.

La política de preservación de los documentos digitales, explica Bernardes, puede aportar beneficios en cuanto a la eficiencia, pero esto cuesta mucho más caro que conservar el archivo en papel. “Aquellos que piensen que van a ahorrar están equivocados. Es necesario financiar continuamente la actualización tecnológica, porque tanto computadoras como software quedan anticuados en pocos años, como así también controlar periódicamente el estado de los documentos”, dice.

Bauzer Medeiros, de la Unicamp, dice que buena parte del presupuesto de la Agencia Espacial Estadounidense, la Nasa, se gasta en la preservación de la información recabada en las investigaciones y expediciones espaciales. “Hace unos años mantuve una charla con un director de la Nasa que me comentó acerca de las dificultades para conservar ese patrimonio y me dijo que el 30 % de los fondos disponibles en la agencia se gastan en datos. Hay que invertir en la actualización de las tecnologías y principalmente en recursos humanos especializados”. Según ella, se trata de una inversión esencial. “Puede que no sea barato, pero si perdemos los registros, el perjuicio es enorme. Es un tesoro tirado a la basura”.

Republicar