Imprimir Republish

Fotografía

Registro de la escritura

Un nuevo método facilita la transformación de documentos manuscritos históricos en archivos digitales

Carta del siglo XIX sobre la Mesa Cartesiana

Lapelinc Carta del siglo XIX sobre la Mesa CartesianaLapelinc

La dificultad en manipular documentos históricos raros y manuscritos para el análisis de sus textos llevó a un grupo de investigadores de la Universidad Estadual del Sudoeste de Bahía (Uesb) a desarrollar un método de fotografía que facilita la transcripción y la comprensión de fenómenos lingüísticos de una época. “Existen documentos y libros antiguos con los cuales el método tradicional de obtención de imágenes con escáner puede perjudicar o incluso destruir los originales, ya que muchas veces es necesario doblarlos o desencuadernarlos para poder escanearlos”, dice el profesor Jorge Viana Santos, del Laboratorio de Investigación en Lingüística de Corpus (Lapelinc) de la Uesb. El objeto de estudio de los investigadores está constituido por libros y documentos notariales manuscritos del siglo XIX que han sido demasiado manipulados y cuyo estado es sumamente frágil. “A diferencia de la fotografía, en el escaneado el documento se adapta al aparato y no al contrario”, dice. Para la digitalización de documentos impresos existen software muy difundidos, conocidos como de reconocimiento óptico de caracteres (OCR, por sus siglas en inglés), que pueden leer los documentos a partir de escáneres y tornarlos digitales. Con los documentos manuscritos no existe tal posibilidad.

El método que creó el profesor Viana Santos en colaboración con la profesora Cristiane Namiuti Tempon, también de la Uesb, comienza con la captura de la imagen en una cámara fotográfica. Para ello, el documento es asentado en una especie de placa plana de plástico de color gris y cuadriculada milimétricamente, una característica que sirve para informar en la computadora las medidas exactas del papel. Sobre la placa, denominada por el grupo Mesa Cartesiana, se colocan escalas de tono de colores, informaciones de catalogación, paginación y secuencia. La página del documento puede tanto presentarse en la computadora con todas esas informaciones como también en forma recortada, es decir, sólo la parte manuscrita.

Transcripción en caracteres para un estudio del portugués de la época

Lapelinc Transcripción en caracteres para un estudio del portugués de la épocaLapelinc

Los detalles en la pantalla
La transposición del documento del mundo físico intermediado por la fotografía al formato digital se ejecuta con un software desarrollado también en el Lapelinc. Éste permite interpretar esos datos y recuperar en una pantalla de computadora los tonos y los colores originales de un documento. De este modo, el método efectúa la transposición de documentos manuscritos históricos a la formación de conjuntos de textos electrónicos con aspecto apropiado para la investigación científica.

Las ventajas del Método Lapelinc se expanden también debido a la facilidad de aumentar el texto original en la pantalla de la computadora para verificar detalles o despejar dudas en relación con la escritura. Con el documento digital es posible hacer varias consultas sin deteriorar el material histórico. Según Viana Santos, este nuevo método contribuye en el análisis de los paleógrafos, expertos que leen el texto para estudios de lenguaje y realizan la transcripción y la adaptación al portugués actual, de ser el caso. La lingüística de corpus (el texto para su análisis) requiere del original en caracteres para la compilación de corpora (conjunto de corpus) y el análisis lingüístico automático. “Nuestro método permite montar el corpus electrónico que forma un banco de datos, en el cual es posible detectar cada palabra y etiquetarla, facilitando así el trabajo del lingüista en la busca de su objeto de estudio; así se pueden rotular sustantivos y verbos, por ejemplo”, dice Viana Santos. “El historiador puede leer en el lenguaje actual, pero el lingüista desea saber cómo fue concebido el texto en aquella época para determinar el patrón y la evolución del lenguaje.”

El trabajo de estructura del Método Lapelinc empezó en 2008 y aún no ha concluido: falta la finalización del software para hacer la transcripción y la edición del texto. Todo el sistema creado en la Uesb también puede ser útil en otras instituciones académicas e incluso en empresas. “Hacemos investigación y un apoyo externo o comercial no cambia nuestro trabajo, pero el prototipo puede llevar a un producto, porque el método es pasible de una patente. En estos momentos estamos finalizando su desarrollo”, explica Viana Santos. El trabajo contó con financiación de la Fundación de Apoyo a la Investigación Científica del Estado de Bahía (Fapesb), del Consejo Nacional de Investigación Científica y Tecnológica (CNPq) y de la propia universidad.

Artículo
Santos, J. V. y Brito, G. S. Fotografia técnica de documentos para a formação de corpora digitais eletrônicos: o método desenvolvido no Lapelinc. Letras & Letras. v. 30, n. 2, p. 421-30. jul./dic. 2014.

Republicar