Inicio > Blogs > Ruritania > Rescatar nuestra herencia literaria con Inteligencia Artificial

Rescatar nuestra herencia literaria con Inteligencia Artificial

Rescatar nuestra herencia literaria con Inteligencia Artificial

Decía Paul Valéry que “los libros tienen los mismos enemigos que las personas: el fuego, la humedad, los animales, el tiempo y el propio contenido”. De entre todos ellos, el tiempo, o más bien el olvido, es casi el único del que, con suerte, de cuando en cuando, podemos resucitarlos. El 31 de enero de 2023 se anunció una de esas resurrecciones: la obra de teatro titulada La francesa Laura, hasta ahora considerada anónima y abandonada en el fondo de manuscritos de la Biblioteca Nacional, resultaba ser, en realidad, creación de Lope de Vega. Es cierto que el hallazgo no es improbable, porque Lope escribió varios centenares de piezas. Hace una década, sin ir más lejos, se encontró otra suya: Mujeres y criados. Pero también es cierto que el método empleado para encontrar La francesa Laura es insólito. Insólito y decisivo. De hecho, según dice Álvaro Cuéllar, investigador de la Universidad de Viena, “sin la inteligencia artificial habría sido prácticamente imposible dar con la obra”.

Para llegar a este punto y resolver algunos de los problemas de autoría que presentan los textos de la época, Álvaro Cuéllar ideó hace 6 años, junto a Germán Vega, catedrático de la Universidad de Valladolid, el proyecto ETSO (Estilometría aplicada al Teatro del Siglo de Oro). Con él pretendían emplear IA en una investigación que, por su amplitud, de otro modo habría resultado inabordable. “Transcribir un manuscrito puede llevar semanas” dice Álvaro. “Transcribir 500 manuscritos y mil impresos habría sido un trabajo de décadas de un equipo entero. Con la inteligencia artificial, una vez tienes materiales y herramientas preparados, es cuestión de horas”.

"Stylo puede contar 36 millones de palabras, relacionarlas a través de fórmulas matemáticas y dar así con una sola obra entre 1500"

Pero ¿cómo se desarrolla su investigación? Digamos que se divide en cuatro fases. Las dos primeras son manuales: recolección de manuscritos (de fuentes públicas y privadas) y digitalización (escaneo de páginas). Las otras dos implican inteligencia artificial. No están exentas de errores, pero proporcionan pistas valiosísimas que luego se someten al estudio profundo de los expertos. Por un lado tenemos Transkribus, una IA que, aprovechando la fecundidad de los dramaturgos del Siglo de Oro, se entrena con numerosos textos para transcribir, a gran velocidad, las páginas escaneadas previamente. Por el otro está Stylo, que redondea el proceso identificando usos léxicos para atribuir o descartar las obras. Con esto pudieron confirmar una hipótesis: que las palabras marcan la autoría. Stylo puede contar 36 millones de términos, relacionarlos a través de fórmulas matemáticas y dar así con una sola obra entre 1500 que presenta asombrosas coincidencias estilísticas con el corpus de Lope. Una resurrección de otro modo imposible.

A la vista de los resultados, podemos preguntarnos si, con este método, encontraríamos más obras ignoradas de autores importantes o incluso obras reconocidas que, por desgracia, no tenemos en nuestras manos. Ya desde la antigua Grecia nos llegan ecos de textos perdidos famosos: la Titanomaquia, las obras de Menandro, la poesía de Catulo o la de Safo… En La biblioteca de los libros perdidos, Alexander Pechmann escribe: “Se ha conservado menos de la décima parte de las obras escritas en la antigüedad. En su mayoría se perdieron en el curso de los siglos debido al fuego, a destrucciones arbitrarias, al deterioro natural y a los ratones”.

"El fuego, más que ningún otro enemigo de los libros, parece tener la última palabra y, pese a todo, se han dado resurrecciones"

El fuego es, en efecto, una de las causas más comunes de estas pérdidas. A menudo por accidente o en guerras (desde Alejandría hasta Sarajevo), pero sobre todo a manos de censores políticos o religiosos (desde la antigua China hasta la Alemania nazi). Los censores a veces lo son también por motivos personales, contra la voluntad de los muertos (como los amigos de Lord Byron, que quemaron sus Memorias), pero con frecuencia es el propio autor el que desea destruir su obra. Y a veces fracasa. Fracasó, afortunadamente, Kafka, pero lo logró, por ejemplo, Gógol, que nos privó de la segunda parte de Almas muertas. El fuego, más que ningún otro enemigo de los libros, parece tener la última palabra y, pese a todo, se han dado resurrecciones como la de Rumbo al mar blanco, de Malcolm Lowry, que se creía del todo destruida en un incendio hasta que un borrador previo, conservado por su primera mujer, se publicó en 2014.

Salvo contadas excepciones, aun así, las esperanzas de recuperar obras perdidas sólo se sostienen ante los olvidos: páginas escondidas por autores muertos, manuscritos abandonados en archivos o maletas extraviadas (como las de Hemingway o Walter Benjamin, de las que no quedó rastro). De vez en cuando tenemos suerte y reaparecen en lugares insospechados, como Maurice de Mary Shelley, en un archivo familiar, o el fragmento más antiguo que se conoce de un evangelio, en una máscara mortuoria. De los textos religiosos a veces se han encontrado incluso bibliotecas enteras, como ocurrió en el Mar Muerto o en Nag Hammadi (según Hans Jonas: “uno de los acontecimientos más sensacionales de la historia de la erudición histórico-religiosa”). Una de esas bibliotecas es la del monasterio de Sakya (Tíbet), que hasta 2003 escondió tras una pared 84.000 textos milenarios, actualmente en proceso de digitalización.

"Hace poco pudimos leer noticias sobre una IA destinada a interpretar un pergamino carbonizado por el Vesubio"

Incluso en casos como éste, cuando los manuscritos aparecen, a menudo se encuentran deteriorados, fragmentados o son demasiados. Ante estas situaciones, la tecnología se aprovecha para ver más allá del ojo humano. Dice Pechmann: “Con ayuda de la luz ultravioleta se puede a veces leer, en algunos palimpsestos, el escrito original y rastrear así textos que se creían perdidos”. Las inteligencias artificiales suponen aquí un salto aún mayor. Además de Transcribus y Stylo, hay otras como Fabricius (que sirve para decodificar jeroglíficos), Ithaca (para restaurar textos griegos deteriorados) o Fragmentarium (para reconstruir pasajes de tablillas cuneiformes). Hace poco pudimos leer noticias sobre una IA destinada a interpretar un pergamino carbonizado por el Vesubio, otra que rastreaba las relaciones entre lenguas muertas como el íbero y el vasco, otra que pretendía descifrar la lengua minoica Lineal A… Todas ellas usan una tecnología conocida como Machine Learning.

Y ¿qué es el Machine Learning? “Es una subrama de la IA que permite que el algoritmo aprenda patrones y los relacione en función de su recurrencia”, nos aclara Marta de Carlos. Ella lideró el proyecto de digitalización, transcripción y categorización de documentos que facilitó la investigación de Vincent Pankoke (exagente del FBI) para averiguar la identidad del delator de la familia de Ana Frank. “En dos minutos descubrieron algo que buscaban desde hacía años y a lo que quizá no hubieran llegado sin nuestra aplicación”. Con ella tomaban textos de la época, muchos deteriorados por el uso y el tiempo, automatizaban el proceso de etiquetado y su organización en una biblioteca virtual y, partiendo de este material, identificaban y relacionaban personas entre sí y en el mapa a través de Machine Learning. “No es solamente cómo adquieres la información”, matiza, “sino las relaciones que se establecen entre miles y miles de archivos”..

"En un futuro lejano, quién sabe si la IA nos ayudará a encontrar obras perdidas célebres como Margites (Homero), Cardenio (Shakespeare) o El mesías (Bruno Shulz)"

Los usos de esta tecnología para rescatar otro tipo de arte son innumerables (identificar capas de pintura tapadas en lienzos deteriorados, encontrar inscripciones en cuevas inaccesibles, restaurar material cinematográfico) y su vertiente generativa nos ha mostrado varios ejemplos en el terreno pictórico: coloreando las fotografías de cuadros perdidos de Klimpt o rellenando la parte faltante de la Ronda de noche de Rembrandt. En lo que respecta a los libros, sus aplicaciones también son múltiples. En 2021 se utilizó en el proyecto HandsandBible y ayudó a distinguir en un manuscrito de Qumrán la escritura de dos copistas. En el proyecto ETSO se emplea la IA del mismo modo, para identificar trazos diferenciados, y también para otros propósitos: datar obras en franjas de tiempo, detectar la imprenta, el género del autor, el género literario, emociones o matices en fragmentos, etc. “Las tecnologías bien utilizadas son un aliado tremendo para nuestros propósitos como investigadores” concluye Álvaro Cuéllar. “En nuestro caso, más que quitarnos trabajo, lo único que hace es abrirnos nuevas posibilidades, darnos nuevas respuestas o plantearnos nuevos problemas”.

En un futuro próximo, Gredos publicará La francesa Laura. También hay varias compañías interesadas en representarla. En un futuro lejano, quién sabe si la IA nos ayudará a encontrar obras perdidas célebres como Margites (Homero), Cardenio (Shakespeare) o El mesías (Bruno Shulz). Por lo pronto, aquí en España, el proyecto ETSO acaba de anunciar que la inteligencia artificial ha atribuido a Andrés de Claramonte 16 obras que no se consideraban suyas. Entre ellas, tal y como apuntaban los estudios de Alfredo Rodríguez López-Vázquez y otros filólogos, un clásico indiscutible: El burlador de Sevilla. Sobran motivos para suponer que esta tecnología nos traerá próximamente nuevas sorpresas.

5/5 (17 Puntuaciones. Valora este artículo, por favor)
Notificar por email
Notificar de
guest

2 Comentarios
Antiguos
Recientes Más votados
Feedbacks en línea
Ver todos los comentarios
Rosa María Blanco
Rosa María Blanco
1 año hace

Me ha encantado el artículo de Chema. Es, sin duda, un tema fascinante y esperanzador, que nos traerá muchas sorpresas.
Además del estilo y el manejo perfecto del idioma, el texto de Chema nos crea la necesidad de seguirle el hilo a este extraordinario tema.

Kominsky
Kominsky
1 año hace

Escrito con fluida audacia, sentido y buen manejo de la informacion. Gran articulo.