PRESSMINT

 

 

PressMint es un proyecto flagship de CLARIN que tiene como objetivo crear un corpus interoperable y multilingüe de prensa histórica europea, centrado principalmente en los siglos XIX y XX.

Inspirado en el modelo desarrollado por ParlaMint, el proyecto aplica principios de estandarización e interoperabilidad al ámbito de la prensa histórica, facilitando su acceso, comparación y análisis a gran escala.


La participación de CLARIAH-ES

CLARIAH-ES coordina la contribución española a PressMint a través de una red de nodos distribuidos, en colaboración con bibliotecas, archivos y repositorios digitales.

En particular, participan los siguientes nodos y entidades:

  • CLARIAH-CAT (Cataluña), en colaboración con Arxiu de Revistes Catalanes Antigues

  • CLARIAH-CM (Madrid), con Patrimonio Digital Complutense y la Biblioteca Digital de la Comunidad de Madrid

  • CLARIAH-EUS (País Vasco), junto a Euskariana

  • CLARIAH-GAL (Galicia), con recursos como el TILG (O Tesouro Informatizado da Lingua Galega)

  • CLARIAH-IATEXT (Canarias), en colaboración con El Museo Canario y Jable

  • CLARIAH-UA (Alicante), a partir de los fondos de la Biblioteca Virtual Miguel de Cervantes


Hacia una prensa histórica interoperable

Los corpus de PressMint, al igual que los de ParlaMint, se codifican siguiendo estándares basados en Text Encoding Initiative (TEI) e incorporan procesos de normalización y enriquecimiento lingüístico.

Además, el proyecto aborda uno de los principales retos de la prensa histórica digitalizada: la calidad del OCR. Para ello, se están aplicando tecnologías de inteligencia artificial (LLMs) que permiten mejorar la transcripción, identificar entidades y facilitar el análisis computacional de los textos.


Infraestructura y ciencia abierta

PressMint se integra en el ecosistema europeo de infraestructuras de investigación, en conexión con DARIAH y proyectos como EOSC Mesh.

Siguiendo la estela de ParlaMint, el proyecto promueve el acceso abierto y la reutilización de datos, contribuyendo al desarrollo de nuevas metodologías para el análisis a gran escala de fuentes históricas.