In Codice Ratio: tecnologie per la trascrizione automatica di fonti storiche manoscritte

In Codice Ratio: tecnologie per la trascrizione automatica di fonti storiche manoscritte

In Codice Ratio è un progetto interdisciplinare che mette insieme competenze informatiche (intelligenza artificiale) e umanistiche (paleografia, storia) con l’obiettivo di sviluppare tecnologie per la trascrizione automatica di fonti storiche manoscritte.

L’area di specializzazione S3 è quella del PATRIMONIO CULTURALE E TECNOLOGIE DELLA CULTURA, e i principali settori di ricerca ERC sono il PE6 (Computer Science and Informatics) e l’SH6 (Study of the Human Past).

Il progetto è svolto in collaborazione con l’Archivio Segreto Vaticano e riscontra l’interesse di NTT Data, azienda leader nel settore IT con esperienza nelle digital humanities (in particolare, NTT Data si sta occupando della digitalizzazione dei i manoscritti della Biblioteca Vaticana).

Il coordinatore è Paolo Merialdo, prof. associato di Analisi dell’Informazione su Web, responsabile scientifico nei PRIN 2004 e PRIN 2010.

Gli altri componenti sono: Alessandro Micarelli, prof. ordinario di Intelligenza artificiale, membro della commissione per la valutazione della Ricerca Industriale, fondatore dell’Ass. Italiana di Intelligenza Artificiale. Serena Ammirati, Ricercatrice (rtd-A) presso il Dip. di Studi Umanistici, dove insegna Paleografia; i suoi interessi di ricerca sono la storia del libro latino antico, il libro latino di contenuto giuridico.

Il Gruppo di ricerca sarà integrato da: un assegnista di ricerca annuale, appositamente reclutato per il progetto, con competenze nell’ambito della Paleografia; due assegnisti (uno da 12 e l’altro da 18 mesi) con competenze informatiche nell’ambito dell’intelligenza artificiale e dell’elaborazione delle immagini; un consulente esterno, con competenze in paleografia e archivistica, in particolare sui registri papali dell’Archivio Segreto Vaticano.

Obiettivo del progetto In Codice Ratio è quello di sviluppare un workflow innovativo, basato su moderne tecniche di machine learning e di crowdsourcing, per rendere scalabile ed economico il processo di trascrizione delle fonti storiche.

L’analisi delle fonti storiche si avvale sempre più di soluzioni informatiche basate su approcci data-driven.

Tuttavia, questi approcci non si applicano ai manoscritti perché l’analisi dei contenuti può essere fatta su trascrizioni dei testi. Purtroppo, la maggior parte del patrimonio storico manoscritto che è stato acquisito digitalmente non è stato trascritto.

In letteratura esistono soluzioni per la trascrizione automatica di manoscritti, ma risultano poco scalabili. Finalità del progetto In Codice Ratio è ridurre il gap semantico tra la digitalizzazione e l’analisi delle fonti storiche.

Beneficiari diretti del progetto sono storici, paleografi e filologi, che avranno a disposizione nuovi strumenti per un’interpretazione più ricca del passato.

Ma le tecnologie sviluppate nel progetto hanno una rilevanza anche sul piano economico poiché possono risultare abilitanti per la creazione di servizi innovativi nell’analisi di documentazione manoscritta.

La Regione Lazio ha sovvenzionato il progetto di Ricerca per 131.592,50 Euro.

(Fonte Università di Roma TRE)

Related Articles