Direzione generale per gli archivi

Ontologie archivistiche | analisi e descrizione

Il progetto Ontologie archivistiche si propone come sistema collaborativo di analisi e descrizione ontologica di sistemi archivistici nazionali e di una base concettuale condivisa. È stato ideato e sviluppato in linea con le proposte legate al cosiddetto "web semantico", iniziativa W3C che, come è noto, si preoccupa di fornire un framework in cui poter definire le convenzioni per l’uso interoperabile dei metadati, in particolar modo, per quanto riguarda la sintassi, la struttura e la semantica.
Basandosi sulle principali tecnologie di riferimento per il semantic web, e più in particolare sul Resource Description Framework (RDF) e sul Web Ontology Language (OWL), il progetto si è posto come primo fondamentale obiettivo la definizione di una “ontologia”, ovvero una descrizione formalizzata, dei sistemi archivistici nazionali SIUSA - Sistema Informativo Unificato delle Sovrintendenze Archivistiche - e Sistema Guida generale degli Archivi di Stato italiani, con contestuale riconduzione (mapping) degli elementi informativi individuati nei sistemi ai rispettivi standard internazionali di descrizione in formato XML (EAD e EAC, a loro volta oggetto di una descrizione ontologica). I meccanismi formali forniti dallo standard RDF e da OWL hanno consentito inoltre di ricondurre gli elementi dei due sistemi in tal modo definiti ad una ontologia “esterna” di concetti archivistici ritenuti rappresentativi della tradizione descrittiva nazionale, proposta ed utilizzata come modello concettuale di riferimento rispetto al quale rapportarsi e conseguentemente far emergere coincidenze o divergenze tra i sistemi archivistici analizzati.

Il progetto è stato sviluppato in un ambiente informatizzato che rende possibile visualizzare e navigare elementi e concetti di cui si compongono le ontologie, inserire in maniera collaborativa e incrementale annotazioni, commenti o proposte di modifica per ciascuna delle risorse concettuali definite formalmente. Questa possibilità è stata affidata a DBin, uno strumento software sviluppato negli ultimi anni come prototipo di ricerca all'interno del Dipartimento di Elettronica, Intelligenza Artificiale e Telecomunicazioni dell'Università Politecnica delle Marche.

DBin è un'applicazione per la gestione della conoscenza interamente basato su standard definiti dall'iniziativa Semantic Web e su sistemi P2P per lo scambio delle informazioni. L'uso di DBin per lo scambio delle informazioni è molto simile a quello dei popolari software di file sharing, anche se l'intento è completamente diverso. Mentre le tipiche applicazioni P2P sono dedicate allo scambio di file, DBin utilizza l'approccio P2P per scambiare conoscenza codificata in RDF.

In questo ambiente è stato creato un dominio specifico relativo agli archivi in cui sono state inserite, oltre alle ontologie descriventi SIUSA, Guida generale, e i concetti “rilevanti” per la descrizione del dominio archivistico, anche una descrizione ontologica degli standard internazionali di riferimento (ISAD, ISAAR, EAD, EAC): partendo da questa base informativa incrementabile con la descrizione formale di altri sistemi, si possono sperimentare forme di collaborazione e di condivisione a livello nazionale di conoscenza archivistica, e verificare la possibilità di aggregare utenti riconosciuti e qualificati in una "comunità di interesse" operativa.
Attualmente la tecnologia utilizzata consente di creare un ambiente di lavoro aperto ad una quantità molto ridotta di utenti autorizzati, selezionati tra quelli che hanno collaborato alla creazione dei due sistemi informativi; è prevista a breve una nuova versione di DBin che dovrebbe superare tali limitazioni.
Tuttavia, nella convinzione che su questo argomento estremamente impegnativo è opportuno raccogliere la riflessione del numero il più ampio possibile di archivisti, si è ritenuto di mettere subito a disposizione, con una nota introduttiva del progetto - e in attesa di poter rendere disponibile a tutti gli interessati l’applicativo DBin, entro la fine di giugno -, una versione in formato HTML usata dal gruppo di lavoro ai fini di mera consultazione per le attività di verifica, sia per il SIUSA che per la Guida Generale.

Nota introduttiva sulle ontologie archivistiche

Il punto di partenza dell’intera iniziativa ha coinciso con la riflessione sulla formalizzazione in EAD (Encoded Archival Description) e EAC (Encoded Archival Context) degli elementi che concorrono a descrivere il complesso archivistico e gli elementi di contesto in SIUSA, allorché si è deciso di mettere a confronto il Sistema delle Soprintendenze Archivistiche con il più antico sistema della Guida Generale che, partendo dal cartaceo e di seguito alla realizzazione di una prima edizione informatica, era stata recentemente trasferita in una piattaforma XML nativa e ricondotta al modello dati EAD. L’intento era quello di costruire un’ipotesi di convergenza nella mappatura verso EAD ed EAC dei sistemi archivistici realizzati.
La riflessione ha necessariamente chiamato in causa i concetti fondamentali dell’archivistica, che presiedono invariabilmente anche alla descrizione degli archivi diffusa sul web.
Il risultato che si presenta, frutto di un lungo e laborioso confronto, consegue un triplice risultato:

Definisce in via astratta alcuni concetti fondamentali che concorrono alla descrizione archivistica, anche sul web, avvalendosi della dottrina più avanzata;
Determina una connessione logico-formale tra questi concetti e gli elementi dei due sistemi considerati, previa una loro descrizione formalizzata;
Costruisce un mapping di concetti ed elementi in tal modo definiti verso gli standard EAD ed EAC, formulando in alcuni casi soluzioni che si sottopongono come proposta alla comunità scientifica, quale quella di utilizzare lo standard EAC anche per la descrizione del soggetto conservatore.

Di seguito si darà conto delle procedure seguite e dei risultati ottenuti attraverso alcuni esempi.

   Gli elementi concettuali

La definizione ontologica dei concetti archivistici riprende gli elementi individuati negli standard archivistici internazionali ISAD (G) e ISAAR (CPF) e in alcuni casi ne definisce gli aspetti peculiari, in riferimento alla situazione specifica italiana.

Ai fini di una maggiore chiarezza sono stati identificati gli elementi concettuali portanti, i quali sono stati suddivisi in tre classi: entità, contesto di riferimento e componenti informative.

A) Le entità individuate coincidono con le unità individuali imprescindibilmente presenti nella descrizione di un archivio. Esse sono:

  • il soggetto conservatore
  • il complesso archivistico
  • il soggetto produttore
  • l’unità archivistica

B) A queste si affiancano gli elementi che complessivamente concorrono a costituire il contesto di riferimento, individuati nella:

  • periodizzazione,
  • contesto storico istituzionale
  • tipologia istituzionale
  • tipologia documentaria
  • raggruppamento istituzionale
  • contesto storico territoriale

C) Per quanto riguarda invece le componenti informative, sono state individuate:

  • le denominazioni
  • gli strumenti di ricerca
  • l’intestazione
  • la nota archivistica
  • la nota storico istituzionale
  • la consistenza
  • la bibliografia
  • la fonte
  • gli estremi cronologici

Quest’ultime, come parte di entrambi i sistemi, concorrono a descrivere ciascuno degli elementi/entità e elementi/contesto nei quali i sistemi si articolano.
Gli elementi concettuali che appartengono a uno solo dei due sistemi sono stati segnalati: tra gli elementi di contesto, la Periodizzazione è propria della GG, il Contesto storico territoriale di SIUSA.

I maggiori problemi sono stati dati dalla definizione dei complessi archivistici: la complessa storia degli Stati preunitari e della formazione dello Stato unitario ha determinato una stratificazione della documentazione prodotta dai diversi Uffici che non sempre corrisponde ai modelli descrittivi proposti dagli standard internazionali ISAD (G). Dunque per questi archivi si è ritenuto necessario arrivare ad una maggiore specificazione delle definizioni. Ne derivano le definizioni di Fondo, Fondo complesso (o complesso di fondi/superfondo); Miscellanea, Raccolta.
I suddetti concetti, resi attraverso una ontologia formalizzata in linguaggio OWL che include descrizioni di classi, di proprietà e delle loro occorrenze, intrecciati tra di loro, permettono di rappresentare situazioni molto complesse, dipendenti dalla storia del soggetto produttore e anche dalle vicende conservative dell’archivio.
La semantica formale OWL consente di descrivere separatamente gli elementi individuati e di costruire tra di loro intrecci che consentono, per via semantica e non strutturale, di aggregarli e di ricondurli ad unità.

Ad esempio, a partire da una definizione condivisa di complesso di fondi, sono stati a questa riferiti gli elementi presenti nei rispettivi sistemi secondo la struttura proposta per SIUSA e per la Guida generale agli archivi di Stato.

Osservazioni e commenti
Osservazioni e commenti sia sulle descrizioni ontologiche (della base concettuale comune e dei singoli sistemi) che per il mapping in EAD/EAC e per i dati tecnici del sistema, in questa prima fase, in attesa della creazione di un Forum specifico, possono essere inviati, una volta effettuata l'iscrizione, all' indirizzo di posta elettronica del Gruppo (ontologie-archivistiche@googlegroups.com). Per richiedere l'iscrizione, e per precauzione anti-spam, inviare una mail al Webmaster (dg-a.webmaster@beniculturali.it), con oggetto "Richiesta iscrizione gruppo Ontologie". L'archivio dei messaggi del gruppo è consultabile solamente dagli iscritti. 

I crediti del progetto
Il progetto è stato promosso dal Servizio III della Direzione generale per gli Archivi e affidato per la sua realizzazione al centro MAAS del Consorzio Roma Ricerche.

  • La progettazione delle descrizioni ontologiche e delle componenti informatiche è stata curata dal MAAS.
  • La descrizione ontologica dei singoli sistemi archivistici e della base concettuale condivisa è stata curata da un gruppo di lavoro composto da Maria Grazia Pastura, Paola Carucci, Giuseppe Mesoraca, Stella Di Fazio, Giovanni Michetti, Enrico Rendina, Chiara Veninata.
  • Il sistema Open Source Dbin è sviluppato dal centro SEMEDIA del Dipartimento di Elettronica, Intelligenza Artificiale e Telecomunicazioni dell'Università Politecnica delle Marche.
Direzione Generale Archivi
Via di San Michele 22- 00153 Roma IT
Copyright © 2012
Disclaimer
+39 06 672361 
+39 06 4882358
posta elettronica