
|
Nota introduttiva sulle ontologie archivistiche
Il punto di partenza dell’intera iniziativa ha coinciso con la riflessione sulla formalizzazione in EAD (Encoded Archival Description) e EAC (Encoded Archival Context) degli elementi che concorrono a descrivere il complesso archivistico e gli elementi di contesto in SIUSA, allorché si è deciso di mettere a confronto il Sistema delle Soprintendenze Archivistiche con il più antico sistema della Guida Generale che, partendo dal cartaceo e di seguito alla realizzazione di una prima edizione informatica, era stata recentemente trasferita in una piattaforma XML nativa e ricondotta al modello dati EAD. L’intento era quello di costruire un’ipotesi di convergenza nella mappatura verso EAD ed EAC dei sistemi archivistici realizzati.
La riflessione ha necessariamente chiamato in causa i concetti fondamentali dell’archivistica, che presiedono invariabilmente anche alla descrizione degli archivi diffusa sul web.
Il risultato che si presenta, frutto di un lungo e laborioso confronto, consegue un triplice risultato:
- Definisce in via astratta alcuni concetti fondamentali che concorrono alla descrizione archivistica, anche sul web, avvalendosi della dottrina più avanzata;
- Determina una connessione logico-formale tra questi concetti e gli elementi dei due sistemi considerati, previa una loro descrizione formalizzata;
- Costruisce un mapping di concetti ed elementi in tal modo definiti verso gli standard EAD ed EAC, formulando in alcuni casi soluzioni che si sottopongono come proposta alla comunità scientifica, quale quella di utilizzare lo standard EAC anche per la descrizione del soggetto conservatore.
Di seguito si darà conto delle procedure seguite e dei risultati ottenuti attraverso alcuni esempi.
Gli elementi concettuali
La definizione ontologica dei concetti archivistici riprende gli elementi individuati negli standard archivistici internazionali ISAD (G) e ISAAR (CPF) e in alcuni casi ne definisce gli aspetti peculiari, in riferimento alla situazione specifica italiana.
Ai fini di una maggiore chiarezza sono stati identificati gli elementi concettuali portanti, i quali sono stati suddivisi in tre classi: entità, contesto di riferimento e componenti informative.
A) Le entità individuate coincidono con le unità individuali imprescindibilmente presenti nella descrizione di un archivio. Esse sono:
- il soggetto conservatore
- il complesso archivistico
- il soggetto produttore
- l’unità archivistica
B) A queste si affiancano gli elementi che complessivamente concorrono a costituire il contesto di riferimento, individuati nella:
- periodizzazione,
- contesto storico istituzionale
- tipologia istituzionale
- tipologia documentaria
- raggruppamento istituzionale
- contesto storico territoriale
C) Per quanto riguarda invece le componenti informative, sono state individuate:
- le denominazioni
- gli strumenti di ricerca
- l’intestazione
- la nota archivistica
- la nota storico istituzionale
- la consistenza
- la bibliografia
- la fonte
- gli estremi cronologici
Quest’ultime, come parte di entrambi i sistemi, concorrono a descrivere ciascuno degli elementi/entità e elementi/contesto nei quali i sistemi si articolano.
Gli elementi concettuali che appartengono a uno solo dei due sistemi sono stati segnalati: tra gli elementi di contesto, la Periodizzazione è propria della GG, il Contesto storico territoriale di SIUSA.
I maggiori problemi sono stati dati dalla definizione dei complessi archivistici: la complessa storia degli Stati preunitari e della formazione dello Stato unitario ha determinato una stratificazione della documentazione prodotta dai diversi Uffici che non sempre corrisponde ai modelli descrittivi proposti dagli standard internazionali ISAD (G). Dunque per questi archivi si è ritenuto necessario arrivare ad una maggiore specificazione delle definizioni. Ne derivano le definizioni di Fondo, Fondo complesso (o complesso di fondi/superfondo); Miscellanea, Raccolta.
I suddetti concetti, resi attraverso una ontologia formalizzata in linguaggio OWL che include descrizioni di classi, di proprietà e delle loro occorrenze, intrecciati tra di loro, permettono di rappresentare situazioni molto complesse, dipendenti dalla storia del soggetto produttore e anche dalle vicende conservative dell’archivio.
La semantica formale OWL consente di descrivere separatamente gli elementi individuati e di costruire tra di loro intrecci che consentono, per via semantica e non strutturale, di aggregarli e di ricondurli ad unità.
Ad esempio, a partire da una definizione condivisa di complesso di fondi, sono stati a questa riferiti gli elementi presenti nei rispettivi sistemi secondo il seguente schema:
|
|
rdfs:comment |
- Fondo costituito da una pluralità di fondi
|
owl:sameAs |
|
isConceptOf |
|
hasConcept |
|
isConceptReferredTo |
|
Ciascuna delle istanze, individuate da un identificativo univoco, da una proprietà che attribuisce loro una “label” e da una ulteriore proprietà, “comment”, che ne fornisce una definizione, rimanda a quelle altre istanze cui risulta collegata tramite ulteriori peculiari proprietà che ne determinano la relazione; le entità richiamate in ciascuna scheda risultano a loro volta cliccabili ed esplorabili.
Per il Soggetto produttore avremo: una definizione concettuale condivisa tra SIUSA e GG che, anche in questo caso, si raccorda con l’analogo concetto nelle Entità rinviando, rispettivamente, al “Soggetto Produttore” con le specifiche di Ente, Famiglia e Persona ” del SIUSA e al “Soggetto produttore, scheda analitica” della GG .
Continuando nell’analisi e prendendo ad esempio un elemento concettuale degli elementi di contesto quale la “Tipologia istituzionale” avremo un rinvio da questo concetto generale all’elemento “Soggetto produttore, scheda di repertorio” della GG e all’elemento “Profilo istituzionale generale” del SIUSA .
Quindi, partendo dalla individuazione degli elementi concettuali archivistici e dalla loro definizione, si è proceduto alla rappresentazione formale di collegamenti, legami e rinvii esistenti tra i diversi concetti, definendone l’ambito di applicazione attraverso l’esplicitazione di relazioni (mercé le proprietà isConceptReferredTo e la proprietà inversa hasConcept) con gli elementi di riferimento nell’ambito dei due sistemi.
Le entità di varia natura (tabelle, unità primarie, elementi, valori controllati) e di vario livello individuate nei due sistemi e formalmente definite nelle rispettive ontologie come altrettante classi OWL, presentano infatti una serie di proprietà che definiscono sia le relazioni tra le entità proprie di ciascun sistema (es. isElementOf, hasElement, isControlledValueOf, hasControlledValue, etc., rispettivamente è elemento di, ha elemento, è valore controllato di, ha valore controllato, etc.) sia il rapporto tra queste entità ed altre descrizioni ontologiche realizzate, quelle relative ai modelli dati EAD ed EAC. Sono state così definite due apposite proprietà OWL: isMappedWithEAD (è mappato verso EAD) e isMappedWithEAC (è mappato verso EAC) grazie a cui è risultato possibile ricondurre ciascun elemento informativo ai rispettivi standard internazionali in formato XML. Il valore di ciascuna di queste proprietà corrisponde alla indicazione dello specifico elemento descrittivo EAD o EAC ritenuto idoneo a rappresentare i contenuti veicolati dalle entità appartenenti ai due sistemi.
Gli elementi dei sistemi SIUSA e Guida Generale
Le aree informative o elementi identificativi del SIUSA sono:
della GG:
|