Abulafia

Sistema software di gestione documentale per archivi storico-giudici


Abstract

Imagine if it were possible to extract the knowledge contained within documents (not just the knowledge about the documents) and manage it in a knowledge base that is continually being updated with new information, both manually and automatically.

Focus on the forest rather than the trees


L. M. Garshol, What are Topic Maps?




Abulafia è un sistema di content management basato su topic maps, strutturato per gestire basi documentali di tipo storico-giuridico e consentire un accesso semantico alle informazioni.

Abulafia implementa un SQL engine per la gestione dei dati ed un topic map engine SQL realizzato sulle specifiche TMRQL (Topic Map Relational Query Language) di G. Moore e K. Ahmed per la gestione delle relazioni documentali e la cercabilità delle informazioni.

Lo sviluppo di un front-end e di un back-end PHP modulari e conformi agli standard W3C sono obbiettivi finali del progetto.

Abulafia è rilasciato come software libero sotto licenza GPL.


Topic maps

Topic maps are a tool to organize information in a way that is optimized for navigation.
Topic maps represent a structured view over a set of information resources. The base resources themselves do not need to be structured.

M. Biezunski, Topic maps at a glance





Le topic maps sono definite da uno standard ISO (ISO/IEC 13250) e sono un sistema per l'organizzazione e la correlazione di dati indipendente dai dati stessi. Le topic maps realizzano un indice che risiede al di fuori delle informazioni che descrive: si lavora con il significato delle informazioni e non più con le informazioni stesse.



Il risultato è una struttura informativa non vincolata dai tradizionali sistemi gerarchici, che contiene gerarchie multiple sovrapposte semanticamente ricche e che consente all'utente di non dover seguire più la sola logica di accesso pensata dal progettista: i percorsi sono multipli e ridondanti.



Le topic maps non obbligano ad un modello ontologico predefinito (sono in effetti meta-modelli), ma consentono di definire il proprio sistema organizzativo per l'architettura dell'informazione modellandolo come una classificazione a faccette, un vocabolario controllato, un tesauro, un'ontologia o una combinazione di questi.


Una via d'uscita dall'infoglut


Una topic map è, non sorprendentemente, costituita principalmente da topics. Questi rappresentano le cose descritte dalla topic map. Adattando un esempio di L. M. Garshol, in una topic map che tratti di IA possibili topics sarebbero deliverables, usability heuristics, Nielsen, o Morville.


I topics hanno relazioni, che la topic map modella come associazioni (associations) e che sono typed, ovvero descritte. Seguendo il nostro esempio, la association tra Nielsen ed usability heuristics è una relazione di authorship. Le associazioni hanno una caratteristica interessante: i topics all'interno di una relazione ricevono un ruolo (role). Più sopra, Nielsen è l'autore (author), mentre le heuristics sono il lavoro (work).

Il significato di questo semplice passaggio è che all'interno di una topic map le due frasi 'Nielsen ha scritto le usability heuristics' e 'Le heuristics sono state scritte da Nielsen' sono esattamente la stessa cosa, l'associazione tra i topics è bidirezionale.

Ovviamente, le associazioni non sono limitate a due topics: Nielsen ha prodotto deliverables sulle usability heuristics può essere reso con la stessa facilità dell'esempio riportato sopra..


L'ultimo elemento di una topic map sono le occorrenze (occurrences), ovvero risorse informative rilevanti in relazione ad un topic. Nel caso di Nielsen, una foto, la sua homepage, un saggio. Poichè anche le occorrenze possono essere descritte (typed), le informazioni riportabili ad un utente che richiede un topic non sono solo quantitative (un certo numero di link), ma anche qualitative (cosa sono quei link).

Con un vocabolario ristretto, elegante e semplice, le topic maps possono generare un'elevata complessità semantica.


Topic maps e CMS: on top, underneath, ITMS


I CMS hanno risolto diversi problemi legati alla lavorazione di contenuti in ambito multi-utente, lasciando però aperte diverse questioni. Tra queste, non ultima e legata soprattutto all'esplosione della pubblicazione sul World Wide Web, l'organizzazione delle informazioni e la conseguente cercabilità (o trovabilità come dice Rosati) da parte di una platea eterogenea di utenti non noti a priori.



I CMS hanno sviluppato propri modelli tassonomici ad hoc, diversi tra loro, risolvendo il problema specifico ma irrigidendo su questi le proprie funzionalità ed imponendo limitazioni alla disponibilità delle informazioni. Le topic maps forniscono il tassello mancante: un modello descrittivo infinitamente flessibile, ma standard.





All'interno di un CMS le topic maps lavorano a più livelli: producono la navigazione, consentono la cercabilità, incrementano la findability, creano parte del contenuto attraverso le occorrenze dei propri topics.


On top ed underneath si riferiscono ai possibili sistemi di integrazione tra topic map e CMS: col primo, il topic map engine produce oltre che la navigazione una parte rilevante del contenuto della pagina; col secondo, il ruolo è limitato alla creazione di links e rimandi (ad es. fornendo un blocco what's related). Il CMS è la parte centrale del processo, ed è sua responsabilità fornire i metadati necessari perché sia possibile correlare pagina e topic (o topics).



Garshol ha proposto di chiamare i sistemi di content management basati su topic maps ITMS (Integrated Topic Management Systems): CMS il cui principio organizzativo è la topic map.


Abulafia

Lo scopo di Abulafia è la gestione di archivi documentali strutturati, con uno schema di metadati basato sul modello elaborato dal Dublin Core (DCES).



Seguendo ed integrando lo schema delineato da S. Pepper, il progetto e l'implementazione di Abulafia possono essere divisi in due passaggi:

1. Realizzazione della topic map e della base dati:


2. Realizzazione dell'applicazione:

Nel caso un progetto come Abulafia, che nasce per risolvere un problema specifico relativo ad una base documentale specifica e a scopi sperimentali, molto del lavoro di costruzione semantico della prima fase, inclusa l'analisi delle fonti per la creazione di topics, types, associations, è in un certo qual modo facilitato dall'omogeneità dei dati di partenza, mentre, anche considerando il contesto sperimentale, l'implementazione di una topic map TMRQL e la necessaria costante verifica ed affinatura di questa implementazione presentano sicuramente più problemi progettuali.


Minima technicalia

Abulafia è scritto in PHP 4 ed utilizza come RDBMS MySQL 5.

Lo schema SQL della gestione dati è stato originariamente sviluppato da Andrea Resmini e Matteo Caprari per exea tra il 1999 ed il 2002 ed è stato in seguito modificato per la gestione documentale con topic maps da Andrea Resmini.


Bibliografia

La bibliografia che segue è disponibile, insieme ad altre risorse, nel gruppo Topic maps liberamente accessibile su Magnolia [http://ma.gnolia.com].

ISO/IEC JTC1/SC34 N322ISO/IEC JTC1/SC34 N322
ISO/IEC 13250, Topic Maps (Second Edition)
Tags: topic maps, specifications

The TAO of Topic Maps
Topic maps are a new ISO standard for describing knowledge structures and associating them with information resources. As such they constitute an enabling technology for knowledge management. Dubbed “the GPS of the information universe”, topic maps are also destined to provide powerful new ways of navigating large and interconnected corpora. While it is possible to represent immensely complex structures using topic maps, the basic concepts of the model ” Topics, Associations, and Occurrences (TAO)” are easily grasped. This paper provides a non-technical introduction to these and other concepts.
Tags: topic maps, xml, how-to, ontopia)

The XML Papers: Lessons on Applying Topic Maps
A hands-on guide to topic maps
Tags: topic maps, xml, how-to, ontopia

XML.com: Introduction to XFML
Peter van Dijck introduces XFML - eXchangeable Faceted Metadata Language - a lightweight and easy to understand XML language for sharing faceted metadata.
Tags: faceted classification, xml, xfml, ia, information architecture

Topic Maps Relational Query Language
The topic-maps-to-SQL TMRQL specifications (PDF, 69KB)
Tags: topic maps, sql, relational database, specification

XML Topic Maps (XTM) 1.0
This specification provides a model and grammar for representing the structure of information resources used to define topics, and the associations (relationships) between topics.
Tags: topic maps, xtm, xml, specification, definition

Topic Maps for repositories
An early paper by Kal Ahmed exploring the potential for using topic maps in conjunction with content management systems and other forms of content repository. Written in 2000.
Tags: topic maps, repository, sql

XML.com: Mapping DTDs to Databases
This in-depth article describes best practice for mapping XML documents to databases.
Tags: xml, sql, dtd, relational database, topic maps

Topic Maps in Web-site Architecture
An overview of approaches to apply topic maps to improve site cohesion, navigation and search (PDF, 123KB).
Tags: topic maps, information architecture, information design, www

Techquila:Topic Map Design Patterns For Information Architecture
This paper presents the arguments for developing and publishing topic map design patterns and a proposed notation for diagramming design patterns based on UML. Finally, by way of examples, the paper presents some design patterns for representation of traditional classification schemes such as thesauri, hierarchical and faceted classification.
Tags: topic maps, design patterns, ia, information architecture
Topic maps in content management
This paper shows how topic maps can address the limitations of traditional content management systems while building on their strengths. The term ITMS (Integrated Topic Management System) is coined for a content management system based on topic maps.
Tags: topic maps, cms, content management, ia, information architecture, ontopia, itms


Andrea Resmini: È stato assistente al Politecnico di Milano dove si è occupato di progettazione morfogenetica e teorie del caos e di software ed infrastrutture per la didattica via Internet. Dal 1989 si occupa professionalmente di reti e sistemistica IT e ITC e dal 1999 di CMS e architettura dell'informazione.
Nel 2001 ha creato con G. Orsi exea, un piccolo studio di IT consulting e design con una forte propensione all'uso del software libero, in cui ricopre il ruolo di Technical Lead.
È dottorando in Storia ed informatica presso il Dipartimento di Discipline Storiche dell'Università di Bologna dove si occupa di IA applicata agli archivi storico-documentali e della progettazione di Abulafia.
Andrea usa Gentoo GNU / Linux (e Vi).