lundi 2 avril 2012

OAI-PMH


ñ  Définition :

OAI-PMH => Open Archive Initiative Protocol for Metadata Harvesting (=protocole de collecte de métadonnées pour l'iniative des archives ouvertes). Il permet de faciliter la mutualisation et la diffusion des contenus puisqu'il repose sur l'utilisation de fiches de métadonnées. Son utilisation et ses spécifications sont libres et disponibles sur le site de l'Open Archive Initiative, qui fut élaboré à la suite de la Convention de Santa Fe en 1999. Grâce au protocole OAI-PMH, ce ne sont pas les ressources proprement dites qui sont échangées sur les réseaux mais leurs fiches de métadonnées. Les ressources restent à leur emplacement d'origine, toujours accessibles depuis leurs fiches de métadonnées. Donc, les ressources sont accessibles rapidement, sans être dupliquées ni déplacées, et dans leur dernière version.
L'OAI-PMH  définit deux types d'acteurs :
-        les fournisseurs de données qui déposent les métadonnées sur un serveur web appelé « entrepôt »
-        les fournisseurs de services qui collectent ou moissonnent (on les appelle « moissonneurs ») ces données pour les intégrer à l'index de leur propre bibliothèque numérique
Un même établissement peut jouer les deux rôles : diffuser ses métadonnées et collecter celles des autres. Le fonctionnement de base du protocole repose sur une communication de client à serveur. Le client envoie des requêtes au serveur en HTTP, le serveur répond par un flux de données en XML.
Le BNF a ouvert deux entrepôts OAI pour faciliter l'accès à ses collections et à ses données :
-        OAI-NUM : notices de tous les documents numérisés par la BNF et accessibles par Gallica
-        OAI-CAT : ensemble des notices de ses documents numérisés ou non

ñ  Objectifs :

-        accroître la visibilité des collections numériques sur internet
-        reconstituer virtuellement des corpus à partir de ressources accessibles sur différents sites
-        alimenter des portails thématiques
-        mettre à jour simplement et automatiquement les métadonnées collectées et des liens

ñ  Concepts :

Ces concepts documentaires sont simples :
-        la ressource = document-objet décrit, réel ou virtuel
-        l'item = fiche ou notice informatique décrivant cet objet (exemple notice bibliographique en format UNIMARC)
-        l'enregistrement = ensemble des métadonnées extraites d'un item dans un format XML, et qui fait l'objet de l'échange entre l'entrepôt et le moissonneur
-        lots = de manière optionnelle, chacun des items peut relever d'un ou de plusieurs ensembles ou lots (aussi appelés « sets ») définis par le producteur de l'entrepôt pour permettre une moisson dite en « bloc » de la totalité des items relatifs à un type de support ou à un thème en particulier (exemple périodiques)

ñ  Organisation :

Le protocole définit le langage par lequel communique le fournisseur de données (entrepôt) et le fournisseur de service (agrégateur qui rassemble des données collectées par un moissonneur). Pour alimenter l'agrégateur, le moissonneur visite plusieurs entrepôts qu'il doit interroger massivement, une ou plusieurs fois, pour extraire les enregistrements des items qui l'intéressent.
Ensuite, après la collecte, le moissonneur dépose les données dans une base que le fournisseur de service rend accessible à ses clients. L'interrogation de cette base est directe et ne sollicite pas les entrepôts d'origine. En effet, l'utilisateur final interroge uniquement le réservoir de notices du fournisseur de service, constitué par moisson, qui lui retourne en réponse la liste des notices pertinentes. Ces notices proposent notamment un lien hypertexte vers le document primaire, seulement accessible sur le serveur du fournisseur de données.

ñ  L'OAI en bibliothèque :

Pour une bibliothèque qui cherche à valoriser et diffuser largement son offre de contenu électronique en ligne, la constitution d'un entrepôt OAI est une solution simple à mettre en œuvre. Alors que pour une bibliothèque qui cherche un moyen de collecter l'information en ligne pertinente sur un sujet ou un domaine donné, elle devra plutôt concevoir et développer un moissonneur OAI. Il peut donc être utilisé pour des projets très différents, les deux approches pouvant être combinées au sein d'un même projet.
Quelques SIGB et logiciels de gestion électronique de documents (par exemple Ex-Libris) ou des outils de recherche pour des documents XML (par exemple plate-forme SDX) commencent à proposer des services OAI.

ñ  Exemples d'entrepôt OAI :

Certains ont été spécifiquement développés pour l'archivage et la diffusion en ligne des pré-publications des articles scientifiques (E-prints de l'Université de Southampton ou encore Pubmedcentral) ou des thèses (projet Archimède de l'Université de Laval).
En France, la plupart des entrepôts sont consacrés à des articles scientifiques (Aladin = Accès Libre aux Archives du Dépôt Enstitutionnel Numérique) ou à des thèses en ligne (projet Cyberthèses de l'Université de Lyon ou en ligne des grandes écoles de Paris (Pastel)). Sinon, il existe des entrepôts OAI voués à l'archivage et valorisation de collections documentaires spécifiques comme l'archive de paroles du LACITO (=LAngues et CIvilisation de Tradition Orale) au CNRS.
En dehors de ces domaines, peu de bibliothèques françaises conçoivent des entrepôts. Ils permettraient pourtant d'améliorer le signalement des grands ensembles d'images et de dossiers documentaires qu'elles mettraient en ligne.

ñ  Exemples de moissonneurs :

Ils sont de plus en plus nombreux à parcourir le web, notamment ceux des agrégateurs encyclopédiques institutionnels dont l'un des plus complet, OAIster (Université du Michigan). La moisson OAI peut aussi servir à constituer de grands répertoires comme le projet Michael de répertoire européen des fonds culturels numériques. Elle est aussi à la base de portails participant le plus souvent d'une approche à la fois thématique, géographique et interprofessionnel, qui associent bibliothèques, musées, archives et associations pour la valorisation de leurs collections (exemple: PictureAustralia valorise le patrimoine pictural et photographique australien numérisé).
En France, par exemple, le projet de Banque Numérique du Savoir d'Aquitaine (BNSA) incite se partenaires à fournir des bases de données patrimoniales compatibles avec le protocole OAI pour les moissonner et permettre leur valorisation via une interface de consultation unique.

ñ  Conclusion :

Pour résumer, ce protocole d'échange permet de créer, alimenter, tenir à jour, par des procédures automatisées, des réservoirs d'enregistrement qui signalent, décrivent et rendent accessibles des documents sans les dupliquer ni modifier leur localisation d'origine. Ainsi, une bibliothèque agissant en tant que fournisseur de données a la possibilité d'offrir une visibilité accrue à ses documents, notamment à ses publications électroniques ou à ses fonds spécialisés. Réciproquement, en tant que fournisseur de services, une bibliothèque peut réaliser une base de données ou un portail documentaire dans son domaine de spécialité ou sur un thème quelconque. Elle doit alors collecter les données descriptives de ressources et documents de tout type, accessibles sur Internet dans des entrepôts OAI. Les bibliothèques peuvent donc valoriser leur collection numérique sans nécessiter un lourd investissement. Enfin, ce protocole permet de faire communiquer entre elles des bases de données diverses et hétérogènes et donc de réaliser des partenariats entre plusieurs établissements qui rapprochent leurs collections (complémentarité des fonds) ou leurs publics (services culturels d'une même collectivité).

Aucun commentaire:

Enregistrer un commentaire