lundi 27 février 2012

DUBLIN CORE


Définition

Le Dublin Core est un format de métadonnées générique simple qui permet de décrire des ressources numériques ou physiques. Il comprend officiellement 15 éléments de description.


Historique

Pourquoi le Dublin Core ?

Dans les années 90, la démarche qui consistait à établir « ex nihilo » des notices décrivant des documents électroniques et à les relier aux documents primaires soulevait des critiques parce qu'elle restait fidèle à la tradition du catalogage classique et impliquait un certain conservatisme. En effet, à cette époque les moteurs de recherche Internet établissaient déjà des index de documents de tous genres et on se demandait pourquoi on devait continuer à établir et à maintenir des catalogues bibliographiques informatisé coûteux.
Le projet était né : extraire à partir des documents électroniques de nouveaux points d'accès contrôlés que l'on pourrait intégrer automatiquement aux catalogues informatisés.

En mars 1995, des chercheurs de OCLC (Online Computer Library Center) et du NCSA (National Center for Supercomputing Applications) et cinquante deux spécialistes des bibliothèques, de l'informatique et du codage des textes se sont réunis au siège de l'OCLC à Dublin dans l'Ohio fondant ainsi la DCMI : Dublin Core Metadata Initiative. Leur objectif est dès le départ de définir des enregistrements décrivant  tous les types de ressources électroniques conservés en réseau, c'est à dire de mettre au point un système de données décrivant d'autres donnés. C'est ainsi que le format Dublin Core a été l'un des premiers systèmes de métadonnées au monde.

Le format Dublin Core a été normalisé en 2003. Il devenu la norme ISO 15836.



I . Les 15 éléments du Dublin Core

Le format Dublin Core ou norme ISO 15836 comprend 15 éléments qui sont répartis en 3 groupes :
-Contenu
-Propriété intellectuelle
-Instanciation ou version du document        


1. Le contenu

Title = Titre :
Comme en catalogage plus traditionnel, toute ressource doit avoir un nom.

Subject = Sujet :
Ce sont les mots-clefs ou le code de classement qui permettent de cerner le sujet du document.

Description : 
Il s'agit d'un compte rendu du contenu de la ressource : un résumé, une table des matières ou une description en texte libre

Type :
C'est la nature ou le genre de contenu de la ressource : Texte, image, etc.

Source :
C'est la référence d'origine du document. Par exemple la référence du document papier, pour un document numérique. C'est citer la ressource d’où vient le document. 

Relation :
Aussi appelés « raffinements » : ce sont les autres versions du document, ses autres formats.

Coverage = Couverture :
couverture spatio-temporelle ou juridictionnelle du contenu de la ressource. Cet élément permet de d'indexer la ressource dans une acceptation plus large que par l'élément 'sujet'. Exemple : France - - Ancien Régime
Cet élément est peu utilisé en France.


2. La propriété intellectuelle

Creator = Créateur :
Il s'agit du responsable physique ou moral de la création du contenu de la ressource

Publisher = Editeur :
C'est le nom de la personne ou de l’organisme à  l’origine de la publication du document

Contributor = Contributeur ou collaborateur :
C'est l'auteur physique ou moral secondaire entité du contenu de la ressource.  

Rights = Droits :
Ce sont les droits attachés à la ressource. Parfois, il y a une absence d'information dans cet éléments. Mais cette absence d'information ne signifie pas que le document est libre de droits. Il faut donc se renseigner.


3. Instanciation ou version du document

Date :
date de création de document ou d’un événement important dans la vie de celui-ci. Il est recommandé d'utiliser la norme ISO 8601 et d'encoder la date sous la forme AAAA-MM-JJ.

Format :
Il s'agit d'indiquer le support du document : physique ou numérique.

Identifier = Identifiant : il est recommander d’utiliser les ISBN des documents ou les adresses URL des sites web.

Language = Langage : langue du contenu de la ressource. Il est ici recommandé d'utilisé la norme ISO 639.


4. Aspect syntaxique : encodage XML

Nous abordons maintenant l'aspect syntaxique du dublin core : c'est à dire la façon d' « écrire » ces éléments dont nous venons de parler. En 1996, il était prévu de les encoder en SGML. Mais le choix s'est reporté rapidement sur XML en 1998.

< ?xmlversion= « 1.0 » ?>
<rdf : RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
   xmlns:dc="http://purl.org/dc/elements/1.1/">
     <rdf:Description >
      <dc:creator>Karl Musterman</dc:creator>
      <dc:title>Algebra</dc:title>
      <dc:subject>mathematics</dc:subject>
      <dc:date>2000-01-23</dc:date>
      <dc:language>EN</dc:langage>
      <dc:description>An introduction to algebra</dc:description>
       </rdf:Description>
</rdf:RDF>


II. Utilisation du format Dublin Core en bibliothèque

En France, assez peu de bibliothèques utilisent le Dublin Core. Mais parmi les principales on peut citer :

-La BnF
Le Dublin Core y est utilisé pour gérer et cataloguer les « signets » et pour accroître sur Internet la visibilité des catalogues et des collections numérisées.
Il ne se substitue pas aux autres formats bibliographiques des bibliothèques et des archives (Intermarc, EAD…), mais permet à d’autres acteurs qui utilisent d’autres formats (musées, archives, centres de ressources de l’information scientifique et technique, ou opérateurs d’agrégation de contenus culturels comme The European Library) de référencer les données de la BnF dans un format simple et facilement interopérables.
Les notices en Dublin Core sont également utilisées, à la BnF, pour gérer la collection de documents numérisés dans Gallica. Ce format permet également de signaler dans Gallica les collections d’autres institutions patrimoniales.
Les notices en Dublin Core des deux entrepôts OAI ne sont pas créées manuellement, mais dérivées de notices ou de bases de données existantes. Les données ne sont donc pas nativement formatées en Dublin Core.

-Europeana

-La CNAM : bibliothèque numérique du Conservatoire National des Arts et Métiers :
Les notices MARC sont converties en Dublin Core.

- Le Service Commun de Documentation de l'Université François Rabelais de Tours


 Exemples

-Gallica



IV. Forces et faiblesses


1. Forces :

-Les éléments de base du Dublin Core répondent à des critères de simplicité et de concision. Ainsi, tous les types de créateurs peuvent les utiliser, du bibliothécaire professionnel jusqu’aux non-initiés.

-L’identification des champs est conçue à partir d’une sémantique interdisciplinaire. Par exemple, dans la catégorie de la propriété intellectuelle, on privilégie le terme « créateur », ce qui permet de faire autant allusion à un auteur de texte qu’à un photographe ou un illustrateur.

-Son envergure est internationale grâce à ses nombreux représentants qui s’impliquent sur presque tous les continents. Il existe au moins une vingtaine de versions linguistiques du Dublin Core à ce jour.

-C'est un langage qui permet de traiter presque tous les formats de documents.

2. Faiblesses :                             

On peut alors penser que le format Dublin Core représente l’avenir : la possibilité d’établir des index construits à partir d’éléments de description sans intervention humaine. Mais il a des faiblesses non-négligeables qu’il faut prendre en compte : en effet, les métadonnées du Dublin Core n’avaient pas pour objectif initial de remplacer les notices Unimac.
Le comité Commitee on Cataloging : Description and Access de l’américan library Association l’avait déjà reconnu en 1998 :
-Les métadonnées ne sont pas un substituts au catalogage, mais peuvent être des sources d’informations utiles pour les catalogueur.
-En effet les métadonnées ne suffisent pas pour distinguer une ressource d’autres ressources similaires ou différentes version de la même ressource.
-Les métadonnées ne peuvent pas être incluses directement dans les catalogues de bibliothèques, car leur sématique est insuffisante et leurs données ne font pas référence à des fichers d’autorité ou à des vocabulaires matières contrôlés.

-Les variétés de ressources couvertes par le Dublin Core répondent surtout aux besoins des bibliothèques, musées, sites gouvernementaux et autres organismes semblables. Il y a peu de  possibilités pour les autres types de données. Dans certains domaines, il faut absolument avoir recours à des champs supplémentaires pour décrire les documents avec un minimum de précision.
-Le Dublin Core se consacre uniquement au repérage des ressources. Il ne permet pas d’en faire la gestion ou d’en restreindre l’accès.

Certaines grandes institutions comme L’OCLC ou la Bibliothèque du Congrès, on tenté de trouver une parade à ces faiblesses du Dublin Core. Elle ont pu investir à la fois dans des métadonnées et dans le catalogue conventionnel. En 2001, la bibliothèque du Congrès a développé deux passerelles permettant de convertir des données de Dublin Core en Données Marc et inversement. Cette démontrastion a pu relativiser le fossé entre les deux approches et a pu montrer que le format Marc peut s’exprimer sans perte dans Dublin Core par le moyen d’extensions.
Malgré cela, certains estiment en 2004, que le format Dublin Core est dépassé.


Conclusion

Ce que l’on peut retenir de cette présentation est que le Format Dublin Core est format établissant cataloguant et indexant des données à partir de données du web grâce à ses 15 éléments de description. C’est un format simple a utiliser mais pas assez précis dans la description des documents.
 En 2004, La bibliothèque du congrès travaillait sur une nouvelle structure de métadonnées : MODS (Metadata Object Description Schema). MODS est un sous-ensemble du Marc 21 exprimé en XML. Dans ce format, certaines information sont regroupées au sein d’un même champ, mais ne sont pas simplifiés comme dans le Dublin Core.







Sources


-          http://bibliodoc.francophonie.org/article.php3?id_article=177

-          http://fr.wikipedia.org/wiki/Dublin_Core

-          Alain Jacquesson, Alexis Rivier, Bibliothèques et documents numériques : concepts, composantes, techniques et enjeux, nouv. éd. Ed Du Cercle de la librairie, 2005.

-          http://www.bnf.fr/fr/professionnels/formats_catalogage/a.f_dublin_core.html

Aucun commentaire:

Enregistrer un commentaire