lundi 27 février 2012

UNIMARC

DUBLIN CORE


Définition

Le Dublin Core est un format de métadonnées générique simple qui permet de décrire des ressources numériques ou physiques. Il comprend officiellement 15 éléments de description.


Historique

Pourquoi le Dublin Core ?

Dans les années 90, la démarche qui consistait à établir « ex nihilo » des notices décrivant des documents électroniques et à les relier aux documents primaires soulevait des critiques parce qu'elle restait fidèle à la tradition du catalogage classique et impliquait un certain conservatisme. En effet, à cette époque les moteurs de recherche Internet établissaient déjà des index de documents de tous genres et on se demandait pourquoi on devait continuer à établir et à maintenir des catalogues bibliographiques informatisé coûteux.
Le projet était né : extraire à partir des documents électroniques de nouveaux points d'accès contrôlés que l'on pourrait intégrer automatiquement aux catalogues informatisés.

En mars 1995, des chercheurs de OCLC (Online Computer Library Center) et du NCSA (National Center for Supercomputing Applications) et cinquante deux spécialistes des bibliothèques, de l'informatique et du codage des textes se sont réunis au siège de l'OCLC à Dublin dans l'Ohio fondant ainsi la DCMI : Dublin Core Metadata Initiative. Leur objectif est dès le départ de définir des enregistrements décrivant  tous les types de ressources électroniques conservés en réseau, c'est à dire de mettre au point un système de données décrivant d'autres donnés. C'est ainsi que le format Dublin Core a été l'un des premiers systèmes de métadonnées au monde.

Le format Dublin Core a été normalisé en 2003. Il devenu la norme ISO 15836.



I . Les 15 éléments du Dublin Core

Le format Dublin Core ou norme ISO 15836 comprend 15 éléments qui sont répartis en 3 groupes :
-Contenu
-Propriété intellectuelle
-Instanciation ou version du document        


1. Le contenu

Title = Titre :
Comme en catalogage plus traditionnel, toute ressource doit avoir un nom.

Subject = Sujet :
Ce sont les mots-clefs ou le code de classement qui permettent de cerner le sujet du document.

Description : 
Il s'agit d'un compte rendu du contenu de la ressource : un résumé, une table des matières ou une description en texte libre

Type :
C'est la nature ou le genre de contenu de la ressource : Texte, image, etc.

Source :
C'est la référence d'origine du document. Par exemple la référence du document papier, pour un document numérique. C'est citer la ressource d’où vient le document. 

Relation :
Aussi appelés « raffinements » : ce sont les autres versions du document, ses autres formats.

Coverage = Couverture :
couverture spatio-temporelle ou juridictionnelle du contenu de la ressource. Cet élément permet de d'indexer la ressource dans une acceptation plus large que par l'élément 'sujet'. Exemple : France - - Ancien Régime
Cet élément est peu utilisé en France.


2. La propriété intellectuelle

Creator = Créateur :
Il s'agit du responsable physique ou moral de la création du contenu de la ressource

Publisher = Editeur :
C'est le nom de la personne ou de l’organisme à  l’origine de la publication du document

Contributor = Contributeur ou collaborateur :
C'est l'auteur physique ou moral secondaire entité du contenu de la ressource.  

Rights = Droits :
Ce sont les droits attachés à la ressource. Parfois, il y a une absence d'information dans cet éléments. Mais cette absence d'information ne signifie pas que le document est libre de droits. Il faut donc se renseigner.


3. Instanciation ou version du document

Date :
date de création de document ou d’un événement important dans la vie de celui-ci. Il est recommandé d'utiliser la norme ISO 8601 et d'encoder la date sous la forme AAAA-MM-JJ.

Format :
Il s'agit d'indiquer le support du document : physique ou numérique.

Identifier = Identifiant : il est recommander d’utiliser les ISBN des documents ou les adresses URL des sites web.

Language = Langage : langue du contenu de la ressource. Il est ici recommandé d'utilisé la norme ISO 639.


4. Aspect syntaxique : encodage XML

Nous abordons maintenant l'aspect syntaxique du dublin core : c'est à dire la façon d' « écrire » ces éléments dont nous venons de parler. En 1996, il était prévu de les encoder en SGML. Mais le choix s'est reporté rapidement sur XML en 1998.

< ?xmlversion= « 1.0 » ?>
<rdf : RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
   xmlns:dc="http://purl.org/dc/elements/1.1/">
     <rdf:Description >
      <dc:creator>Karl Musterman</dc:creator>
      <dc:title>Algebra</dc:title>
      <dc:subject>mathematics</dc:subject>
      <dc:date>2000-01-23</dc:date>
      <dc:language>EN</dc:langage>
      <dc:description>An introduction to algebra</dc:description>
       </rdf:Description>
</rdf:RDF>


II. Utilisation du format Dublin Core en bibliothèque

En France, assez peu de bibliothèques utilisent le Dublin Core. Mais parmi les principales on peut citer :

-La BnF
Le Dublin Core y est utilisé pour gérer et cataloguer les « signets » et pour accroître sur Internet la visibilité des catalogues et des collections numérisées.
Il ne se substitue pas aux autres formats bibliographiques des bibliothèques et des archives (Intermarc, EAD…), mais permet à d’autres acteurs qui utilisent d’autres formats (musées, archives, centres de ressources de l’information scientifique et technique, ou opérateurs d’agrégation de contenus culturels comme The European Library) de référencer les données de la BnF dans un format simple et facilement interopérables.
Les notices en Dublin Core sont également utilisées, à la BnF, pour gérer la collection de documents numérisés dans Gallica. Ce format permet également de signaler dans Gallica les collections d’autres institutions patrimoniales.
Les notices en Dublin Core des deux entrepôts OAI ne sont pas créées manuellement, mais dérivées de notices ou de bases de données existantes. Les données ne sont donc pas nativement formatées en Dublin Core.

-Europeana

-La CNAM : bibliothèque numérique du Conservatoire National des Arts et Métiers :
Les notices MARC sont converties en Dublin Core.

- Le Service Commun de Documentation de l'Université François Rabelais de Tours


 Exemples

-Gallica



IV. Forces et faiblesses


1. Forces :

-Les éléments de base du Dublin Core répondent à des critères de simplicité et de concision. Ainsi, tous les types de créateurs peuvent les utiliser, du bibliothécaire professionnel jusqu’aux non-initiés.

-L’identification des champs est conçue à partir d’une sémantique interdisciplinaire. Par exemple, dans la catégorie de la propriété intellectuelle, on privilégie le terme « créateur », ce qui permet de faire autant allusion à un auteur de texte qu’à un photographe ou un illustrateur.

-Son envergure est internationale grâce à ses nombreux représentants qui s’impliquent sur presque tous les continents. Il existe au moins une vingtaine de versions linguistiques du Dublin Core à ce jour.

-C'est un langage qui permet de traiter presque tous les formats de documents.

2. Faiblesses :                             

On peut alors penser que le format Dublin Core représente l’avenir : la possibilité d’établir des index construits à partir d’éléments de description sans intervention humaine. Mais il a des faiblesses non-négligeables qu’il faut prendre en compte : en effet, les métadonnées du Dublin Core n’avaient pas pour objectif initial de remplacer les notices Unimac.
Le comité Commitee on Cataloging : Description and Access de l’américan library Association l’avait déjà reconnu en 1998 :
-Les métadonnées ne sont pas un substituts au catalogage, mais peuvent être des sources d’informations utiles pour les catalogueur.
-En effet les métadonnées ne suffisent pas pour distinguer une ressource d’autres ressources similaires ou différentes version de la même ressource.
-Les métadonnées ne peuvent pas être incluses directement dans les catalogues de bibliothèques, car leur sématique est insuffisante et leurs données ne font pas référence à des fichers d’autorité ou à des vocabulaires matières contrôlés.

-Les variétés de ressources couvertes par le Dublin Core répondent surtout aux besoins des bibliothèques, musées, sites gouvernementaux et autres organismes semblables. Il y a peu de  possibilités pour les autres types de données. Dans certains domaines, il faut absolument avoir recours à des champs supplémentaires pour décrire les documents avec un minimum de précision.
-Le Dublin Core se consacre uniquement au repérage des ressources. Il ne permet pas d’en faire la gestion ou d’en restreindre l’accès.

Certaines grandes institutions comme L’OCLC ou la Bibliothèque du Congrès, on tenté de trouver une parade à ces faiblesses du Dublin Core. Elle ont pu investir à la fois dans des métadonnées et dans le catalogue conventionnel. En 2001, la bibliothèque du Congrès a développé deux passerelles permettant de convertir des données de Dublin Core en Données Marc et inversement. Cette démontrastion a pu relativiser le fossé entre les deux approches et a pu montrer que le format Marc peut s’exprimer sans perte dans Dublin Core par le moyen d’extensions.
Malgré cela, certains estiment en 2004, que le format Dublin Core est dépassé.


Conclusion

Ce que l’on peut retenir de cette présentation est que le Format Dublin Core est format établissant cataloguant et indexant des données à partir de données du web grâce à ses 15 éléments de description. C’est un format simple a utiliser mais pas assez précis dans la description des documents.
 En 2004, La bibliothèque du congrès travaillait sur une nouvelle structure de métadonnées : MODS (Metadata Object Description Schema). MODS est un sous-ensemble du Marc 21 exprimé en XML. Dans ce format, certaines information sont regroupées au sein d’un même champ, mais ne sont pas simplifiés comme dans le Dublin Core.







Sources


-          http://bibliodoc.francophonie.org/article.php3?id_article=177

-          http://fr.wikipedia.org/wiki/Dublin_Core

-          Alain Jacquesson, Alexis Rivier, Bibliothèques et documents numériques : concepts, composantes, techniques et enjeux, nouv. éd. Ed Du Cercle de la librairie, 2005.

-          http://www.bnf.fr/fr/professionnels/formats_catalogage/a.f_dublin_core.html

F.R.B.R.


Les Spécifications fonctionnelles des notices bibliographiques (en anglais Functional Requirements for Bibliographic Records, FRBR) sont une modélisation conceptuelle des informations contenues dans les notices bibliographiques des bibliothèques. Elles ont été développées par un groupe d'experts de l'IFLA (« La Fédération internationale des associations de bibliothécaires et d'institutions est le principal organisme international représentant les intérêts des bibliothèques et services d'information et leurs utilisateurs. Il est la voix mondiale de la profession de bibliothécaire et de l'information. ») de 1991 à 1997, et approuvées en 1997 par le Comité permanent de la Section de catalogage de l’IFLA et publiées en 1998.


I.         Description


      Le modèle FRBR n'est pas une norme de notice bibliographique, comme les normes ISBD ou Unimarc, mais décrivent les informations d'une notice bibliographique d'un point de vue logique en utilisant le modèle entité-association. C'est un concept qui s'intéressent aux informations contenus dans les notices bibliographiques et fait entrer en relation les attentes et les besoins des différentes catégories des utilisateurs des catalogues, en intégrant les nouveaux formats de publication comme les documents électronique.
Le modèle FRBR a été défini pour donner sous une forme simple, précise et dans un langage compris par tous les notions principales sur laquelle doit s’appuyer la notice bibliographique et les renseignements attendus par les utilisateurs. Il est conçu comme un outil pour l'établissement de futures normes bibliographiques tout en fournissant des recommandations sur le niveau minimal de fonctionnalité et de spécification de données d'une notice bibliographique nationale. Il peut donc  être utilisé pour la description bibliographique de tous types de supports.


II.        Fonctionnement

      Le modèle FRBR explique la structure des catalogues en analysant les données bibliographiques qui sont alors regroupées en entités, qui sont elle-même divisées en attributs. Puis il établit les relations entre les entités et les corrélations entre les attributs. Il s’appuie sur les besoins des utilisateurs et en dégage donc les principales entités demandées, les attributs de ces entités et les relations entre ces entités. Celles-ci sont souvent présentes également dans les normes ISBD ou Unimarc.  .

            Ils organisent les différentes composantes de la description bibliographique (les autorités, les accès sujet et les informations sur le document proprement dites) en trois groupes d'entités reliées entre elles. 

      Le premier groupe se compose de quatre entités, les deux premières se basent sur l'aspect intellectuel du contenu et les deux dernières se reportent à l'enregistrement matériel du contenu.
      Œuvre (est prise comme une notion abstraite. Elle est l'équivalent de la notice d'autorité de titre uniforme dans les catalogues actuels) : par exemple,  Primo Levi, Si c’est un homme
   
            Expression (est une réalisation de cette création intellectuelle. Il n'existe pas d'équivalent dans les catalogues actuels) : par exemple, la traduction anglaise de Si c’est un homme, If This Be A Man, par Roger Pearson.

        Manifestation : (est la matérialisation d'une expression, il s'agit ici de l'objet éditorial) : par exemple, Si c’est un homme de Primo Levi, traduit par Roger Pearson, se manifeste par sa publication chez Penguin Books en 2004)
   
            Exemplaire Document : un exemplaire isolé d'une manifestation, en principe, les différents exemplaires d'une manifestation ressembles, mais chacun comporte des particularités le distinguant des autres (sa cote, ou un manque de page pour les livres anciens.) Par exemple, l'exemplaire de Si c’est un homme de Primo Levi, traduit par Roger Pearson, publié chez Penguin Books en 2004, se trouve à la bibliothèque municipale de Perpignan. Cet exemplaire se distingue de celui conservé à la BnF.

            Le second groupe d'entités correspond à la modélisation des personnes physiques ou morales qui ont une responsabilité dans le contenu intellectuel ou artistique, la production matérielle et la distribution, ou la gestion juridique des entités du premier groupe. Il y en a deux sortes : les personnes, et les collectivités.
Exemple : Tolkien, J. R. R. a créé l'œuvre The lord of the rings ; Ledoux, Francis en a traduit l'expression en français Le seigneur des anneaux ; C. Bourgois a publié en 1986 une manifestation de cette expression ; la BnF possède un exemplaire de cette manifestation sous la cote -Y2-95376.





Entités du groupe 1
Entités du groupe 2
relations


      Le troisième groupe regroupe des entités qui sont le sujet des œuvres : concept, objet, événement. La relation de sujet (par exemple, un événement est sujet d'une œuvre) peut aussi fonctionner avec le groupe 2 (une personne est sujet d'une œuvre, dans le cas d'un livre sur Zola) et le groupe 1 (une œuvre est sujet d'une autre œuvre, dans le cas d'un livre sur Germinal de Zola).

            Les entités des groupes 2 et 3 ont fait l’objet d’une description spécifique appelée FRAD (Spécifications fonctionnelles des données d’autorité)
Les entités ont des attributs. Les attributs des entités se répartissent en deux grandes catégories : les attributs inhérents à l'entité et les attributs forgés, extérieurs à l'entité. Ces attributs, tels que titre, forme, date, etc., correspondent aux informations qui apparaissent communément dans les notices bibliographiques des catalogues de bibliothèques. Les premiers sont des éléments distinctifs de l'entité, tandis que les seconds proviennent d'une source extérieure, comme les identifiants ou des informations contextuelles.

Œuvre : titre de l’œuvre, forme de l’œuvre, date de l’œuvre, …

Expression : titre de l’expression, forme de l’expression, date de l’expression, …

Manifestation : titre de la manifestation, mention de responsabilité, mention d’édition/numéro, lieu d’édition/diffusion, …
Document : identifiant du document, provenance du document, annotations/inscriptions, participation à des expositions, …

III.      Qualités et défauts

          Selon le site de la Bibliothèque nationale de France, ce modèle apporte donc une
consolidation des acquis du passé en justifiant a posteriori les pratiques de catalogage.
La grande originalité du modèle réside dans la notion d'œuvre, qui permet de rapprocher par exemple un roman et ses traductions ou adaptations. Ce rapprochement reste le plus souvent implicite dans les catalogues de bibliothèques.
          L’évolution vers le FRBR peut se faire selon deux grandes orientations :
- Transformer les SIGB actuels pour y ajouter la notion d’œuvre. Puis répercuter cette modification dans les interfaces de consultation des catalogues : on pourrait parler de « FRBRisation » des notices bibliographiques. L’œuvre devient un simple enrichissement de la manifestation.
- Réécrire de nouvelles applications en adoptant une modélisation FRBR de la base de données et en mettant en œuvre les recommandations du RDA pour la codification des données. L’œuvre devient le cœur du processus descriptif.
          Proposer à l’utilisateur une interface spécifique dans laquelle l’œuvre est au centre de
 la description intellectuelle des expressions et manifestations dérivées.
          Il factorise les informations communes à plusieurs ressources et réduit, en les
organisant, le nombre de réponses à certaines requêtes (exemple Worldcat, ne donne pas toutes les notices des différents exemplaires)
          Il est compatible avec Internet et peut être utilisé avec le web sémantique
          Plus orienté pour la description d’œuvres de fiction que pour d’autres types d’œuvres.




IV.      Utilisateur :

          Worldcat utilise le FRBR. Il recoupe les différentes notices de plusieurs bibliothèques et propose différentes expressions d’une même œuvre. Il aborde de nombreuses manifestations et enfin différents exemplaires pour la localisation.


            Glossaire:

FRAD : Spécifications fonctionnelles des données d’autorité

FRBR : Functional Requirements for Bibliographic Records ou Spécifications fonctionnelles des notices bibliographiques.

IFLA : International Federation of Library Associations (and Institutions) ou Fédération internationale des associations de bibliothécaires et d'institutions.

ISBD : International Standard Bibliographic Description ou Description Bibliographique Internationale Normalisée.

RDA : Resource Description and Access ou Ressources : Description et Accès


            Sources :



Association des bibliothécaires de France. Le Métier de bibliothécaire, Éditions du Cercle de la Librairie, 2010

Les points d'accès à l'information


Définition d'un point d'accès à l'information

C'est un terme choisi pour représenter dans un index un élément ou une notion contenue dans un document. On distingue plusieurs points d'accès :
point d'accès matière : il représente le sujet ou l'un des sujets d'un document, on dit que c'est la vedette matière
point d'accès subordonné : il est associé à un autre point d'accès pour indiquer qu'il lui est subordonné ou qu'il le modifie. On dit que c'est une sous-vedette
point d'accès auteur

Accès auteur

Lorsque l'on catalogue un document on fait un accès auteur c'est-à-dire qu'on donne la possibilité de faire une recherche par le nom et prénom de l'auteur. On peut aussi faire un accès aux collectivités. Dans le cadre des œuvres audiovisuelles les auteurs et interprètes ne sont pas noté comme auteur principale mais comme auteur secondaire. On a une autre exception dans le cas des congrès, les congrès son indexés en vedette principale auteur collectivité avec le catalogue de l'imprimé. On note toujours les dates de naissance et de décès de l'auteur pour avoir des informations sur lui, on note aussi sa fonction il peut arriver que deux personnes ayant le même nom de famille contribuent à la création de roman. C'est avec les dates et leur fonction qu'on les distingue comme par exemple pour Alexandre Dumas père et le fils qui sont tous les deux auteurs, on les distingue par leurs dates de naissance et de mort.
On ne peut pas mettre tous les auteurs au même rang, ils ne font pas tous la même chose par exemple en ce qui concerne les traducteurs, les illustrateurs. On fait donc des vedettes secondaires qui sont retranscris dans la zone du titre en mention de responsabilité ou dans la zone des notes sur des mentions de responsabilité.



Accès sujet

On indexe les documents afin de donner le sujet de celui-ci, permet de retrouver dans un catalogue les documents traitant du même sujet quel que soit le support. Dans les bibliothèques on utilise principalement RAMEAU.

            RAMEAU

Le répertoire d'autorité-matière encyclopédique et alphabétique unifié ou RAMEAU est un répertoire qui contient une liste d'autorité matière. C'est un langage documentaire. Il est notamment utilisé par la BnF, les bibliothèques universitaires ainsi que les autres bibliothèques. Il est géré par le Centre national RAMEAU.

            Dewey

La classification décimale Dewey est un système de classification numérique couvrant tout les champs de la connaissance. Elle est mise à jour régulièrement par le  Decimal Classification Editorial Policy Committee. Elle permet une recherche par indice ou par libellé d'indice dans le catalogue de la BnF.

            Thésaurus

C'est un outils qui rend la recherche documentaire plus efficace. C'est une liste de termes organisée, ces termes ont un lien ou plusieurs avec des domaines de la connaissance. On appel les termes des descripteurs. Le thésaurus utilise des termes précis pour définir le contenu des documents sans ambiguïté possible. Le vocabulaire est donc limité et régi par des relations de parenté entre les termes (descripteur générique, spécifique, associé).

Pour les cartographies on a mis en place des sujet géographiques ce qui permet de rechercher en fonction du pays que l'on cherche.

On peut prendre en exemple pour les recherches par sujet le catalogue de la Bibliothèque Nationale Française, seulement on ne peut rechercher par sujet que les documents acquis après 1980 ce qui exclut une grande partie des collections patrimoniales.

Sources

http://www.bnf.fr/fr/professionnels/anx_catalogage_indexation/a.referentiels_sujet.html
http://www.adbs.fr/point-d-acces-18168.htm?RH=OUTILS_VOC
http://www.bnf.fr/fr/professionnels/anx_catalogage_indexation/a.acces_sujet.html
http://guideducatalogueur.bnf.fr/ABN/GPC.nsf/D52F45483626CC42C12571810044FE94/$FILE/EXTIA%20DL%20acc%C3%A8s%20auteurs.htm?OpenElement