lundi 2 avril 2012

CLASSIFICATIONS


Introduction :


Une classification est un système organisé et hiérarchisé de catégorisation d'« objets ». Suivant les objets considérés, différents systèmes de classification ont été conçus pour répondre à leurs besoins.

Les classifications sont utilisées dans tous domaines d'activités humaines (biologie, médecine, astronomie, chimie, minéralogie, socio-économie, finance, bibliothèques et archives, web sémantique etc.).

Les classifications portant sur un domaine déterminé sont généralement bien suivies par les spécialistes du domaine, aussi les classifications à vocation universelle sont l'objet de nombreuses critiques. Elles apportent cependant un éclairage sur la nature de la connaissance.

Les classifications sont nécessaires à l'organisation des connaissances et au travail des agents d'un service. Classer les objets ou les connaissances, c'est aussi dire comment ils/elles se situent les un(e)s par rapport aux autres. Plusieurs points de vue complémentaires peuvent être considérés.

I/ Classification Décimale de Dewey (CDD).


Historique et fonctionnement :


Créée en 1876 par Melvil Dewey, la classification décimale de Dewey (CDD) est un système visant à classer l'ensemble du savoir humain à l'intérieur d'une bibliothèque.

La CDD est un système de répartition pluridisciplinaire à vocation universelle visant à distribuer par classes, par catégories et par indices l'ensemble du savoir humain à l'intérieur d'une bibliothèque (livres, périodiques, encyclopédies). Pour cela, M. Dewey a retenu dix classes correspondant aux neuf disciplines fondamentales (Langues, Sciences pures, Techniques, Littératures, Philosophie, Religion, Sciences sociales, Beaux-arts et loisirs, Géographie et Histoire) et à une classe « Généralités ».

Cependant, la CDD possède une lacune. En effet, elle a été créée dans un contexte historique spécifique et propre aux États-Unis (fin du XIXe siècle) et est donc d'influence anglo-américaine. Aussi, avec sa diffusion dans le monde, l'évolution de l'Histoire et des connaissances elle a connu de nombreuses améliorations.

Elle a ainsi été complétée et perfectionnée par la classification décimale universelle (CDU) développée par Henri La Fontaine et Paul Otlet dont nous parlerons plus tard.

Principe :


La CDD répartit les ouvrages dans les dix classes suivantes :

000 - Informatique, information, ouvrages généraux
100 - Philosophie, Parapsychologie et Occultisme, Psychologie
200 - Religion
300 - Sciences sociales
400 - Langues
500 - Sciences de la nature et Mathématiques
600 - Technologie (Sciences appliquées)
700 - Arts. Beaux-arts et arts décoratifs. Loisirs et Sports
800 - Littérature (Belles-Lettres) et techniques d'écriture
900 - Géographie, Histoire et disciplines auxiliaires

Chaque classe est ensuite elle-même divisée en dix divisions puis chaque division en dix subdivisions et ainsi de suite. Ce classement est ensuite complété de 6 Tables auxiliaires de subdivisions.

Table 1 - Subdivisions communes.
Table 2 - Subdivisions géographiques.
Table 3 - Subdivisions pour les arts, les littératures, les genres littéraires.
Table 3A - Subdivisions pour les ouvrages par ou sur un seul auteur.
Table 3B - Subdivisions pour les œuvres par ou sur plusieurs auteurs.
Table 3C - Notations qui s'ajoutent sur indication dans la Table 3B.
Table 4 - Subdivisions des langues et des familles de langues.
Table 6 – Langues.

Aucun indice ne peut avoir moins de 3 chiffres. Celui de gauche doit correspondre à la classe, celui du milieu à la division et celui de droite à la subdivision.
Ex : pour un magazine sur l'élevage des chats.
Le sujet: Élevage des chats.
Type de document : Magazine.
600 : Technologie (Sciences appliquées)
630 : Agronomie, agriculture et techniques connexes
636 : Élevage.
636.8 : Chats.
-05 : Subdivisions communes de la Table 1 pour les publications en série.
è Le produit final sera donc 636.800 5.

Pour les indices dépassant 3 chiffres, un point doit séparer les trois premiers des suivants (ex : 636.800 5 pour un magazine sur l'élevage des chats). Si l'indice dépasse 6 chiffres, on laisse un espace entre le 6ème et le 7ème chiffre : 944.081 6 (l'Histoire de France de 1939 à 1945). Il est à noter que plus l'indice se rapproche du sujet et plus il sera long.

Dans ce cas, sur la cote on peut répartir l'indice sur plusieurs lignes, ce qui permet une meilleure lisibilité. De même, l'indice peut être suivi des premières lettres du nom de l'auteur.

Utilisations :


La classification décimale de Dewey est utilisée dans de nombreuses bibliothèques pour gérer les fonds documentaires. Une version simplifiée pour les bibliothèques des écoles primaires (BCD) et les Centres de Documentation et d'Information (CDI) des collèges et lycées a également été conçue et facilite la recherche par l'utilisation d'une Marguerite de couleurs. Car le gros défaut que l'on peut retenir pour la Dewey c'est qu'elle est très peu lisible par l'usager lambda des bibliothèques.

II/ Classification Décimale Universelle (CDU).


Historique et fonctionnement :

La CDU est un système de classification en bibliothèque développé par deux juristes belges à l'origine de la fondation en 1895 de l'Institut International de Bibliographie : Paul Otlet et Henri La Fontaine.

La CDU se basant sur la classification décimale Dewey (CDD), il est à savoir que les deux hommes ont obtenu l'autorisation de Melvil Dewey pour la développer.

Principe :


Tout comme la classification décimale de Dewey dont elle s'inspire, la CDU répartit les connaissances humaines en neuf catégories notées de 1 à 9, resservant le 0 aux généralités. Chaque catégorie est elle-même divisée en dix parties  mais toutes les classes et sous-classes ne sont pas utilisées ce qui lui permet d'évoluer.

Classe 0 - Sciences et connaissance. Organisation. Informatique. Information. Documentation. Bibliothéconomie. Institutions. Publications.
Classe 1 - Philosophie et psychologie.
Classe 2 - Religion. Théologie.
Classe 3 - Sciences sociales. Statistique. Économie. Commerce. Droit. Gouvernement. Affaires militaires. Assistance sociale. Assurances. Éducation. Folklore.
Classe 4 - Inoccupée.
Classe 5 - Mathématiques. Sciences exactes et naturelles.
Classe 6 - Sciences appliquées. Médecine. Technologie.
Classe 7 - Arts. Divertissements. Sports.
Classe 8 - Langue. Linguistique. Littérature.
Classe 9 - Géographie. Biographie. Histoire.

Un zéro terminant un indice indique toujours qu'il s'agit de généralités, par exemple 540 signifie « généralités dans le domaine de la chimie ».

Il faut se rappeler que ces indices sont en fait des nombres décimaux, dont on a enlevé le 0. Ainsi, 541 doit être classé avant 61 (un peu de la même façon que pour le plan de parties d'un texte classé dans un sommaire. Ainsi un sous-titre numéroté 5.4.1 vient avant un titre numéroté 6.1).

Utilisation :


Destinée à l'origine à établir une bibliographie universelle exhaustive, la CDU permet la réalisation d'indices très complexes bien qu'ils aient tendance à se simplifier. La pratique a en effet montré que ce qui était à l'origine une volonté de précision ne facilitait pas la recherche documentaire et rendait la classification décimale universelle très difficile à maintenir.

Depuis 1905, plusieurs éditions de la CDU ont été publiées et elle a été traduite en 40 langues à travers le monde.

La CDU complète n'est disponible que sous forme informatisée auprès de l'UDC Consortium c'est le Master Reference File (MRF). Il existe deux versions francophones ayant pour but de proposer une CDU plus compacte et plus utilisable : une « moyenne » (3 volumes) et une « abrégée » (1 volume). Les éditions du Céfal (Liège, Belgique) possèdent le monopole de l'édition de la CDU en français.

En France, la classification décimale universelle est utilisée dans la plupart des bibliothèques universitaires mais régresse depuis quelques années au profit de la classification décimale de Dewey. Sa version simplifiée reste cependant très utilisée dans les centres de documentation et d'information des établissements scolaires du secondaire (dans les lycées) et dans de nombreuses bibliothèques publiques ou privées.

En Belgique francophone, l'utilisation de la CDU est requise pour toute bibliothèque souhaitant être reconnue - et donc subventionnée - par la Communauté française de Belgique.

En 2004 l'UDC Consortium a publié une liste des pays l'utilisant en les classant de A à C suivant l'utilisation qui en est faite[1].

III/ Library of Congress Classification (LCC).


Historique et fonctionnement :

La Library of Congress Classification, ou en français Classification de la Bibliothèque du Congrès, a été développée fin XIXe, début XXe siècle par la Library of Congress (Bibliothèque du Congrès) de Washington aux États-Unis dans le but d'organiser et de classer ses collections.
Aujourd'hui, c'est l'une des classifications les plus utilisées en bibliothèque dans le monde.

C'est une classification par sujet alphanumérique qui mélange donc lettres et chiffres.
La LCC est divisée en 21 classes de base représentées par une lettre de l'alphabet allant de A à Z sauf I, O, W, X et Y. La plupart de ces classes sont subdivisées en sous-classes plus spécifiques ayant deux ou trois lettres de l'alphabet et/ou une série de chiffres.
Ensuite vient une série de 1 à 4 chiffres qui définissent plus précisément le sujet.
On trouve après une série de lettres et de chiffres représentant le nom de l'auteur ou le titre du document.
En dernier se trouve une série de chiffres correspondant à l'année de publication du document.
C'est une classification non décimale contrairement à la CDD ou la CDU, c'est-à-dire que cela suit un ordre numérique. Ainsi la sous-classe H627 sera avant H737 et avant H4050.

Un des avantages de la Classification de la Bibliothèque du Congrès est sa mise à jour très régulière, elle est très dynamique. De plus, elle utilise le format MARC ce qui permet facilement des échanges.
En revanche la construction des cotes et leur longueur sont plutôt problématiques, les cotes pouvant être incompréhensibles à première vue et pouvant avoir une dizaine de caractères.
L'étendue des domaines couverts est très importante. Cela est un donc un avantage sauf pour les bibliothèques ayant un fonds peu important.
De plus, la LCC est très orientée vers l'Amérique (les classes E et F y étant consacrées) et cela rend ces classes trop précises pour la majorité des bibliothèques étrangères.

Principe :


Les classes principales sont :

A - Ouvrages généraux
B - Philosophie, psychologie, religion
C - Sciences auxiliaires de l'histoire
D - Histoire de l'Europe, Asie, Afrique, Océanie
E - Histoire des USA
F - Histoire de l'Amérique sauf USA
G - Géographie, océanographie, ethnologie, loisirs
H - Économie, sociologie
J - Politique
K - Droit
L - Éducation
M - Musique
N - Arts
P - Linguistique, langues, littérature
Q - Sciences
R - Médecine, santé
S - Agriculture
T - Technologie
U - Histoire et science militaires
V - Histoire et science navales
Z - Bibliothèques, bibliographie

Comme exemple de sous-classes, les sous-classes de la classe A sont :

AC - Collections. Séries. Œuvres collectives
AE - Encyclopédies
AG - Dictionnaires et ouvrages de référence généraux
AI - Index
AM - Musées. Collectionneurs. Collections
AN - Journaux
AP - Périodiques
AS - Académies et sociétés savantes
AY - Annuaires. Almanach. Répertoires
AZ - Histoire générale du savoir

            Exemple : l'ouvrage Intégrer les jeunes dans l'entreprise a la cote suivante : HD 6270 T37 1994
Elle correspond à :
            H : sciences sociales (classe)
            HD : Histoire et conditions économiques (sous-classe)
            6270 : travail des jeunes
            T37 : Tapia, Claude, l'auteur du livre
            1994 : le livre a été publié en 1994

            Exemple : l'ouvrage La famille occidentale au Moyen Âge a pour cote : HQ513 F355 2005
Elle correspond à :
                        HQ : Sujet principal
                        513 : Sujet précisé
                        F355 : Indice de titre ou d'auteur
                        2005 : Année


Utilisation :


Les bibliothèques universitaires nord-américaines (États-Unis, Canada) utilisent essentiellement la Classification de la Bibliothèque du Congrès. Des bibliothèques dans le monde entier se basent aussi sur la LCC.

 

IV/ Colon Classification (CC).


Historique et fonctionnement :

La Colon Classification a été créée par Shiyali Ramamrita Ranganathan, un mathématicien et bibliothécaire indien qui la publie en 1933. C'est la première classification à facettes et est un système « analytico-synthétique ».
Éric de Grolier a déclaré qu'elle était « la première classification bibliographique “pluridimensionnelle” dans son principe qui ait été conçue. »
Son but était de pallier aux lacunes des classifications classiques dont la structure est hiérarchique et  qui ne permettent pas de montrer qu'un document peut appartenir à plusieurs classes.
Ainsi la CC a 5 catégories fondamentales ou facettes : Personnalité, Matière, Énergie, Espace et Temps (PMEST). À cela s'ajoute une facette principale qui représente généralement le domaine de connaissance qui correspond aux classes classiques telles que la philosophie, la religion, etc.
Cette classification permet donc une grande flexibilité, une richesse et une précision des représentations en ne limitant pas un sujet à un type d'information. Le problème vient de la notation qui est très complexe, mêlant des nombres arabes, romains, des majuscules et minuscules latin et des lettres grecques.

Principe :


La Colon Classification est sous forme de tables de concepts regroupés en classe homogène.
Dans chaque classe, les concepts sont divisés en groupes appelés facettes, et à l'intérieur de chaque facette, les termes représentant les concepts peuvent être classés de façon hiérarchique.
Les cinq catégories fondamentales sont :

Personnalité -  sujet ou concept principal du document
Énergie - opération ou l'action subie par le sujet
Matière - substance ou une propriété
Espace - lieu géographique du document
Temps - lieu chronologique du document

            Exemple : un document sur « la fabrication de gants de laine à Bradford au 19ème siècle » donnera :
                        Facette principale : Techniques de l'ingénieur
                        Personnalité : gant
                        Matière : laine
                        Espace : Bradford
                        Temps : 19ème

La notation est constituée de nombres arabes, romains, de majuscules et minuscules latin et de lettres grecques.

Lettres majuscules - Classes
Nombres décimaux - Facettes
Symboles alphanumériques - Subdivisions communes
Signes de ponctuation - Relations entre les sujets
Lettres minuscules - Relations entre les classes

            Exemple : un ouvrage intitulé Réparation du moteur Diesel et qui traite de construction mécanique, de la réparation d'un moteur Diesel à la suite d'une défaillance.

Nous avons d'abord :
            Facette principale : construction mécanique
            Personnalité : moteur diesel
            Énergie : réparation et défaillance

Puis on fait passer ces mots du langage naturel à celui de la classification : génie mécanique, moteur Diesel, défaillance, réfection.

On construit ensuite l'indice : D9 L22 : 4 : 6
            Avec :
                        D : Sciences appliquées
                        9 : génie mécanique
                        L22 : Sujet donc moteur Diesel
                        : pour la facette Énergie
                        4 : défaillance
                        6 : réfection


Utilisation :


La CC est essentiellement utilisée en Inde.
Aujourd'hui, la classification à facettes est particulièrement intéressante pour le web et notamment le web sémantique et l'organisation de ressources numériques.

 

V/ Les Thésaurus.


Historique et fonctionnement :


Les thésaurus, thésaurus de descripteurs ou thésaurus documentaire sont des termes représentant les différents concepts d'un domaine de la connaissance organisés dans une liste.

C'est un langage contrôlé utilisé pour l'indexation et la recherche de ressources documentaires dans des applications informatiques spécialisées. Les thésaurus sont donc une catégorie de langage documentaire parmi d'autres.  Les termes sont reliés entre eux par des relations de synonymie (terme équivalent), de hiérarchie (terme générique et terme spécifique) et d'association (terme associé) ; chaque terme appartient à une catégorie ou un domaine.


Exemple : environnement sémantique du terme « véhicule »[2].

Concept ou Terme préférentiel :
véhicule

Domaines :
véhicule - transport [MT 3330]

Terme(s) équivalent(s) :
moyen de transport

Terme(s) générique(s) :
(aucun)

Terme(s) spécifique(s) :
navire
véhicule aérien
véhicule amphibie
véhicule militaire
véhicule spatial
véhicule terrestre

Terme(s) associé(s) :
métier : transport [MT 6005]
technique automobile [MT 3510]
transport [MT 3330]

Exemple de présentation des thésaurus sur internet :


 








Principe :


Le thésaurus est un outil linguistique qui permet de mettre en relation le langage naturel des utilisateurs et celui contenu dans les ressources. Cette technique pallie les limites du langage naturel, très riche mais aussi souvent ambigu. Le thésaurus évite ainsi les risques induits par les synonymies, les homonymies et les polysémies présentes dans le langage naturel. Contrairement à un dictionnaire un thésaurus ne fournit qu'accessoirement des définitions, les relations entre les termes étant privilégiés.

Les thésaurus documentaires suivent des principes de construction établis depuis les années 1970 dans une norme internationale de l'ISO, dont la dernière édition a été publiée en 2011[3]. Avec l'élaboration de normes et d'applications informatiques spécialisées, comme dans le domaine voisin des ontologies, une convergence des problématiques a rapproché les thésaurus des ontologies[4].

Utilisation :


Les thésaurus sont utilisés dans les catalogues informatisés de nombreuses bibliothèques comme mots clefs.

Conclusion :


Ces classifications sont parmi les plus connues et restent générales, couvrant l'ensemble de la connaissance.
Il existe d'autres classifications, souvent plus spécifiques comme la NLM (National Library of Medecine) Classification, la PCDM4 (Principes de Classement des Documents Musicaux), ou la Classification de Brunet (fonds anciens).

Webographie :

Classification
·   http://fr.wikipedia.org/wiki/Classification_(science_de_l%27information)
Classification décimale de Dewey
Classification décimale universelle
Thesaurus
Colon Classification (Ranganathan)
Classification de la Bibliothèque du Congrès


[1]              Voir cette liste à cette adresse : http://www.udcc.org/countries.htm
[2]              Extrait du thésaurus Motbis édité par le Ministère de l'Éducation nationale.
[4]              L'ontologie en informatique et en science de l'information, c'est un ensemble structuré de termes et concepts représentant le sens d'un champ d'informations, que ce soit par les métadonnées d'un espace de noms, ou les éléments d'un domaine de connaissances. Plus simplement, on peut aussi dire que l'« ontologie est aux données ce que la grammaire est au langage ».
                Les concepts sont organisés dans un graphe dont les relations peuvent être :
                -des relations sémantiques ;
                -des relations de subsomption (inclusion).
                Les ontologies sont employées comme une forme de représentation de la connaissance au sujet d'un monde ou d'une certaine partie de ce monde. Elles décrivent généralement :
                -Des individus : les objets de base ;
                -Des classes : ensembles, collections, ou types d'objets ;
                -Des attributs : propriétés, fonctionnalités, caractéristiques ou paramètres que les objets peuvent posséder et partager ;
                -Des relations : les liens que les objets peuvent avoir entre eux ;
                -Des événements : changements subis par des attributs ou des relations.

Aucun commentaire:

Enregistrer un commentaire