Les métadonnées

Objet numérique N°7

Big image

Découverte

Comme Monsieur Jourdain

Vous avez déjà tous pratiqué les métadonnées sans le savoir. En notant la date de prise de vue d'une photo, en notant le sujet, en notant l'appareil de la prise de vue..... au verso d'une photo.

Idem pour la musique.

Identifions quelques informations concernant cet album mythique de Pink Floyd.

Quelles informations essentielles pourriez-vous rechercher?

Comment fait-on avec les documents numériques?

Repérez quelques métadonnées de mon fichier.
Quelle fenêtre vous permet d'ajouter vos propres MD? Quel nom porteront-elles?

Définition

Deux définitions mais un mot important

· Une métadonnée est une donnée servant à définir ou décrire une autre donnée quel que soit son support (papier ou électronique). Les métadonnées donnent le contexte d’une information. (source : Wikipédia)


· Les métadonnées servent à décrire les données. Elles comprennent un certain nombre de "descripteurs" qui permettent de les rendre plus facilement identifiables (accessibles) et plus manipulables (interopérables, réutilisables, durables, adaptables). (source adaptée : Bureau Amérique du Nord de l'Agence Universitaire de la Francophonie)

Comment s'expriment-elles?

  • des mots-clés apportés par les utilisateurs
  • des mots-clés pré-définis par un ensemble d'utilisateurs
  • des tags sur les réseaux sociaux
  • des cases à cocher dans un tableau descriptif

Un peu d'histoire

Les premières métadonnées

Les tablettes d'argile, les papyrus où sont décrits les productuction agricoles ou bien encore les catalogues des premières bibliothèques dont..... (source: Du tag au Like, Olivier Le Deuff, fyp, 2012, pp24)

Les pinakes de Callimaques de Syrène dans la bibliothèque d'Alexandrie.

Pinakes
Catalogue en cent vingt rouleaux d'inventaire classé par ordre alphabétique et par genre, répertoriant l'ensemble des livres qui figuraient dans la bibliothèque d'Alexandrie. (Le Deuff op. cit.)
Big image
Mundaneum - Petite histoire d'une grande idée : Contexte FR

Conclusion

Ce qui était possible avec les quelques millions d'ouvrages au temps de Paul Otlet et Henri La Fontaine ne l'est plus avec les près de 5 milliards de pages web indexées par les moteurs de recherches.

Les usages

Pour qui?

Pour les robots et non pour les personnes, elles servent à réduire la complexité du monde.
Classer des milliards de documents n'est plus possible. Les métadonnées permettent de donner du sens aux informations disponibles sur le web. Elles mènent vers ce que l'on appelle le Web sémantique. C'est à dire un web intelligible pour l'homme.

Pour quoi?

Pour donner accès à des données existantes quelque part de façon indéfinie. Elles améliorent la trouvabilité ou la repérabilité des informations. Concepts développés par Peter Morville, archictecte de l'information. dixit wikipédia

Dans le monde actuel?

Un exemple malheureusement en phase avec les événements récents. Cette vidéo explique comment il est possible de connaître de quoi est fait la vie d'un homme à partir des traces et des métadonnées qu'il laisse sur le web. Sans connaître le contenu d'un message, la longueur, la fréquence, les destinataires sont autant d'informations qui peuvent être croisées.

Nous sommes tous producteurs de métadonnées ..

Les folksonomies ou taxonomie du peuple.

Le terme "folksonomie" est apparu il y a quelques années pour désigner le phénomène d'indexation des documents numériques par l'usager. On lui associe fréquemment le mot "tag" qui correspond à un mot-clé qu'on attribue à une ressource numérique de façon librement choisie. On parle parfois de "social tagging" que l'on peut traduire notamment "indexation collaborative libre". Le terme de folksonomie a été forgé par l'architecte de l'information américain Thomas Vander Wal. Il a combiné les mots "taxonomie" et"folk" soit la classification par le peuple. Cette notion s'inscrit clairement dans la logique du web 2.0.

Les folksonomies sont une manifestation d'un développement horizontal de la taxonomie. Les hommes classent leurs objets non en fonction d'une classification pré-établie mais en fonction de ce que les pairs auraient fait ou ont fait dans les mêmes circonstances.

Le hashtag est pour le tweeteur le moyen de retrouver de l'information attribuée par les autres utilisateurs.

Avec des sites comme twitter et son fameux # nous pouvons jouer à rechercher des informations parmi toutes les informations laissées par les 100 millions de tweets de chaque jour. (http://www.blogdumoderateur.com/chiffres-twitter/)

Pensons au #jesuischarlie qui a permis de suivre l’actualité dramatique du début de l’année 2015. Le # permet d’obtenir de l’info à propos d’un sujet tel que les internautes twitteurs les ont perçues. Mais malheureusement, le #brusselsattack a beaucoup de succès pour le moment.

Attribuer des mots clés dans un site de marque-pages sociaux

Des services comme Delicious, Diigo mais aussi vos marque-pages, favoris ou autre signets vous permettent de créer des métadonnées associées à une page web parmi les milliards existantes. Ce qui vous permet de la retrouver en utilisant le mot clé.

Delicious est mon service favori de marque-pages sociaux.

Il vous permet de sauvegarder les pages rencontrées qui vous intéressent, de les taguer personnellement. Il vous propose aussi des tags appropriés mais surtout, il vous permet de partager vos tags. Vous verrez si quelqu’un d’autre a déjà sauvegardé la page et en s’inscrivant dans son réseau, vous pourrez suivre les pages sélectionnées et les tags utilisés par d’autres personnes.

Standardisation des métadonnées?

Dublin Core

15 éléments clés pour décrire le contenu, le créateur et l'identification d'un document. Ce système décrit dans un article de Wikipédia

RDF (Resource Description Framework)

Ce système issu de la réflexion du consortium W3C participe à l'organisation du Web. Voir article Wikipédia et celui du W3C.
Sa base en est un triplet sujet-prédicat-objet. Par exemple: Miles Davis joue du Jazz
Une représentation graphique du RDF.

LOM (Learning Object Metadata)

Un schéma de description de ressources d’enseignement et d’apprentissage. Le LOM peut être utilisé pour décrire des ressources tant numériques que non numériques. Techniquement, son nom est IEEE 1484.12.1-2002 (LOM). Wikipédia

Les normes Scorm 2004 pour l'e-learning ainsi que certaines normes ISO lui sont associées.

source du schéma de droite .

Conclusion: Etes-vous classement ou métadonnées?

Dans votre disque dur, deux options: un classement rigoureux de vos documents ou bien l'association des mots-clés à chaque document. Le rapport de mission de l'école Saint Bidule est classé dans le dossier "Saint Bidule" ou bien chaque document ayant rapport avec cette école comporte le mot clé "Saint Bidule". Une méthode hybride est tout à fait possible. La façon la plus naturelle pour retrouver ses documents est de placer les mots clés dans le nom du fichier. Ainsi vous faites d’une pierre deux coups. Une remarque qui vaut ce qu’elle vaut : le système d’information de Microsoft Sharepoint promeut la création d’une banque de mot-clés propre à l’organisation afin de faciliter le travail d’attribution des mots-clés et donc de récupération des documents.

Pour en savoir plus!

Le cours de Hervé Le Crosnier sur les métadonnées en 2015-2016. Notez l'évolution du contenu du cours depuis 2009..