top of page

L'indexation

C'est une opération humaine de traitement intellectuel d’un document consistant à donner une représentation, par les éléments d’un langage documentaire, des notions résultant de l’analyse d’un document ou d’une question en vue d’en faciliter la recherche. Elles reposent sur l'extraction de caractéristiques, le partionnement de données, la quantification et la recherche d'information. Les fichiers indexés constituent une technique d'usage très général en informatique, pour le stockage de données numériques. 

Un index est une liste de descripteurs à chacun desquels est associée une liste des documents et/ou parties de documents auxquels ce descripteur renvoie. Lors de la recherche d'information d'un usager, le système rapprochera la demande de l'index pour établir une liste de réponses.

L'indexation permet de :

  • rendre sous une forme concise des informations stockées dans un fonds documentaire

  • faire le lien entre une offre d'informations (le fonds documentaire) et une demande d'informations (les questions des utilisateurs).

  • élaborer des outils de recherche documentaire (index, bulletins bibliographiques, catalogues, fichiers manuels ou automatisés) qui seront ensuite consultés et qui permettront la sélection de documents répondant à une question.

 

Par rapport à une recherche sur les mots des titres ou une recherche en plein texte (sur internet ou dans un traitement de texte), la recherche sur des documents indexés a de grands avantages :

  • les titres ne sont pas toujours significatifs

  • il donne accès aux documents en langue étrangère

  • il signale les documents non textuels (images, sons, objets)

  • la recherche en plein texte se heurte aux ambiguïtés des langues naturelles : les homonymes ("vol") et les synonymes ("tiers-monde", "pays sous-développés", "pays en voie de développement")

 

Une indexation idéale doit être :

  • Pertinente : les mots-clés utilisés doivent rendre compte avec exactitude du contenu du document. 

  • Objective : l'indexeur ne doit pas déformer la pensée de l'auteur 

  • Cohérente : les mêmes mots doivent désigner les mêmes notions (Un même document, dans un même centre de documentation, sera indexé de la même manière par plusieurs personnes)

 

Sources:

https://fr.wikipedia.org/wiki/Indexation_automatique_de_documents
http://combot.univ-tln.fr/lea/c.html
http://fadben.asso.fr/wikinotions/index.php?title=Indexation_documentaire
http://www.cndp.fr/motbis/index.php/indexer-generalites/19-definition-et-role-dindexation.html
 

bottom of page