22/12/2007

L’information non structurée dans l’entreprise

L’information non structurée dans l’entreprise.
Par Alain Garnier, Editions Hermés – Lavoisier

db3cb01ebabd02c57f2739f2c23b1a37.jpgL’ouvrage d’Alain Garnier est un travail remarquable par sa précision et sa richesse. En un peu plus de 200 pages, il permet au lecteur d’avoir un panorama complet des applications exploitant des «informations non structurées» qui se sont développées avec Internet. Travail rigoureux d’ingénieur, il propose notamment une analyse intéressante et originale des usages de ces applications, par les différentes fonctions de l’entreprise, qui repose sur le modèle FC3T (Finalité, Criticité, Type de liens, Temporalité, Type d’informations).
Deux chapitres sont consacrés aux outils qui constituent un très bon point d’entrée pour le néophyte mais n’ont pas la richesse des analyses précédentes, car faisant référence à des technologies assez anciennes, ce qui il est vrai à l’échelle du Web, veut dire de l’année dernière!

Plus discutable est le concept d’information non structurée. Discutable sur un plan lexicographique car correspondant à une construction peu habituelle dans la langue de Molière; il s’agit en fait d’une traduction du terme anglais «unstructured data»(*) où est «non structurée» tout ce qui ne l’est pas,...ce qui n’est pas d’une grande utilité! Alain Garnier se risque à une définition (page 23) : «une information est dite non structurée quant elle renvoie à un usage non-inscrit dans un modèle et se construit à partir d’un sens dérivé du langage ou de la pensée». Définition qui peut conduire à un raccourci tentant selon lequel «la pensée est l’univers du non-structuré» et doit faire bondir plus d’un cartésien! Et il serait étonnant que les informations d’un fichier client bien structuré ne trouvent pas leur sens dans la pensée du lecteur.

Alain nuance page 35 en expliquant qu’une «partie de l’information non structurée devient structurée». Humble constat pour finalement se dire qu’il serait plus raisonnable de parler «d’information pas encore structurée», histoire de se rappeler que les données structurées sont les seules que les ordinateurs sachent traiter. Ainsi, rappelons, que les bases de données, emblème de l’information structurée, sont apparues dans les années 80, après que les fichiers plats ont montré leurs limites dans les opérations de gestion des entreprises. Constatons aussi que les moteurs de recherche ne sont que des «structurateurs» de l’information en s’appuyant sur la technologie des index.

Il n’en demeure pas moins que le constat que dresse Alain est bien réel, à savoir l’explosion de données pour lesquelles aucun modèle n’a été – encore - conçu. Cette explosion est le fruit de deux phénomènes : d’une part, le formidable développement des réseaux informatiques, en premier lieu Internet, et d’autre part, l’explosion des données textuelles (et sans doute demain vidéo).

Et c’est probablement le vrai challenge du moment : quels sont les modèles et donc les outils qui permettent de traiter et donc de structurer cette immense masse de données textuelles. Et de ce point de vue, l’ouvrage n’apporte pas vraiment d’éclairage dans un domaine qui en aurait bien besoin.

Bien que le titre soit discutable, il en demeure pas moins que ce livre est un incontournable et que tout responsable d’un système d’information et plus généralement, toute personne s’intéressant au traitement de l’information appréciera sa lecture.

Alain Beauvieux

(*)Sur Wikipedia version française: pas de définition précise du terme «information non structurée» mais une centaine de références.

From Wikipedia, the free encyclopedia: unstructured data (or unstructured information) refers to masses of (usually) computerized information which do either not have a data structure or one that is not easily readable by a machine. The term is imprecise: software that creates machine-processable structure exploits word morphology, sentence syntax, and other small- and large-scale patterns found in source materials to discern linguistic, auditory, and visual structure that is inherent in all forms of human communication.[1] Examples of "unstructured data" may include audio, video and unstructured text such as the body of an email or word processor document.

Les commentaires sont fermés.