22/12/2007

L’information non structurée dans l’entreprise

L’information non structurée dans l’entreprise.
Par Alain Garnier, Editions Hermés – Lavoisier

db3cb01ebabd02c57f2739f2c23b1a37.jpgL’ouvrage d’Alain Garnier est un travail remarquable par sa précision et sa richesse. En un peu plus de 200 pages, il permet au lecteur d’avoir un panorama complet des applications exploitant des «informations non structurées» qui se sont développées avec Internet. Travail rigoureux d’ingénieur, il propose notamment une analyse intéressante et originale des usages de ces applications, par les différentes fonctions de l’entreprise, qui repose sur le modèle FC3T (Finalité, Criticité, Type de liens, Temporalité, Type d’informations).
Deux chapitres sont consacrés aux outils qui constituent un très bon point d’entrée pour le néophyte mais n’ont pas la richesse des analyses précédentes, car faisant référence à des technologies assez anciennes, ce qui il est vrai à l’échelle du Web, veut dire de l’année dernière!

Plus discutable est le concept d’information non structurée. Discutable sur un plan lexicographique car correspondant à une construction peu habituelle dans la langue de Molière; il s’agit en fait d’une traduction du terme anglais «unstructured data»(*) où est «non structurée» tout ce qui ne l’est pas,...ce qui n’est pas d’une grande utilité! Alain Garnier se risque à une définition (page 23) : «une information est dite non structurée quant elle renvoie à un usage non-inscrit dans un modèle et se construit à partir d’un sens dérivé du langage ou de la pensée». Définition qui peut conduire à un raccourci tentant selon lequel «la pensée est l’univers du non-structuré» et doit faire bondir plus d’un cartésien! Et il serait étonnant que les informations d’un fichier client bien structuré ne trouvent pas leur sens dans la pensée du lecteur.

Alain nuance page 35 en expliquant qu’une «partie de l’information non structurée devient structurée». Humble constat pour finalement se dire qu’il serait plus raisonnable de parler «d’information pas encore structurée», histoire de se rappeler que les données structurées sont les seules que les ordinateurs sachent traiter. Ainsi, rappelons, que les bases de données, emblème de l’information structurée, sont apparues dans les années 80, après que les fichiers plats ont montré leurs limites dans les opérations de gestion des entreprises. Constatons aussi que les moteurs de recherche ne sont que des «structurateurs» de l’information en s’appuyant sur la technologie des index.

Il n’en demeure pas moins que le constat que dresse Alain est bien réel, à savoir l’explosion de données pour lesquelles aucun modèle n’a été – encore - conçu. Cette explosion est le fruit de deux phénomènes : d’une part, le formidable développement des réseaux informatiques, en premier lieu Internet, et d’autre part, l’explosion des données textuelles (et sans doute demain vidéo).

Et c’est probablement le vrai challenge du moment : quels sont les modèles et donc les outils qui permettent de traiter et donc de structurer cette immense masse de données textuelles. Et de ce point de vue, l’ouvrage n’apporte pas vraiment d’éclairage dans un domaine qui en aurait bien besoin.

Bien que le titre soit discutable, il en demeure pas moins que ce livre est un incontournable et que tout responsable d’un système d’information et plus généralement, toute personne s’intéressant au traitement de l’information appréciera sa lecture.

Alain Beauvieux

(*)Sur Wikipedia version française: pas de définition précise du terme «information non structurée» mais une centaine de références.

From Wikipedia, the free encyclopedia: unstructured data (or unstructured information) refers to masses of (usually) computerized information which do either not have a data structure or one that is not easily readable by a machine. The term is imprecise: software that creates machine-processable structure exploits word morphology, sentence syntax, and other small- and large-scale patterns found in source materials to discern linguistic, auditory, and visual structure that is inherent in all forms of human communication.[1] Examples of "unstructured data" may include audio, video and unstructured text such as the body of an email or word processor document.

18/12/2007

Le Blog « Pour ma ville »

Le Monde du 18 12 07 se fait écho de la campagne menée par Mme Fadela Amara, Secrétaire d’Etat à la politique de la ville, notamment autour du blog intitulé «Pour ma ville».

Plus de 11000 messages ont été reçus dont la majeure partie provenant de quartiers sensibles, essentiellement de jeunes, 92% des messages ayant été postés suite à une opération de sensibilisation réalisée par Skyrock (*).

Analysés par une équipe du CNRS, l’un des chercheurs note : «Le blog a permis de recueillir des opinions que les réunions électorales ou autres débats participatifs ne permettent pas de capter habituellement. Nous sommes dans la sociologie de l’expérience directe».

Nous ne pouvons que partager son point de vue !

Alain Beauvieux

(*) voir http://pourmaville.skyrock.com/

14/12/2007

Blogs et distribution, un article intéressant sur Atelier.fr

Le site de l’Atelier (www.atelier.fr) publie un article très intéressant intitulé «Les bloggeurs bouleversent le modèle de la grande distribution ».
http://www.atelier.fr/medias-loisirs/10/14122007/communaute-bloggeurs-etats-unis-propose-guide-conseil-achats-noel-35713-.html

Le chapeau de l’article résume bien l’impact des blogs sur la eReputation des marques et des produits: En multipliant les initiatives structurées visant à conseiller le public pour ses achats de noël, la large communauté de bloggeurs américains met l'avenir de la vente au détail dans les mains des consommateurs.

L’article fait état d’une étude menée par Nielsen Online qui a exploré un millier de blogs américains dits influents au mois de novembre. Ce réseau de bloggeurs représente de facto un vaste catalogue de Noël … virtuel et collectif. Il serait intéressant qu’une étude similaire soit réalisée en France où le nombre de bloggeurs rapporté à la population est un des plus élevés en Europe et où la distribution n’a pas grand-chose à envier à ses confrères américains.

Alain Beauvieux

19:01 Publié dans Lu et Vu | Lien permanent | Commentaires (0) | Tags : influence, eReputation

10/12/2007

France : 19ème sur 30 en science.

1f4fd1f92181ab8d3f8bc1df3d6cd554.gif
La lecture du Monde du 5 décembre – page 10 – a dû attrister plus d’un scientifique. 19 sur 30 c’est le classement récent de la France pour l’enseignement des sciences, classement réalisé en 2006 par l’OCDE et qui fait suite à celui de 2003 où notre pays était dixième.

Il est vrai que la science n’a plus le même pouvoir d’attraction sur la jeune génération que sur les précédentes : « trader » est plus souvent cité qu’astronaute comme profession rêvée par les écoliers actuels.

Quelque soit cette désaffectation, à laquelle les autres pays développés n’échappent pas, il n’en demeure pas moins que l’enseignement en France, et pas seulement des sciences, a de plus en plus de difficulté à dispenser le niveau de compétences dont les entreprises et services ont besoin et qui nous amène à ce score attristant. Situation d’autant plus incompréhensible pour un pays précurseur qui a pris cette décision ambitieuse et essentielle de rendre l’école obligatoire pour tous les enfants il y a plus d’un siècle.

Je ne prétends pas avoir la compétence pour trouver "la solution" à ce problème. J’observe simplement que le système de J. Ferry, assez égalitaire, que l’on peut qualifier de «tamis» n’est plus adapté : ainsi, chaque année scolaire agit comme un filtre pour finalement construire une pyramide. A l’image de celle du meunier où la fleur est l’élite. Le vrai problème est que notre pays et ses entreprises n’ont plus vraiment besoin du son !

Dans ces conditions, pourquoi ne pas repenser l’enseignement, notamment celui des collèges, non plus en terme d’année (6ème, 5ème, etc.) mais en terme d’unités de connaissances correspondant à des savoirs maitrisés. Que vaut-il mieux ? Qu’un élève mette deux ans pour comprendre la proportionnalité – alors que les plus brillants mettront 6 mois – ou «qu’il passe» en année supérieure sans savoir faire une «règle de 3». Pour arriver au final à 16 ans, sans maitriser les connaissances élémentaires à toute vie en société. Les Finlandais, cités en exemple pour leur première place à ce classement, ont déjà répondu à cette question. Constatons aussi que la formation professionnelle est organisée de cette façon.

En y réfléchissant un peu, tous les enseignements auraient à y gagner. Par exemple, plutôt qu'une heure d'enseignement musical pendant 4 ans, ne vaudrait-il pas mieux 8 heures par semaine pendant 6 mois. Je suis convaincu que les élèves en retiraient sans doute plus qu'avec le saupoudrage actuel. Et que certains y trouveraient un réel intérêt à poursuivre en dehors du collège. Et l’enseignement des sciences dans tout cela ? La démarche est la même en se donnant le temps et les moyens de développer de véritables projets reposant sur l'observation, la compréhension et mise en œuvre de modèles et enfin l'expérimentation.

Loin d'avoir la naïveté de penser que tout le monde sera polytechnicien, il nous semble que cette démarche permettra à chacun de donner le meilleur de lui-même en fonction de ses capacités et de ses complaisances. Ce qui j'en conviens correspond à la mise en place de classes de niveau par le jeu des modules, classes qui sont officiellement bannies mais qui, de fait, existent déjà.

Alain Beauvieux

22:20 Publié dans Humeurs | Lien permanent | Commentaires (0) | Tags : enseignement, OCDE

08/12/2007

Interface Google … suite

Dans la série "Interface minimaliste", Sébastien Marinier (cf site amis) me signale le moteur d’Orange www.lemoteur.orange.fr

afb2bd994cac120953da9fa01b0cbdad.jpg


Toute ressemblance avec un personnage existant est fortuite !

22:30 Publié dans Métiers | Lien permanent | Commentaires (0) | Tags : moteur, orange, interface

02/12/2007

L’interface Google ?… pas si bête !

Un client me faisait remarquer récemment que l’interface de Google n’avait que très peu évolué depuis son lancement, très minimaliste, avec une case de recherche et une page essentiellement blanche. D’autant plus étonnant que la tendance actuelle chez les éditeurs français de moteurs de recherche (dont je fais partie) est plutôt à offrir de plus en plus d’outils de navigation : catégories, entités nommées, langues, mots associés, etc. Il est donc légitime de s’interroger à ce sujet.

Sauf à faire preuve d’une grande naïveté, les réponses ne sont pas à chercher du coté de « ils n’y ont pas pensé », « ils ne savent pas faire », « ils n’ont pas les moyens »… toute chose que le succès commercial et financier de Google infirme.

La réponse est plutôt chez les utilisateurs (comme toujours !). Force est de constater que depuis plusieurs années un « usage » des moteurs de recherche, au premier rang desquels Google, s’est développé, consistant à poser des questions, à regarder les 10 premiers résultats (exactement la page Google), et si l’utilisateur ne trouve pas son bonheur, à reposer une question, en ajoutant éventuellement un ou deux mots. Démarche itérative, basique, voire un peu brutale mais c’est un fait. Et l’utilisateur a toujours raison.

Bien évidemment, l’attitude d’un professionnel recherchant de l’information professionnelle sur un Intranet n’est pas la même que celle d’un internaute qui surfe sur le Web. Ou il est tentant de le penser bien qu’il s’agisse souvent de la même personne. De ce point de vue, une étude intéressante et visionnaire (1) avait été publiée fin 2003 relatant les différences individuelles en matière de recherche d’information sur le Web. Les auteurs constataient, que contrairement à leurs attentes, les outils de navigation sophistiqués offerts en plus d’une interface minimaliste n’étaient utilisés que par 8% des utilisateurs.

La réponse à l’interrogation de notre client est probablement là : la grande majeure partie des utilisateurs, qu’il soit internaute au intranaute, ont le comportement itératif décrit précédemment. Et pour cela une interface minimaliste est suffisante.

Alors doit-on en conclure qu’en dehors de Google point de salut. En ce qui concerne la recherche d’informations en entreprise, certainement pas ! Car la vraie question est la pertinence des informations remontées et donc la qualité de la technologie d’indexation. Et celle de Google est construite pour faciliter le « surf » sur Internet sur un immense volume de données, en favorisant les pages les plus populaires. Est-ce cela dont les intranets d’entreprise ont besoin ? Certainement pas et il y a beaucoup mieux chez les éditeurs français du domaine. Même si la réflexion autour de l’interface minimaliste est à prendre en compte avec humilité … et sagesse !

Alain Beauvieux

(1) L’étude en question est publiée dans “IHADJADENE M., CHAUDIRON S. et MARTINS D., " The Effect of Individual Differences on Searching the Web ", in Proceedings of the 66th Annual Meeting of the American Society for Information Science and Technology, Long Beach, October 19-22, 2003, p. 240-246.”