Informations : la tentation de l’exhaustivité

Que voulez-vous savoir ? Tout !

Il est tentant lors de la mise en place d’une nouvelle gestion, d’un nouveau formulaire, … de vouloir connaître et mémoriser le plus grand nombre d’informations possible. Plus une base de données est riche, plus elle permet de se livrer à des analyses complexes.

Le problème est que plus le nombre d’informations est important plus l’effort de collecte l’est lui-même. Une trop grande ambition en la matière aboutit le plus souvent à des bases de données pleines de trous. Ajoutez à cela la dispersion et l’inhomogénéité des données saisies, faute d’avoir procédé à une définition stricte de ces données, et vous obtenez un ensemble de données à peu près inexploitable.

Des données opérationnelles et des données déclaratives

Il faut dire que parmi ces données qu’on demande de collecter certaines ont dès le départ un gros handicap : elles n’ont aucune utilité immédiate et définie. De sorte que même si elles sont mal ou pas du tout saisies, l’entreprise ne s’arrête pas de tourner.

Ma constatation est que les données non opérationnelles, je les appelle déclaratives, sont dans leur quasi-totalité condamnées à être inutilisables.

Commençons donc par déterminer quelles sont les données strictement nécessaires.

Des données au cordeau … facile à croiser

Procédons de manière raisonnable.

Sur les données opérationnelles, essayons d’être le plus précis possible quant à leur signification, leur domaine de valeur, les procédures de saisie et de mise à jour. Il est essentielle que toute personne impliquée dans la collecte connaisse l’utilité des données qu’elle saisit.

Pour les données non opérationnelles, il existe de multiples sources de données plus ou moins publiques qui peuvent compléter vos données propres. Quitte, par exemple, à collecter des informations sur vos clients, notez le SIRET qui vous permettra de croiser vos informations avec ces sources gratuites ou peu onéreuses.

Si, en prévision d’analyses futures, vous avez besoin de certaines données que vous ne savez pas trouver ailleurs, vous devez, comme pour les données opérationnelles, les définir strictement et vous assurer dans la durée qu’elles sont correctement saisies. C’est un effort et c’est un coût.

Face à une impossible exhaustivité, le plus raisonnable est de toute évidence de savoir moins mais de savoir bien.

Posted in:

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *