Plaidoyer pour une modélisation des données à l'échelle de l'entreprise
Gouvernance, efficacité, performance... sont à portée de main, pourvu qu'on se penche sérieusement sur un processus fondamental qui structure l'information de son SI.
Parce qu'il est bon de lire et relire les classiques, nous vous convions à vous replonger dans cette somme impressionnante sur le data management qu'est ce Data Management Body of Knowledge.
Sous ce sigle barbare de DMBOK, on trouve le Data Management Body of Knowledge, autrement dit l'encyclopédie et le manuel d'installation pour gérer ses données dans un SI d'entreprise. C’est la bible du Data Management, qui décrit par le menu le cadre proposé par la DAMA (Data Management Association).
Le data management est un des sujets oubliés de la data et pourtant la source de nombreux dysfonctionnements en entreprise.
Le data management c’est quoi ? Selon la phrase introductive du livre, c’est : "Le développement, l'exécution et la supervision des plans, politiques, programmes et pratiques qui permettent de fournir, contrôler, protéger et améliorer la valeur des données et des actifs d'information tout au long de leur cycle de vie."
En d’autres termes, le data management, c’est l’ensemble des activités, souvent Tech, qui vont permettre de gérer la donnée dans le SI. Il s'agit d'une vue holistique qui prend en compte les flux et les transformations pour assurer la cohérence de l’ensemble et la conformité aux règles et cadres définis par la data gouvernance. On peut aussi le voir comme l'ensemble des activités Ops-like spécifiques à la data.
Le livre est évidemment très complet et je n'ai pas l'ambition de vous présenter tous ses aspects. Néanmoins, et en écho à ce que nous voyons en entreprise, les sujets suivants ont une résonance particulière.
Le DMBOK nous rappelle que la base de l’exploitation des données, c’est de maîtriser l’ensemble du patrimoine et d’être en capacité de les faire se parler les unes avec les autres. Pour cela, l’entreprise doit être en mesure de les lier. Pour les lier la constitution d’une cartographie qui part des sources et débouche sur les usages, même les plus particuliers, et reprend toute la chaîne de transformation, est un outil indispensable.
Les technologies big data et leurs zones de stockage en "lake" ont tendance à nous faire oublier que même dans un espace large il faut organiser sa donnée et maintenir un haut niveau de connaissance du contenu des espaces. À défaut, on perd sur tous les tableaux : performances, efficacité, impossibilité de croiser les données…
Cette modélisation peut exister à différents niveaux, sous différentes granularités, être réalisée avec différents outils. Il est également important de souligner que la démarche de constitution et de maintien d'un tel outil est aussi important que le document lui même.
Enfin, l’ouvrage est intéressant parce qu’il donne des pistes pratiques pour mettre en place, développer, surveiller et analyser l’ensemble des pratiques liées au data management.
Si vous faites beaucoup de métro : c’est bien sûr possible !
Si vous n’avez pas le temps (ou la patience), l’ouvrage est important dans sa structure. Le sommaire donne un bel aperçu du cadre que le DAMA définit. Et la maîtrise de ce cadre permet de naviguer plus facilement dans les différentes activités du data management et d’analyser plus rapidement une situation complexe en entreprise.
Pour le reste, c’est une référence à consulter régulièrement au milieu d’un projet ou en phase d’analyse, éventuellement comme base de discussion quand une entreprise se pose des questions sur l’évolution qu’elle souhaite donner à son organisation data.
Si vous avez des conseils de lecture Data Management je suis toujours preneuse !
Mon prochain sur la liste : Lean Tech Manifesto.
(Et pour ceux qui sont quand même curieux de mes autres lectures :
Roman : le magicien de Colm Toibin- une biographie nuancée de Thomas Mann. Beau roman pour ceux qui comme moi n'ont jamais réussi à rentrer dans La Montagne Magique.
BD : J’ai peur mais j’y vais de Clarisse Crémer et Maud Benezit.
Au delà de mon petit plaisir de livre tous les ouvrages sur les traversées en solitaire, le propos de Clarisse Crémer est agréable de fraicheur et d'honnêteté et le dessin doux et humoristique.
Littérature jeunesse : Les chroniques de l’Erable et du Cerisier de Camille Monceaux. Plutôt pour un public 10 - 12 ans. Une plongée dans une épopée du Japon médiéval.)