Conseil de lecture : le DMBOK

Parce qu'il est bon de lire et relire les classiques, nous vous convions à vous replonger dans cette somme impressionnante sur le data management qu'est ce Data Management Body of Knowledge.

Conseil de lecture : le DMBOK
💡
Mes articles préférés sont souvent les Book Reviews (ou revues de littérature). Etant moi-même un rat de bibliothèque, il est temps de me lancer sur nos sujets Data...
Il y a toujours un temps pour lire. Personnellement, j’adapte le type de lecture à l’endroit et au temps que je peux y consacrer : les romans, l’aventure et la science fiction le soir, les bandes dessinées le dimanche matin au lit avec un café et les livres techniques pour mes trajets en transport en commun. Mais comme ici, c’est un site professionnel, j’ai décidé de vous faire part d’une de mes (re-)lectures du moment : le DMBOK - Data Management Body of Knowledge. 

Le DMBOK c’est quoi ?

Sous ce sigle barbare de DMBOK, on trouve le Data Management Body of Knowledge, autrement dit l'encyclopédie et le manuel d'installation pour gérer ses données dans un SI d'entreprise. C’est la bible du Data Management, qui décrit par le menu le cadre proposé par la DAMA (Data Management Association). 

Pourquoi est-ce un livre intéressant ? 

Le data management est un des sujets oubliés de la data et pourtant la source de nombreux dysfonctionnements en entreprise.

Le data management c’est quoi ? Selon la phrase introductive du livre, c’est : "Le développement, l'exécution et la supervision des plans, politiques, programmes et pratiques qui permettent de fournir, contrôler, protéger et améliorer la valeur des données et des actifs d'information tout au long de leur cycle de vie.

En d’autres termes, le data management, c’est l’ensemble des activités, souvent Tech, qui vont permettre de gérer la donnée dans le SI. Il s'agit d'une vue holistique qui prend en compte les flux et les transformations pour assurer la cohérence de l’ensemble et la conformité aux règles et cadres définis par la data gouvernance. On peut aussi le voir comme l'ensemble des activités Ops-like spécifiques à la data.

Quels éléments du livre ont retenu mon attention ?

Le livre est évidemment très complet et je n'ai pas l'ambition de vous présenter tous ses aspects. Néanmoins, et en écho à ce que nous voyons en entreprise, les sujets suivants ont une résonance particulière.

La modélisation des données : 

Le DMBOK nous rappelle que la base de l’exploitation des données, c’est de maîtriser l’ensemble du patrimoine et d’être en capacité de les faire se parler les unes avec les autres. Pour cela, l’entreprise doit être en mesure de les lier. Pour les lier la constitution d’une cartographie qui part des sources et débouche sur les usages, même les plus particuliers, et reprend toute la chaîne de transformation, est un outil indispensable.

Les technologies big data et leurs zones de stockage en "lake" ont tendance à nous faire oublier que même dans un espace large il faut organiser sa donnée et maintenir un haut niveau de connaissance du contenu des espaces. À défaut, on perd sur tous les tableaux : performances, efficacité, impossibilité de croiser les données…

Cette modélisation peut exister à différents niveaux, sous différentes granularités, être réalisée avec différents outils. Il est également important de souligner que la démarche de constitution et de maintien d'un tel outil est aussi important que le document lui même.

Le livre permet également de rappeler des définitions de base comme : 

  • les master data : l’ensemble des données qui définissent la/les sources de vérité de l’entreprise ;
  • les référentiels : les données qui servent à caractériser les données (souvent transactionnelles) ;
  • les meta data : les informations sur la structure des tables et données exploitées. Ces méta data sont des schémas qui en théorie doivent rester consistent en anglais, c'est-à-dire identiques (ou à défaut cohérent) le long de la chaîne de valeur data.

Enfin, l’ouvrage est intéressant parce qu’il donne des pistes pratiques pour mettre en place, développer, surveiller et analyser l’ensemble des pratiques liées au data management. 

Faut-il vraiment lire les 628 pages du livre ? 

Si vous faites beaucoup de métro : c’est bien sûr possible ! 

Si vous n’avez pas le temps (ou la patience), l’ouvrage est important dans sa structure. Le sommaire donne un bel aperçu du cadre que le DAMA définit. Et la maîtrise de ce cadre permet de naviguer plus facilement dans les différentes activités du data management et d’analyser plus rapidement une situation complexe en entreprise.

Pour le reste, c’est une référence à consulter régulièrement au milieu d’un projet ou en phase d’analyse, éventuellement comme base de discussion quand une entreprise se pose des questions sur l’évolution qu’elle souhaite donner à son organisation data. 

Si vous avez des conseils de lecture Data Management je suis toujours preneuse !

Mon prochain sur la liste : Lean Tech Manifesto.

(Et pour ceux qui sont quand même curieux de mes autres lectures : 
Roman : le magicien de Colm Toibin- une biographie nuancée de Thomas Mann. Beau roman pour ceux qui comme moi n'ont jamais réussi à rentrer dans La Montagne Magique.
BD : J’ai peur mais j’y vais de Clarisse Crémer et Maud Benezit.
Au delà de mon petit plaisir de livre tous les ouvrages sur les traversées en solitaire, le propos de Clarisse Crémer est agréable de fraicheur et d'honnêteté et le dessin doux et humoristique.
Littérature jeunesse : Les chroniques de l’Erable et du Cerisier de Camille Monceaux. Plutôt pour un public 10 - 12 ans. Une plongée dans une épopée du Japon médiéval.)

Génial ! Vous vous êtes inscrit avec succès.

Bienvenue de retour ! Vous vous êtes connecté avec succès.

Vous êtes abonné avec succès à WENVISION.

Succès ! Vérifiez votre e-mail pour obtenir le lien magique de connexion.

Succès ! Vos informations de facturation ont été mises à jour.

Votre facturation n'a pas été mise à jour.