< Du Big Data aux Cloud Data Platforms

Les projets Big Data, dans leur grande majorité, n'ont pas délivré les bénéfices attendus. On peut distinguer au moins six grandes raisons ayant abouti à ce résultat :

→ Une très forte complexité

Les technologies estampillées Big Data étaient complexes à mettre en œuvre et à maintenir. On a beaucoup parlé de la pénurie de data scientists, mais avant cela, il fallait des architectes et des ingénieurs de haut niveau pour concevoir ces architectures de données et les mettre à jour en fonction des incessantes nouveautés proposées par la Fondation Apache et les acteurs du marché. Et même si on parle de serveurs Linux, il fallait des moyens conséquents pour monter et faire tourner une telle infrastructure en entreprise.

→ Un focus sur la quantité plus que la qualité

Beaucoup de projets sont tombés dans l’excès inverse de la BI traditionnelle, où toute donnée devait être fiable. La capacité de pouvoir collecter des tonnes de données brutes a conduit à vouloir réaliser des analyses statistiques sur ces grandes masses. La plupart du temps, les résultats ont validé l’adage “garbage in, garbage out” : avec des données de mauvaise qualité en entrée, difficile de produire des résultats de qualité.

→ L’oubli de la notion de valeur

De très nombreux projets se sont montés pour stocker de la donnée, toute la donnée, sans véritablement se préoccuper de la finalité. S’il n’y a pas de réflexion en amont sur les cas d’usage, il devient impossible de mesurer la valeur des projets Big Data pour le business, sans même parler de calculer un ROI.

→ Une gouvernance axée sur la sécurité et la conformité

La gouvernance des données ne consiste pas seulement à s’assurer que les rôles ont bien été distribués et que chacun n’accède qu’aux données auxquelles il a le droit d’accéder. Au-delà des règles, il s’agit de réorganiser complètement la façon dont les équipes IT, les équipes data et les métiers peuvent travailler ensemble en bonne intelligence pour produire de la valeur.

→ L’absence d’une stratégie globale

Une stratégie data-driven ne découle pas subitement d’un projet informatique ; c’est l’infrastructure de données qui doit être conçue en fonction de la stratégie de l’entreprise et des impératifs business. Le rôle crucial de la donnée doit être clair pour tout le monde, c’est ce qui déterminera la gouvernance, l’organisation, les processus et l’infrastructure technologique.

→ Une approche trop centralisatrice

Vouloir tout mettre au même endroit, qu’il s’agisse des données ou des ressources humaines, peut s’avérer payant dans certains cas, mais cela ne devrait pas être une règle. Abolir les silos n’est pas forcément synonyme de tout regrouper ; la donnée peut être mieux exploitée par des technologies et des équipes différentes, le tout étant de savoir construire des ponts et d’avoir une vision globale.

Share this post