Plaidoyer pour une modélisation des données à l'échelle de l'entreprise
Gouvernance, efficacité, performance... sont à portée de main, pourvu qu'on se penche sérieusement sur un processus fondamental qui structure l'information de son SI.
Les Data Platforms construites aujourd'hui dans le Cloud constituent une réponse pragmatique aux problèmes que le Big Data cherchait à résoudre.
< De la données at scale, le big data
Les Data Platforms construites aujourd'hui dans le Cloud constituent une réponse pragmatique aux problèmes que le Big Data cherchait à résoudre.
Le regard critique porté par les analystes et les entreprises sur le Big Data, quelques années seulement après l'apparition du concept et les premières implémentations, pourrait faire penser qu'il s'agissait d'un buzz passager, un besoin créé par les vendeurs de logiciels surfant sur la mode autour d'Hadoop.
Les besoins existaient, pourtant. Toutes les entreprises n'avaient pas forcément besoin de répondre à des enjeux de vélocité, de volume et de variété à la fois (les 3 V mis en avant par les promoteurs du Big Data). Mais il faut se souvenir que nous étions dans une période où l'accès à la donnée était compliqué, où la BI était l'apanage de quelques-uns. La production de rapports était coûteuse en temps (il pouvait s'écouler plusieurs mois entre une expression de besoin et la création d'un dashboard analytique) et en argent (la licence et le matériel nécessaire pour les datawarehouses).
Il y avait donc de forts besoins, d'accéder à davantage de données pour améliorer les analyses et créer des algorithmes et statistiques pertinentes, parfois de pouvoir analyser des données non structurées, ou encore de pouvoir diffuser plus rapidement et plus largement des informations cruciales d'aide à la décision business. Ces besoins demeurent ; ils sont désormais traités dans le cadre de Data Platforms Cloud.
Dans leur grande majorité, les projets Big Data ne sont pas parvenus à délivrer les bénéfices attendus. Nous voyons au moins 6 raisons pour lesquelles les projets Big Data ont échoué. En résumé :
Le Cloud est une réponse idéale aux problématiques que le Big Data cherchait à adresser. De par la variété des solutions technologiques proposées, bien sûr. Mais aussi et surtout par les capacités à monter en charge pour des coûts abordables, dans des délais serrés et avec des performances exemplaires.
Le Cloud est ainsi devenu un choix évident pour valoriser ses données. Les entreprises de toute taille ont la possibilité de déployer l'ensemble des technologies nécessaires en quelques clics ou lignes de code, sans se préoccuper d'une grande partie des opérations, prises en charge par le fournisseur de Cloud. Plus besoin, par exemple, de se préoccuper des montées de version et mises à jour de sécurité d'une base managée.
Même si l'entreprise utilisatrice conserve une part évidente de responsabilité dans l'exploitation et la sécurisation de ses données, une grande part est réalisée par le Cloud provider. L'entreprise peut vraiment se consacrer à la valorisation de son patrimoine de données. Tester des algorithmes, sans avoir besoin d'acquérir et de monter l'infrastructure nécessaire pour le faire. Ou bien encore partager des data sets en interne, dans un esprit Data Mesh, ou avec des partenaires ou clients, dans un esprit open data ou data as a service.