Comment industrialiser une démarche data ?

C'est la question à 1 million que nous avons posée à nos interlocuteurs, dans le cadre de la rédaction de notre livre blanc DataOps. Parce que nous sommes tous d'accord : mettre en place une démarche industrielle est obligatoire pour tirer le meilleur parti des tonnes de données récoltées dans les entreprises.

Le paradoxe est en effet saisissant. Alors que les entreprises croulent sous la donnée, les métiers ont toujours autant de difficultés à accéder à l'information dont ils ont besoin. On voit encore, au sein des Comex, des dirigeants brandir des KPI totalement différents alors qu'ils sont censés refléter la même réalité.

Il n'y a pas de recette miracle pour remédier à cela, chaque entreprise doit concevoir son approche, adaptée à son contexte. On y retrouve tout de même un certain nombre d'invariants.

-> Didier Bove, DSI de Veolia

Didier Bove, DSI de Veolia, insiste sur les notions d'organisation et de gouvernance : "Classiquement, dans l’IT, 80 % des efforts passent dans le choix de l’outil, alors qu’il faudrait les faire porter sur les processus et l’organisation." Surtout dans une entreprise décentralisée, où la DSI centrale ne peut pas tout savoir des problématiques rencontrées par les utilisateurs sur le terrain. Il faut donc allier l'expertise technique et la mutualisation de la DSI avec l'expertise fonctionnelle des métiers.

Et garder en tête que l'important, c'est de proposer de la donnée utile, et non pas constituer le plus gros datalake possible : "nous sommes passés de “big is beautiful” à “useful is beautiful”. "

Didier Bove - DSI Veolia : “Useful is beautiful”
“Nous avons revu en profondeur la façon dont nous abordons la gouvernance et la valorisation de la donnée. Notre objectif est que les BU disposent de capacités opérationnelles locales tout en tirant parti de services créés en central.”

-> Philippe Girolamy, VP of Engineering, Dailymotion

Philippe Girolamy, VP of Engineering de Dailymotion, insiste sur l'industrialisation du machine learning. Deux points sont particulièrement problématiques : d'abord bien s'assurer que les modèles correspondent véritablement à une préoccupation métier, ensuite faire en sorte que les modèles imaginés passent en production et soient véritablement utilisés.

Cela passe par du dialogue, de la collaboration, une définition des rôles de chacun, pour définir ensemble les modes de travail et critères clés de succès : "Renforcer la collaboration avec le produit et définir les attendus en termes de spécifications ont été clefs pour arriver à monter en production tous nos projets ces 4 dernières années."

Philippe GirolamiVP of Engineering, Dailymotion : “En ML, le travail est fini quand le modèle est en production”
Il n’y aura jamais assez d’ingénieurs dans une entreprise pour tout faire, il faut donc outiller les personnes qui se servent de la data et bien articuler les rôles et responsabilités entre les uns et les autres.

-> Laurent Ostiz - Global Chief Data Officer, Adeo

Laurent Ostiz, Global CDO d'Adeo, partage l'obligation de répondre à des besoins métiers. Il insiste aussi sur la nécessité de penser à l'expérience utilisateur : "Si la data doit aider les métiers à prendre des décisions, alors il faut penser à la façon dont on la présente et dont elle sera utilisée."

L'idée est d'aller au-delà des dashboards et autres reportings, pour intégrer directement l'information utile au sein des applications. "Le défi, c’est de rendre cela familier, de l’intégrer dans un processus métier adapté. C’est cela, le sens du MLOps : le machine learning devient une fonctionnalité d’un produit digital."

Dernier élément pour s'assurer que la démarche est véritablement industrielle : valider que la donnée est bien utilisée, qu'elle est utile aux métiers. Mesurer sa valeur, en fait.

Laurent Ostiz - Global Chief Data Officer, Adeo : “Le ML devient une fonctionnalité d’un produit digital”
Je préfère une approche un peu plus scientifique, et considérer la donnée comme un outil pour résoudre des problèmes. Cela évite de tomber dans le travers de faire de la data pour faire de la data.
Share this post