L'IA générative, accélérateur ou frein à la gouvernance de vos données?

L'IA générative s'avère être un excellent levier pour initier rapidement la gouvernance de vos données. On vous explique comment.

L'IA générative, accélérateur ou frein à la gouvernance de vos données?
Un enfant court dans l'herbe (généré par Reve.art)

Lorsque vous souhaitez acheter une voiture, vous attendez-vous à ce qu’elle soit “faite main”? Assurément, non.

En effet, la robotique a tellement impacté la construction automobile depuis le robot Unimate de General Motors sorti en 1961 qu’il est devenu impensable d’entrer dans un objet capable de nous transporter à 130km/h qui n’aurait pas été assemblé et testé par des machines.

L’IA générative (abrégée en “GenAI”) promet-elle un impact comparable pour la gouvernance des données de votre organisation par rapport à une gouvernance des données historiquement “faite main”?

Gouverner ses données, qu’est-ce que ça veut dire?

Julien Levy, professeur associé à HEC Paris, l'a défini clairement:

“La gouvernance des données est une opportunité de créer une relation de confiance avec le Client.

Cette confiance se créé par la mise en place de rôles, de processus et d'outils (catalogue des données, data marketplace...) visant à définir, tracer, qualifier et sécuriser les données.

Ainsi, la gouvernance des données permet:

  • Création de valeur à l’échelle pour les consommateurs de données (employé.e.s, partenaires business et clients) par l’usage de services data-centric (comme les agents GenIA) et de produits de données (“Data Products”), un concept bien connu des adeptes du Data Mesh,
  • Conformité des usages faits des données au regard des réglementations (RGPD, AI Act...),
  • Réduction des risques liés aux données (fuites, accès non-autorisé, réputation, utilisation inappropriée).

Gouverner ses données, historiquement, c’est long

Pour cela, votre organisation a besoin de créer des contenus (glossaire de termes métier, règles de qualité des données, modèles de données...) puis de relier ces métadonnées aux assets data (tables, colonnes...) dans son catalogue des données pour rendre ces assets data découvrables, observables et accessibles. Ca a l'air simple, n'est-ce pas?

Pourtant, ces étapes sont souvent chronophages - car dépendantes des ressources humaines disponibles dans l’organisation à l’instant T - et difficiles à initier en raison du syndrome de la page blanche. Ce temps passé grève le moment où l’organisation va récolter les fruits de ses investissements.

Alors comment réduire ce “time-to-value”?

Accélérer grâce à l'IA générative...

Avec la GenAI, vous pouvez en un rien de temps créer un glossaire métier contextuel à votre organisation par l’utilisation d'un assistant GenAI :

  • configuré comme un "Expert sémantique" à l'aide d'un prompt "système" ad-hoc,
  • alimenté grâce à la fonctionnalité de RAG par votre documentation pertinente (fiches produits, spécifications fonctionnelles...),
  • questionné via des prompts spécialisés.

A l'aide d'un nouvel assistant GenAI cette fois configuré en "Expert en qualité des données" et toujours alimenté via RAG par la documentation pertinente (glossaire métier, modèles physiques de sources de données, requêtes SQL des Data Engineers...), vous pourrez très rapidement extraire des règles de qualité de données selon la plupart de ses dimensions (cohérence, précision, complétude, fraîcheur,...).

... ou sortir de route à cause de l'IA générative

Attention, tout n'est pas rose pour une organisation souhaitant utiliser la GenAI! Comme tout modèle d'IA, la GenAI reproduira les biais présents dans les données d'entraînement, ce qui peut compromettre la neutralité des contenus générés.

Aussi, la confidentialité des données constitue un enjeu majeur dans l'utilisation de la GenAI, puisque y envoyer des données sensibles sans garde-fous expose l'organisation à des risques de fuites de données. Mon conseil ici? Impliquez directement vos experts métier épaulés par vos équipes facilitatrices (cybersécurité, juridique et conformité) pour classifier vos données sensibles.

Enfin, les hallucinations inhérentes à la GenAI peuvent générer des contenus erronés, d'où l'importance d'une étape de validation humaine systématique et d'une gouvernance de l'IA elle-même.

Quels prérequis pour réussir?

Tout d'abord, il est indispensable de déployer une plate-forme de GenAI interne à votre organisation et intégrée à votre SI, tout en évaluant la maturité GenAI de vos employé.e.s.

Ensuite, il convient d'acculturer et former vos employé.e.s à l'usage de cette plate-forme GenAI pour leur permettre d'en tirer les avantages tout en minimisant les risques associés.

Enfin, développer, tester puis mesurer l'adoption de nouvelles fonctionnalités sur la plate-forme (exemple: assistant GenAI spécialisé) permettra un pilotage en transparence d'une telle initiative, à l'aide de KPI tels que:

  • Fréquence d'utilisation des assistants GenAI par les Data Owners et Data Stewards dans leurs tâches de documentation des assets data, pour mesurer l'adoption de la GenAI.
  • Ratio du temps moyen de documentation d'un asset data "via assistant GenAI" versus "via Humain", pour justifier les gains de temps annoncés.
  • Taux d'asset data documentés "via assistant GenAI" ET validés par un humain, pour visualiser l'impact de l'initiative sur le patrimoine data de votre organisation.

Un gain de temps non négligeable en vue

Tout ceci est déjà à portée de main, puisque le cabinet Mckinsey annonce une étape d'évaluation de l’accessibilité et de la qualité des données (“Assess data availability and quality” dans le texte) jusqu’à 3 fois plus rapide grâce à la GenAI.

Vous l’aurez compris, des assistants GenAI savamment configurés et alimentés peuvent accélérer la gouvernance des données au sein de votre organisation, pourvu que votre documentation de valeur soit identifiée, vos employé.e.s formé.e.s et que les contenus générés soient validés par les sachants pour garantir la cohérence d'ensemble.

Le robot industriel fête ses 50 ans
En 1961, General Motors installait dans l’une de ses usines du New Jersey le premier robot industriel. Aujourd’hui, ils sont plus d’un million sur la

Pour en savoir plus sur l'Unimate

The missing data link: Five practical lessons to scale your data products
As companies increasingly rely on data to innovate and grow, scaling data products has become a top strategic issue. We look at how to unlock this new value.

L'intégration de l'IA générative dans les data products, vue par McKinsey

Génial ! Vous vous êtes inscrit avec succès.

Bienvenue de retour ! Vous vous êtes connecté avec succès.

Vous êtes abonné avec succès à WENVISION.

Succès ! Vérifiez votre e-mail pour obtenir le lien magique de connexion.

Succès ! Vos informations de facturation ont été mises à jour.

Votre facturation n'a pas été mise à jour.