Le développement augmenté existe d’ores et déjà. Souvent regardés de haut, les outils de GenAI sont une évolution naturelle des fonctionnalités d’autocomplétion. À adopter d’urgence pour en tirer tous les bénéfices.
Même si l'IA est privilégiée, il faut toujours partir de la stratégie et des problèmes à résoudre, prévient la HBR, dont l'approche 3P fait écho au Tech, Orga, Culture de WEnvision.
"The Software Architect Elevator" est une de feuille de route pour les architectes. En embrassant le changement, en comprenant les systèmes organisationnels et en favorisant une communication efficace, les architectes peuvent jouer un rôle central en conduisant les organisations vers le succès.
Il n'est pas évident de s'y retrouver dans toutes ces approches de mise en oeuvre de l'IA générative, voici un guide pour comprendre et choisir l'approche qui sera la plus adaptée à votre contexte.
En plus de présenter chaque approche, je vous propose de les comparer sur les axes d'analyses suivants :
🔵 Exactitude (dans quelle mesure les réponses peuvent-elles être exactes ?)
Complexité de la mise en œuvre (dans quelle mesure la mise en œuvre peut-elle être complexe ?)
🔵 Effort (Quel effort faut-il pour mettre en œuvre ?)
🔵 Coût total de possession (TCO) (Quel est le coût total de possession de la solution ?)
🔵 Facilité des mises à jour et des modifications (dans quelle mesure l'architecture est-elle faiblement couplée ? Dans quelle mesure est-il facile de remplacer/mettre à niveau les composants ?)
Présentation des approches
🔍Prompting : Parfaite pour les cas d'utilisation ne nécessitant pas un contexte de domaine profond, cette méthode offre une grande flexibilité sans nécessiter de compétences en programmation avancées.
🔍Génération Augmentée par la Recherche (RAG) : Idéale si vous cherchez à maintenir une haute qualité de réponse tout en ayant la possibilité de modifier différents composants (sources de données, embeddings, modèles de langage, moteurs vectoriels).
🔍Affinage (Fine-tuning) : Choisissez cette approche pour un contrôle accru sur l'artefact du modèle et la gestion de sa version, particulièrement quand les terminologies spécifiques au domaine sont cruciales.
🔍Entrainement de modèle (Training) : La route à prendre si aucune des options ci-dessus ne répond à vos besoins et que vous disposez de données bien organisées, d'une infrastructure sophistiquée et de budgets conséquents.
Comparatif de chaque approche
1. Ingénierie des Prompts :
Précision : Produit les résultats les moins précis par rapport aux autres méthodes, bien que les résultats puissent sembler impressionnants isolément.
Complexité de mise en œuvre : Relativement faible, nécessite peu ou pas de compétences en programmation.
Effort : Nécessite beaucoup d'efforts itératifs pour affiner les prompts et obtenir la réponse correcte.
Coût total de possession (TCO) : Assez faible, principalement lié à la maintenance des modèles de prompt.
Flexibilité aux changements : Très élevée, les modèles de prompts peuvent être facilement modifiés pour s'adapter à de nouvelles versions de FM ou à de nouveaux FM.
2. Génération Augmentée par la Recherche (RAG) :
Précision : Fournit des résultats de haute qualité, avec une précision améliorée par rapport à l'ingénierie des prompts grâce à l'utilisation de contextes spécifiques.
Complexité de mise en œuvre : Plus élevée que l'ingénierie des prompts en raison des compétences en codage et en architecture nécessaires.
Effort : Exige un niveau d'effort modéré, supérieur à celui de l'ingénierie des prompts.
Coût total de possession (TCO) : Plus élevé que pour l'ingénierie des prompts, en raison des multiples composants impliqués.
Flexibilité aux changements : La plus élevée, permettant des modifications indépendantes des différents composants.
3. Fine-tuning :
Précision : Produit des résultats très précis, potentiellement de qualité légèrement supérieure à celle de RAG, en fonction du cas d'usage.
Complexité de mise en œuvre : Plus élevée que pour l'ingénierie des prompts et RAG, nécessitant une expertise en science des données et en ML.
Effort : Plus important que pour les deux autres méthodes, même si le fine-tuning peut nécessiter relativement peu de données.
Coût total de possession (TCO) : Plus élevé que pour RAG et l'ingénierie des prompts en raison de la puissance de calcul requise et de la compétence technique nécessaire.
Flexibilité aux changements : Faible, car des changements dans les données ou les entrées nécessitent un nouveau cycle de fine-tuning.
4. Training :
Précision : Produit les résultats de la plus haute qualité, avec les chances les plus faibles d'erreurs par rapport aux autres approches
Complexité de mise en œuvre : La plus élevée, nécessitant une grande quantité de données, de l'expertise en science des données et en ML
Effort : Le plus élevé, impliquant un développement itératif considérable pour obtenir un modèle optimal.
Coût total de possession (TCO) : Le plus élevé, en raison des besoins élevés en matière de traitement de données et d'entraînement du modèle.
Flexibilité aux changements : La plus faible, car les mises à jour du modèle nécessitent de nouveaux cycles d'entraînement.
L'IA générative était (surprise !) la vedette du keynote de l'AWS Summit Paris, ce 3 avril au Palais des Congrès. C'est LE sujet qui tire le Cloud et la Data.
La valeur est une notion souvent mal comprise en raison de sa nature subjective. Mais qu’entend-on exactement par valeur ? Comment fait-on pour la mesurer ou l’analyser ? Surtout, comment la mettre au cœur d’une stratégie produit ?
L'IA générative impacte toutes les fonctions de l'entreprise, y compris le recrutement - il est important de l'anticiper pour rester performant sur un marché tendu.