Plaidoyer pour une modélisation des données à l'échelle de l'entreprise
Gouvernance, efficacité, performance... sont à portée de main, pourvu qu'on se penche sérieusement sur un processus fondamental qui structure l'information de son SI.
Maximiser les bénéfices des LLM à grande échelle : quels défis ? Rencontre avec Pierre-Carl Langlais, Ph.D. de l'Université de la Sorbonne, directeur de recherche chez Opsci et l'un des principaux spécialistes français des LLM.
Dans le paysage technologique et linguistique contemporain, les modèles de langage à grande échelle (LLM) occupent une place centrale et fascinante. Ces modèles ont révolutionné les capacités de traitement du langage naturel en s’étendant au-delà des frontières de la simple automatisation des tâches linguistiques. Ils ne se contentent pas de comprendre et de générer du texte. Ils sont également capables d'analyser des contextes complexes et de répondre à des questions variées. Les LLM émergent ainsi comme des outils polyvalents qui redéfinissent notre interaction avec la langue et ouvrent de nouvelles perspectives passionnantes pour l'avenir de l'Intelligence Artificielle.
Pour comprendre comment tirer le meilleur parti des LLM, nous avons interviewé Pierre-Carl Langlais. Docteur de l'Université de la Sorbonne et directeur de recherche chez Opsci, Pierre-Carl Langlais se distingue aujourd’hui comme l'un des rares experts français des LLM. En juillet 2023, il crée https://www.lebonllm.fr/ afin de favoriser le dynamisme de la communauté francophone impliquée dans la création de ces modèles. Cette plateforme se positionne comme le premier espace numérique français dédié à la compilation et à la diffusion de programmes, de corpus et de modèles aisément réutilisables dans le domaine de l'IA générative.
Dans la première partie de notre interview, Pierre-Carl Langlais explore les défis et les stratégies pour améliorer la robustesse des LLM. Il met en évidence l'importance de diversifier les données d'entraînement, notamment en utilisant des méthodes innovantes comme la création de corpus à partir des LLM. Le problème de l'anglicisation de ces modèles et de ses effets sur la diversité culturelle en français est également abordé. Enfin, Pierre-Carl Langlais examine les implications potentielles de l'adoption de l'AI Act sur l'utilisation et la régulation des LLM, envisageant un cadre réglementaire plus strict pour garantir une utilisation sécurisée et responsable de ces technologies.
La seconde partie de notre échange se concentre sur les stratégies-clés pour maximiser l'efficacité des LLM en entreprise. Pierre-Carl Langlais insiste sur l'importance d'une collaboration intersectorielle pour combiner expertise technique et connaissances métier afin de mieux exploiter les capacités des ces modèles. Il souligne également le rôle crucial d'une communauté dédiée aux LLM pour partager les connaissances et les expériences dans ce domaine en constante et rapide évolution. Deux domaines d'application principaux sont identifiés : l'optimisation de la gestion documentaire et l'amélioration de la communication d'entreprise. Ces utilisations promettent des gains de temps et d'efficacité, tout en soulevant des questions de sécurité et de confidentialité des données.