Le royaume des données structurés et non structurés "at scale" est le Data Lake

Portrait de femme dans la tech : Angi Guyard

Quatre portraits, quatre voix. Non pour ériger des modèles, mais pour élargir notre regard sur la tech. Avec Women’s Vision, il s’agit moins de célébrer que d’écouter. Accueillir les voix discrètes, les chemins sinueux. Et reconnaître d’autres façons d’habiter la tech.

La course folle des LLM

La course à la performance des IA occulte souvent leur utilité réelle. L’histoire prouve que l’adoption passe par la simplicité, non la puissance. Et si notre rapport à l’IA devait changer de cap ?

Le royaume des données structurés et non structurés "at scale" est le Data Lake

Un Data Lake est un référentiel central qui permet aux entreprises, aux gouvernements et à d'autres organisations de stocker toutes leurs données structurées et non structurées à n'importe quelle échelle.

< Les plateformes Data sont au centre de toutes les plateformes IT

Les lacs de données sont conçus pour stocker de grandes quantités de données dans un format brut, non traité, et pour fournir une source unique de vérité pour les données à travers l'organisation.

L'objectif d'un lac de données est de permettre aux organisations de stocker et de gérer toutes leurs données structurées ou non en un seul endroit, et de rendre ces données facilement accessibles aux spécialistes des données, aux analystes et aux autres utilisateurs. Pour ce faire, les lacs de données utilisent généralement un système de fichiers distribué, tel que Hadoop (HDFS), pour stocker les données, et ils fournissent souvent des outils et des interfaces pour l'ingestion des données, leur transformation et leur accès.

L'utilisation d'un lac de données présente un certain nombre d'avantages clés, dont les suivants :

L'évolutivité : Les lacs de données sont conçus pour stocker de grandes quantités de données à n'importe quelle échelle.
La flexibilité : Les lacs de données peuvent stocker des données structurées, non structurées et semi-structurées.
La rentabilité : Les systèmes actuels de lacs de données permettent de stocker de grandes quantités de données à moindre frais.

Dans l'ensemble, un lac de données est un référentiel central de stockage et de gestion de grandes quantités de données, conçu pour permettre aux organisations d'extraire davantage de valeur du rapprochement de leurs actifs data.

Du prompt engineering au context engineering : la revanche des ingénieurs

Portrait de femme dans la tech : Angi Guyard

La course folle des LLM

Le royaume des données structurés et non structurés "at scale" est le Data Lake

Salim ELAKOUI