Imprimer cette page

Le data lake, fondement de l’entreprise agile

Tribunes libres Écrit par  mercredi, 07 décembre 2016 10:00 Taille de police Réduire la taille de la police Augmenter la taille de police
Évaluer cet élément
(1 Vote)

La capacité d’une entreprise à exploiter rapidement et efficacement ses données est devenu un critère essentiel pour évaluer son potentiel sur le marché. Mais avant de pouvoir tirer profit de ces données, parfois très volumineuses, encore faut-il pouvoir les stocker. A l’heure où les entreprises sont en pleine transformation digitale, il est crucial de comprendre « comment » et « où » fédérer la multitude de données qui affluent.

Il y a peu, les data wharehouses s’imposaient encore comme une évidence pour stocker un référentiel de données, mais aujourd’hui, les data lakes sont en première ligne au sein des entreprises à la pointe de la technologie. Alors, véritable révolution ou simple effet de mode ?

Data wharehouses : tenants et aboutissants

Héritage d’une approche traditionnelle de l’IT, les data wharehouses demeurent la solution la plus courante d’agréger des informations issues de sources hétérogènes à des fins analytiques et décisionnelles (BI). Les data wharehouses sont utilisés pour stocker des données « propres » que les entreprises ne veulent pas mélanger avec d’autres données. C’est l’un des processus liés au Big Data qui aident les entreprises à extraire et exploiter les données les plus précieuses pour leur activité. De plus, par rapport aux data lakes, les data wharehouses sont souvent utilisés pour stocker des versions plus « agrégées » des mêmes données sous la forme de rapports structurés.

Mais les augmentations massives de volumes de données générées ont largement fragilisé leur usage. Peu évolutifs, ils ont du mal à suivre le rythme et ne disposent peut-être plus des atouts nécessaires pour répondre aux besoins de stockage croissants des entreprises, ni des moyens requis pour accéder et analyser rapidement les données collectées.

Data lakes : tenants et aboutissants

De nombreuses entreprises se demandent quelles données conserver ou détruire, et comment procéder. Appliquant le principe de précaution, nombre d’entre elles préfèrent conserver la totalité de leurs données, même celles qui n’ont pas de valeur commerciale immédiate. C’est ici que les data lakes entrent en scène. Face aux problématiques de stockage des données, ils permettent de conserver les données dans leur source d’origine, jusqu’à ce qu’elles trouvent une utilité.

Les avantages des data lakes sont multiples, et c’est pourquoi cette technologie rencontre un franc succès et alimente les conversations parmi les spécialistes des données. S’ils servent de socle aux data wharehouses, les data lakes se caractérisent par une grande évolutivité et permettent de stocker des fichiers de données à moindre coût, tous formats confondus. Cette flexibilité revêt une importance particulière pour la myriade de nouvelles entreprises digitales qui génèrent des données de toutes sortes et de toutes dimensions, souvent hébergées sur le cloud.

Avec un data lake, les flux d’informations proviennent de différents référentiels, mais sont compilés en un seul endroit. Grâce à la possibilité d’accepter ces multiples sources, les data lakes préservent à la fois la fidélité des données d’origine et l’historique des transformations qu’elles ont connues. Des modèles de données émergent ainsi au fil du temps en fonction de l’utilisation, au lieu d’être imposés d’emblée.
Certes, toute nouvelle tendance ou solution de stockage de données s’accompagne d’inévitables inconvénients. En raison de la nature « non structurée » des data lakes, les entreprises doivent jongler avec les différents équipements et logiciels nécessaires pour traiter les informations et les exploiter indépendamment des systèmes, applications et autres infrastructures utilisés. Par ailleurs, de multiples entreprises sont pénalisées par l’absence de talents capables de réellement exploiter et analyser les données pour générer des renseignements exploitables.

Mais le principal défi porte en fait sur les possibilités fondamentales d’intégration des données entre différents magasins de données hétérogènes. S’il est sans nul doute intéressant d’effectuer des essais dans des environnements réduits, les technologies actuellement disponibles ne permettent pas toujours d’avoir une vue panoramique des utilisations et avantages effectifs d’un data lake. Dans ces environnements peu étendus, les data lakes permettent d’accéder à des données uniques.

En conclusion, une entreprise choisira un data lake ou un data warehouse pour stocker ses informations en fonction de la structure de ses données, de leur accessibilité et de leur organisation. Si l’une ou l’autre approche peut trouver sa place au sein des entreprises, le paysage numérique en pleine mutation semble montrer que les data lakes conviennent davantage aux entreprises qui osent prendre les devants.

Par Nicolas du Manoir, Vice-Président Régional de Progress pour la France

Lu 3560 fois
La rédaction

Le service Rédaction a pour mission de sélectionner et de publier chaque jour des contenus pertinents pour nos lecteurs internautes à partir d’une veille approfondie des communiqués de presse pour alimenter les rubriques actualité économiques, actualités d’entreprises, études ou encore actualités sectorielles. Pour échanger avec notre service Rédaction web et nous faire part de vos actualités, contactez-nous sur redaction@gpomag.fr