Ajouter un commentaire

Datadobi StorageMap : l'importance d'une carte des données

Par:
ftonic

ven, 15/07/2022 - 11:12

StorageMap a été lancé au printemps 2022 par l'éditeur Datadobi. L’objectif de la plateforme est simple : organisation, visualiser les données non structurées. Le but de la plateforme est de migrer les données locales, et dans le cloud, vers d’une nouvelle plateforme de données, par un exemple un datalake ou tout autre service de stockage de données non structurées. StorageMap veut répondre à 4 éléments clés : la maîtrise des coûts de migration et de la donnée, conformité, réduction des risques, obtenir plus de valeur sur les données. 

Dans tout projet de migration de données, de workload, il faut tout d’abord avoir une vue globale de ce que l’on a, permettant de définir ce que l’on veut/peut migrer, laisser sur place ou décommissionner (on retire des données de la circulation). De là, on peut planifier et réaliser la migration. 

L’un des enjeux, comme le rappelle Datadobi, est de savoir exactement ce que l’entreprise possède comme données : type de données, volumes, sur quels serveurs, savoir s’il s’agit de données chaudes ou froides, etc. Bref, il faut établir une cartographie la plus précise possible des données mais aussi qui les utilisent, comment et avec quelles applications. Trop souvent, les entreprises connaissent mal leurs données et les usages qui en sont faits. Un outil comme StorageMap va donc regarder dans les recoins, dans le moindre serveur. A partir de cette cartographie, il est possible de connaître la nature des données et comprendre comment elles sont consommées (si elles le sont). 

A partir de cette cartographie, il est possible d’organiser les données, voire, de les réorganiser, définir les données chaudes (utilisées et critiques), les données froides, et les données mortes que ne sont plus utilisées (au-delà d'un seuil à définir) mais toujours dans le système d’informatique. Il faut alors prévoir un décommissionnement : les retirer du système sans que cela affecte un service ou des applications. Parfois il y a des données tellement obscures qu’il faut les regarder pour comprendre leurs structures et leurs natures, à condition qu’il soit toujours possible de les « consommer » pour les comprendre. Avec beaucoup de chance, une documentation technique, ou des commentaires dans un fichier ou le code d'une app, donnera la réponse.

Cette cartographie peut rapidement devenir complexe quand vous êtes dans des contextes de rachats d’entreprises ou dans des organisations décentralisées ou avec x filiales et bureaux en province par exemple. Il y a des données spécifiques à chaque bureau ou des doublons qu’il faut retirer surtout si ces doublons ne sont pas synchrones. StorageMap peut alors aider la DSI à comprendre les données au-delà du siège ou du SI central.

Par exemple, sur un serveur, 10 To de données sont découverts et analysées. Résultat : 60 % des données sont utilisées depuis moins d’un an, 30 % ne sont plus utilisées et anciennes de plus de 5 ans, 10 % des données sont utilisées depuis 2 et 4 ans. Cette situation vous permet de prendre des décisions : migrer les données mortes (+ de 5 ans) vers un stockage froid ou supprimer ces données. 

A partir de ce travail de réorganiser / de compréhension, vous pouvez mettre en place un plan de migration : faire des PoC, simuler l’impact sur le stockage, les applications, sur le réseau et la consommation énergétique et les coûts. La migration peut aussi consister à consolider vos serveurs : relocaliser les données sur moins de serveurs, migrer des données vers workloads cloud pour moderne, déduplicer. Bien entendu, vous ne faites jamais une migration d'un bloc surtout si vous migrez des dizaines de To. La migration big bang est aussi hasardeuse que dangereuse. StorageMap, et cette approche de migration des données, s’adresse à de gros volumes de données et aux grandes organisations. Pour quelques To de données, l'outil aura peu d'intérêts. 

Au final, StorageMap fournira une vision consolidée et plus claire de vos données. A vous de continuer à bien organiser, sinon, rapidement, vous vous retrouverez avec des données anarchiques et vous perdrez la vision de celles-ci. C’est pour cela que la cartographie doit être maintenue et constamment actualisée. Cette contrainte concerne toutes les équipes : métiers / fonctionnels, les Ops, les responsables données, les dévs, le DSI, etc. StorageMap vous accompagne sur toute la stratégie de migration et surtout, la plateforme se veut agnostique du fournisseur cloud par exemple : un service S3 (AWS ou d’un autre service compatible) vers un autre service compatible S3. Vous pouvez aussi appliquer des stratégies de synchronisation / réplication et de restauration (notamment via des snapshots). 

Filtered HTML

Plain text

CAPTCHA
Cette question permet de vérifier que vous n'êtes pas un robot spammeur :-)
  CCC  ZZZZZ  H  H      J  PPPP  
C Z H H J P P
C Z HHHH J PPPP
C Z H H J J P
CCC ZZZZZ H H JJJ P