Che cos'è la modernizzazione del Cloud Data Warehouse?
La modernizzazione del Cloud Data Warehouse è il processo che consente all'ambiente del data warehouse di soddisfare in modo costante i requisiti aziendali, in rapida evoluzione. Il Cloud Data Warehouse è in continua evoluzione; ciò rende l'ottimizzazione del data warehouse un elemento critico per garantire alle aziende un accesso tempestivo ai dati e agli strumenti di analisi. La modernizzazione del Cloud Data Warehouse offre supporto per nuove fonti di dati e apre la strada a nuove soluzioni.
Vantaggi della modernizzazione dei Data Warehouse su Cloud e dell'adozione dell'architettura Hybrid Cloud
L'adozione dell'architettura Hybrid Cloud garantisce efficienza operativa
Gestire un unico database di grandi dimensioni è più semplice che gestirne molteplici di dimensioni ridotte. Lo storage ibrido rappresenta il modello più scalabile mai concepito in questo ambito; esso combina lo storage su cloud con lo storage a oggetti (object storage) locale (on-premise). Ciò garantisce la trasparenza dei dati e ne semplifica la gestione. Un'architettura Hybrid Cloud è in grado di tracciare i dati indipendentemente dal loro punto di origine o di archiviazione. Il modello ibrido mantiene tutti i metadati in locale, facilitando le operazioni di ricerca sia sul Cloud che in ambiente on-premise.
Accesso a un'interfaccia standard ampiamente riconosciuta
L'adozione di un'interfaccia standard per lo storage locale e quello su cloud ha rivoluzionato il settore. Tale interfaccia standard consente di ridurre i costi e di garantire l'interoperabilità. Le API S3 rappresentano lo standard per lo storage ibrido: un'interfaccia nata originariamente nell'ambito dello storage su cloud, ma ora disponibile anche per lo storage a oggetti in ambiente on-premise. Amazon, Google e Microsoft fanno tutte affidamento sullo storage a oggetti per le proprie infrastrutture cloud. Questa standardizzazione dell'interfaccia è fondamentale, poiché conferisce ai responsabili IT la capacità di utilizzare strumenti standard sia in locale che sul Cloud. Tale standardizzazione facilita inoltre il trasferimento dei dati tra i due ambienti, ottimizzando così i costi, le prestazioni e la durabilità dei dati stessi.
Maggiori opzioni di implementazione in base alle proprie esigenze
Ogni organizzazione ha esigenze di storage differenti e necessita di flessibilità operativa per soddisfarle. Le aziende possono scegliere tra un'ampia gamma di opzioni: da soluzioni a costo iniziale nullo fino a sistemi caratterizzati da un'enorme capacità di archiviazione e un elevato valore strategico. Sono disponibili molteplici offerte in grado di soddisfare le esigenze di storage su cloud sia a breve che a lungo termine. Grazie a un'interfaccia standard, utilizzabile sia in ambiente on-premise che sul Cloud, è possibile individuare e testare la soluzione più idonea. È possibile soddisfare contemporaneamente le esigenze di accesso rapido ai dati e quelle di archiviazione a lungo termine (archival storage) avvalendosi di un set standardizzato di strumenti e tecniche.
Protezione dei dati di altissima qualità, accessibile a tutti
La protezione dei dati rappresenta l'aspetto più critico nell'ambito dello storage. Un modello di storage ibrido offre un livello di protezione dei dati decisamente superiore alle aziende di qualsiasi dimensione. In passato, solo le grandi imprese ad alto valore strategico potevano permettersi un tale livello di protezione. Lo storage ibrido garantisce un'incredibile durabilità dei dati. Questo modello consente di mantenere una copia dei dati in sede (on-site) per un ripristino rapido, e una copia esterna (off-site) per un efficace piano di disaster recovery. I dati archiviati esternamente comportano costi ridotti e costituiscono un archivio ideale per la conservazione a lungo termine. Le più diffuse soluzioni di backup, quali Veritas, Commvault e Rubrik, offrono specifici connettori per Amazon S3. Questi connettori S3 consentono di implementare questa soluzione in modalità "drop-in".
Dati ibridi e regole di governance dei dati
Esistono regole di governance dei dati, sia interne che esterne, che svolgono un ruolo fondamentale nella pianificazione dell'archiviazione dei dati. In un sondaggio, il 60% degli intervistati ha dichiarato di dover conservare una certa quantità di dati in locale (on-premise). Più della metà di essi ha affermato che solo la metà dei propri dati potrebbe essere caricata sul Cloud. La governance interna ed esterna ha un impatto significativo sulle modalità di archiviazione dei dati sensibili, quali le informazioni personali e i dati finanziari. Grazie a un modello di cloud ibrido, è possibile gestire agevolmente tali variabili. Un modello di dati ibrido consente di personalizzare le regole relative alla migrazione e alla protezione dei dati.
Errori da evitare nella progettazione della modernizzazione di un Data Warehouse su Cloud
Concentrarsi esclusivamente sulle attuali esigenze aziendali
Gli investimenti effettuati nella progettazione di un data warehouse risultano più fruttuosi nel lungo termine; i ritorni a breve termine non sono garantiti. Pertanto, concentrarsi esclusivamente sulle attuali esigenze aziendali sarebbe un errore. In una situazione ideale, nella fase di progettazione del data warehouse, si dovrebbe tenere in considerazione la roadmap quinquennale dell'organizzazione. È necessario dedicare la medesima attenzione sia alla strategia aziendale che agli aspetti tecnici.
Mancanza di attenzione al livello dei metadati
Una progettazione inadeguata dei metadati può rivelarsi estremamente dannosa durante la realizzazione di un data warehouse. I metadati fungono da elemento integratore tra i modelli di dati, i processi ETL (Extract, Transform, Load) e la Business Intelligence (BI). Spesso, la documentazione del livello dei metadati risulta frammentaria e viene creata unicamente per soddisfare criteri sui dati di natura miope. È essenziale inserire le descrizioni di tabelle e colonne già nella fase stessa di progettazione del data warehouse. Ogni qualvolta gli utenti aziendali rifiutano report di BI che non riescono a decifrare, il problema risiede principalmente in modelli di dati mal progettati, privi di descrizioni comprensibili e caratterizzati da standard di denominazione incoerenti. Tutto ciò può essere prevenuto definendo un'adeguata strategia per i metadati fin dalle prime fasi della progettazione del data warehouse.
Sottovalutazione delle query ad hoc e della BI Self-Service
Talvolta, la generazione di un semplice report può assorbire una notevole quantità di banda e compromettere la produttività del team IT. Tuttavia, investire in una soluzione di BI Self-Service semplifica tale compito, sfruttando il livello dei metadati per la generazione dei report. Questa modalità di BI Self-Service non compromette l'integrità e la purezza del modello di dati sottostante.
Privilegiare il design visivo rispetto alla velocità
Nella fase di progettazione, l'attenzione dovrebbe concentrarsi sulla facilità d'uso e sulla rapidità del sistema. Gli utenti aziendali apprezzano grafici e report accattivanti, ma non bisogna cedere alla tentazione di sacrificare la velocità sull'altare dell'estetica. È comprovato che un tempo di risposta rapido nella generazione dei report riveste un'importanza fondamentale per guadagnare il favore degli utenti. Un report semplice può richiedere pochi secondi per essere caricato, mentre un grafico – se eccessivamente focalizzato sull'aspetto estetico – potrebbe impiegarne anche tre minuti. Pertanto, è opportuno dare priorità alla velocità rispetto al design visivo.
Ignorare la qualità dei dati prima della finalizzazione del progetto di modernizzazione del Data Warehouse su Cloud
Una grande quantità di dati viene raccolta a livello di data mart. Il data warehouse deve contenere dati puliti e accurati, in quanto rappresenta la fonte primaria di riferimento. Se i dati non sono puliti e precisi, l'output del sistema presenterà delle discrepanze. Ciò farebbe ricadere ogni sospetto sulla progettazione e sui processi del data warehouse. Pertanto, è necessario seguire solidi processi di data governance per mantenere i dati puliti.
Conclusione:
Le esigenze in termini di dati dell'ambiente aziendale sono in continua evoluzione. Le aziende devono individuare nuovi metodi per gestire e fornire tali dati alle proprie attività operative. La modernizzazione del Data Warehouse risponde alla maggior parte dei requisiti del settore attuale. Un data warehouse può essere gestito e accessibile con facilità, sia in modalità on-premise che su Cloud. Un numero crescente di aziende avverte la necessità di orientarsi verso un data warehouse basato su Cloud, al fine di soddisfare le proprie esigenze in ambito dati.




