Roma +39 0644254074 - Milano +39 0240031289 info@eurokleis.com
Menu

Nuovi strumenti per la gestione dei big data

La Sfida

La rivoluzione dei Big Data ha ridefinito le modalità di gestire i dati delle imprese. Se da una parte sono aumentate le informazioni in maniera esponenziale aprendo le possibilità a nuove capacità analitiche, dall’altra ha comportato un’accelerazione tecnologica, spinta soprattutto dal mondo open source, verso quei tool quali Apache Hadoop e Spark e quelle tecnologie che permettono di gestire vaste quantità di dati.

Il nuovo paradigma di archiviazione dei dati, cloud-based, struttura i dati in una maniera più scalabile e permette di effettuare infinite sperimentazioni sui dati.

James Dixon, CTO di Pentaho società specializzata in business intelligence, nell’ottobre 2010 per la prima volta introduceva il termine data lake sul suo blog con la seguente definizione:

Se si pensa a un datamart come a un negozio di acqua in bottiglia – depurata, confezionata e strutturata per essere consumata con facilità – il data lake è una grande distesa d’acqua in uno stato più naturale. Il contenuto del data lake affluisce da sorgenti di dati e vari utenti del lake possono esaminarlo, immergervisi o prelevare campioni.

La differenza fondamentale tra le strutture di archiviazione tradizionali quali Data Silos o Data Warehouse e un data lake, è che dove un data warehouse memorizza i dati in maniera strutturata, un data lake fa uso di una architettura piatta. Ogni elemento riceve un identificatore e un insieme di metadati a corredo. Il data lake può così essere interrogato alla ricerca di dati rilevanti, che possono essere successivamente analizzati alla ricerca di risultati specifici.

Il data lake permette di aggirare il problema della rigidità iniziale della progettazione tipica dei Data Silos e dei DWH e abbatte la proliferazione delle banche dati strutturate. Al posto di molteplici repository di dati gestiti indipendentemente l’uno dall’altro, si può optare per un data lake il cui uso facilita e velocizza la condivisione dell’informazione e contemporaneamente favorisce l’abbattimento dei costi indotti relativi a server e licenze.

La Soluzione

Eurokleis, ha una lunga esperienza di consulenza per clienti che gestiscono grandi moli di dati ed operanti nei settori delle telecomunicazioni (ICT), del trasporto aereo e della logistica.

In funzione di ogni scenario, Eurokleis ha le competenze per indirizzare il cliente nella scelta della soluzione migliore: Data Silos, ODS (Operational Data Store), DWH o Data Lake.

Il team di Eurokeis offre i seguenti servizi:

  • studi di fattibilità
  • assessment
  • analisi dei requisiti e delle funzionalità
  • audit tecnologico
  • progettazione di architetture tecniche
  • progettazioni di banche dati strutturate
  • realizzazione di data lake
  • change management e knowledge trasfer

 

Digital Business: novità nella gestione dei dati

In uno scenario in cui i dati arrivano a flusso continuo da innumerevoli fonti i sistemi informativi devono consentirne l’archiviare e rendere disponibili le informazioni nel momento stesso in cui se ne presenta la necessità.

Questo implica una efficienza tecnologica che elimini i tempi di latenza tra richiesta e disponibilità del dato e una efficienza infrastrutturale che permetta rapide riconfigurazioni per garantire accessi tempestivi ai dati utilizzando nuove variabili in tempo reale.

Tutti i numeri del Big Data

fonte Gartner

%

delle organizzazioni non è sicuro di come ottenere valore dai Big Data

%

ritiene che definire una strategia per i Big Data sia una delle difficoltà principali

%

afferma che le abilità con i Big Data siano rare e costose

Data Warehouse vs Data Lake

Dati

Data Warehouse: dati strutturati, caricamenti organizzati e gestiti delle informazioni con applicazione delle regole di business

Data Lake: Dati strutturati, semi strutturati, non strutturati, raw

Elaborazione

Data Warehouse: Schema on write

Data Lake: Schema on read

Archiviazione

Data Warehouse: Costosa per grandi volumi di dati

Data Lake: Disegnata per mantenere bassi i costi

~

Sicurezza

Data Warehouse: Matura

Data Lake: in fase di consolidamento

Flessibilità

Data Warehouse: Poco flessibile, configurazione iniziale difficilmente modificabile

Data Lake: Molto flessibile, possibilità di configurare e riconfigurare in base alle necessità

Autore dell’articolo

Luca Satolli

senior partner & founder - Technology

IT Manager con competenze trasversali acquisite con il tempo

Background Experience Passion

Potresti essere interessato anche ai seguenti articoli:

Start-up innovative

Hai un’idea imprenditoriale che pensi possa avere successo? Vuoi sapere se la tua impresa può usufruire delle agevolazioni destinate alle “start-up innovative”?

Sviluppo del Business Model
L’azienda ha successo solo se crea valore. Il business modelling è perciò fondamentale per gestire con efficacia la propria idea imprenditoriale