Un Data Warehouse è una raccolta di dati integrata, subject oriented, time variant e non-volatile di supporto ai processi decisionali. (Bill Inmon)
In pillole:
Obiettivi:
- Con un Dw si può accedere a tutti i dati dell’impresa, centralizzati in un dbms
- Coerenza e consolidamento dei dati
- Velocità nell’accesso alle informazioni
- Base di partenza per gli OLAP [(Online Analitical Processing: insieme di tecniche software per l'analisi interattiva e veloce di grandi quantità di dati.
E' la componente tecnologica base del Dw. Possiamo dire che l'elemento principale dell'architettura Olap è il Dw in cui appunto sono contenuti dati che se opportunamente analizzati possono fornire un supporto importante alle decisioni). I sistemi OLTP (Online Transaction Procession), finalizzati principalmente alla gestione dei dati in linea, forniscono i dati per l'ambiente Olap. Sono una sorgente di dati.
Tra i due sistemi cambia la tipologia di utente: terminalisti -->Oltp; analisti -->Olap. Gli strumenti Olap hanno come obiettivo la performance nella ricerca e il raggiungimento di un'ampiezza di interrogazione quanto più grande possibile. Sono sistemi per l'analisi dei dati. Gli Oltp invece sono sistemi per la gestione dei dati che possono svolgere un set di operazioni definito su una piccola quantità di dati.]
La creazione di un database olap permette di effettuare una fotografia delle informazioni a disposizione in un certo momento per poi trasformare queste singole informazioni in dati multidimensionali. Eseguendo delle query sui dati strutturati si possono ottenere risposte in tempi molto ridotti rispetto alle stesse operazioni effettuate su altre tipologie di database. Una delle strutture olap è il "cubo" multidimensionale. Il cubo più conosciuto è quello che utilizza lo schema "a stella" al centro di questa struttura regolare si costituisce una tabella che elenca i principali elementi su cui sarà costruita l'interrogazione, e collegate a questa tabella le varie tabelle delle "dimensioni" specificano come saranno aggregati i dati.
Il ciclo di vita di un dw parte dalla definizione degli obiettivi e del modello di elaborazioni necessarie, quindi procede con la progettazione delle estrazioni, con il successivo raffinamento dei dati necessari e infine giunge alla loro integrazione in un unico insieme, il dw appunto. Le informazioni in esso contenute vengono poi categorizzate e suddivise in data mart che vengono rilasciati agli utenti finali. Col termine DATAMART (letteralmente deposito di dati) si parla di un sotto-insieme del dw che contiene i dati del dw estratti per settorializzazione e totalizzazione.
Mentre il dw rappresenta l’intera base informativa direzionale di un’azienda, i differenti data mart rappresentano le sezioni logiche su di essa a disposizione delle varie aree aziendali. I data mart sono sottoposti a un processo di compattamento in funzione degli obiettivi settoriali così da risultare maneggevoli e veloci da usare.
Un dw può realizzare importanti operazioni come:
-il Drill-Down (permette di aggiungere una dimensione di analisi disaggregando i dati. Richiede la formulazione di una query),
-il Roll-Up (consente di eliminare una dimensione di analisi, l'operazione può essere svolta agendo sui dati dell'interrogazione),
-lo Slice and Dice (seleziona un sottoinsieme delle celle del cubo, ottenuto affettando e tagliando il cubo stesso).
Un report è una richiesta di specifici dati formattati. I report possono contenere attributi e fatti, filtri per determinare la quantità di dati utilizzata per generare il report e metriche per eseguire calcoli sui fatti.
* il Dw è orientato ai soggetti. I dati sono organizzati per soggetti (o argomenti) principali. Ogni soggetto è rappresentato astrattamente come un cubo ndimensionale (ipercubo).
* il Dw è integrato ed unico. Utilizza dati provenienti da più Db ed è composto da dati integrati (è necessaria una loro razionalizzazione e normalizzazione). I dati sono il risultato dell’attività di estrazione dei dati dalle sorgenti e organizzati per soggetti (o argomenti) principali;
* i dati non sono volatili e sono datati (storici). Il Dw può solo crescere con il tempo. Nuovi dati vengono inseriti in blocchi prelevandoli dalle opportune sorgenti dei dati.* il Dw è integrato ed unico. Utilizza dati provenienti da più Db ed è composto da dati integrati (è necessaria una loro razionalizzazione e normalizzazione). I dati sono il risultato dell’attività di estrazione dei dati dalle sorgenti e organizzati per soggetti (o argomenti) principali;
Obiettivi:
- Con un Dw si può accedere a tutti i dati dell’impresa, centralizzati in un dbms
- Coerenza e consolidamento dei dati
- Velocità nell’accesso alle informazioni
- Base di partenza per gli OLAP [(Online Analitical Processing: insieme di tecniche software per l'analisi interattiva e veloce di grandi quantità di dati.
E' la componente tecnologica base del Dw. Possiamo dire che l'elemento principale dell'architettura Olap è il Dw in cui appunto sono contenuti dati che se opportunamente analizzati possono fornire un supporto importante alle decisioni). I sistemi OLTP (Online Transaction Procession), finalizzati principalmente alla gestione dei dati in linea, forniscono i dati per l'ambiente Olap. Sono una sorgente di dati.Tra i due sistemi cambia la tipologia di utente: terminalisti -->Oltp; analisti -->Olap. Gli strumenti Olap hanno come obiettivo la performance nella ricerca e il raggiungimento di un'ampiezza di interrogazione quanto più grande possibile. Sono sistemi per l'analisi dei dati. Gli Oltp invece sono sistemi per la gestione dei dati che possono svolgere un set di operazioni definito su una piccola quantità di dati.]
La creazione di un database olap permette di effettuare una fotografia delle informazioni a disposizione in un certo momento per poi trasformare queste singole informazioni in dati multidimensionali. Eseguendo delle query sui dati strutturati si possono ottenere risposte in tempi molto ridotti rispetto alle stesse operazioni effettuate su altre tipologie di database. Una delle strutture olap è il "cubo" multidimensionale. Il cubo più conosciuto è quello che utilizza lo schema "a stella" al centro di questa struttura regolare si costituisce una tabella che elenca i principali elementi su cui sarà costruita l'interrogazione, e collegate a questa tabella le varie tabelle delle "dimensioni" specificano come saranno aggregati i dati.
Il ciclo di vita di un dw parte dalla definizione degli obiettivi e del modello di elaborazioni necessarie, quindi procede con la progettazione delle estrazioni, con il successivo raffinamento dei dati necessari e infine giunge alla loro integrazione in un unico insieme, il dw appunto. Le informazioni in esso contenute vengono poi categorizzate e suddivise in data mart che vengono rilasciati agli utenti finali. Col termine DATAMART (letteralmente deposito di dati) si parla di un sotto-insieme del dw che contiene i dati del dw estratti per settorializzazione e totalizzazione.
Mentre il dw rappresenta l’intera base informativa direzionale di un’azienda, i differenti data mart rappresentano le sezioni logiche su di essa a disposizione delle varie aree aziendali. I data mart sono sottoposti a un processo di compattamento in funzione degli obiettivi settoriali così da risultare maneggevoli e veloci da usare.
Un dw può realizzare importanti operazioni come:
-il Drill-Down (permette di aggiungere una dimensione di analisi disaggregando i dati. Richiede la formulazione di una query),
-il Roll-Up (consente di eliminare una dimensione di analisi, l'operazione può essere svolta agendo sui dati dell'interrogazione),
-lo Slice and Dice (seleziona un sottoinsieme delle celle del cubo, ottenuto affettando e tagliando il cubo stesso).
Un report è una richiesta di specifici dati formattati. I report possono contenere attributi e fatti, filtri per determinare la quantità di dati utilizzata per generare il report e metriche per eseguire calcoli sui fatti.
Nessun commento:
Posta un commento