giovedì 3 giugno 2010

4) "Quando gli informatici si fermano alle rappresentazioni tabellari, gli statistici vanno oltre." (?)

L'informatica e la statistica utilizzano di termini differenti ma sinonimi per indicare gli elementi costituenti un database. Quando un informatico parla di campi o field, lo statistico parla ad esempio di variabili o caratteri, ma entrambi fanno riferimento ai dati inseriti nelle celle; così per l’informatico il singolo dato assume il nome di record, per lo statistico assume il nome unità; oppure il dato individuato da ogni colonna per l’informatico è il carattere, per lo statistico invece è l’attributo. La tabella della terminologia informatica (che può anche essere chiamata database) corrisponde concettualmente alla tabella statistica. Lo schema del database è, per gli informatici, la parte sostanzialmente invariante nel tempo della tabella stessa, cioè l’intestazione della tabella, data dal nome della tabella seguito dai nomi degli attributi. In informatica, le colonne della tabella prendono il nome di campi, mentre le righe (in cui ad ogni campo è associato un valore) prendono il nome di record.
La tabella di contingenza è una tabella di frequenza utilizzata in statistica per rappresentare e analizzare le relazioni tra due o più variabili. In questa tabella vi si riportano le frequenze congiunte delle variabili in una popolazione di riferimento, è quindi facilmente rapportabile al report aziendale in quanto si tratta di uno strumento che consente di valutare, attraverso informazioni prelevate da archivi diversi, lo stato di una azienda.
Il report aziendale è uno strumento che valuta, attraverso informazioni prelevate da archivi diversi, lo stato di salute di una qualsiasi società di persone o di capitali. Le fasi che vanno a costituire la reportistica sono sintetizzabili i tre punti: i dati, il software, risultato ed elaborazione.
Con il termine OLAP (On line Analitical processing) si vanno ad identificare sia gli strumenti che le tecniche di analisi di grosse quantità di dati. Rappresenta la tecnologia più avanzata per manipolare i dati nella maniera più semplice. Grazie ad un'interfaccia molto intuitiva gli utenti possono realizzare svariate queries ad-hoc, filtrare i dati, ruotare la tabella, espandere i dati, ottenere le somme desiderate, ecc.
Il principale oggetto di un applicazione olap è il Cubo, che fornisce una rappresentazione multidimensionale dei dati. Permette la memorizzazione dei dati e l'effettuazione di un'analisi in tempi rapidi. Il cubo olap può essere immaginato come una estensione del foglio di lavoro a due dimensioni. Ha da 3 ad un n numero di caratteristiche o dimensioni. Viene più propriamente chiamato Ipercubo, per la capacità di analizzare più di 3 dimensioni contemporaneamente, considerando i dati sia a livello di dettaglio, che in forma aggregata. Elementi di base: Le Dimensioni (Dimension) -->le tabelle che contengono gli attributi descrittivi delle misure (es: anno, studente, facoltà, etc). I lati del cubo contengono le dimensioni, mentre la singola cella contiene il valore relativo all’intersezione delle dimensioni. Le Misure (Measures) descrivono l’aspetto quantitativo. Sono valori aggregati ed analizzabili. L’aggregazione di una misura è eseguita in una porzione di dimensione in base ad un dato algoritmo (somma, media, etc.). Il cubo si crea suddividendo i campi del Db sorgente in dimensioni e misure. Il primo passo da eseguire, è la costruzione dell'istruzione SQL, con la quale si estraggono i dati dal database per alimentare il cubo. La tabella risultante, conterrà tutte le dimensioni da analizzare e le relative misure. Dopo aver selezionato il tipo progetto cubo, viene emesso il Wizard, nel quale si devono trascinare le dimensioni e le misure della tabella risultante. Confermando, si attiva il cubo.
- si possono ordinare i dati di qualsiasi dimensione, in ordine ascendente o discendente di dimensione (Sorting);
- si possono ordinare i dati di qualsiasi colonna o di qualsiasi riga, in ordine ascendente o discendente di misura della dimensione selezionata;
- si possono filtrare i dati di qualsiasi dimensione includendo solo quelli desiderati (Filtraggio/Filtering);
- si possono visualizzare i dati delle dimensioni sia in forma espansa che compressa, automaticamente per tutte le dimensioni verticali e/o orizzontali, oppure sulle singole dimensioni;
- si possono visualizzare i dati di una dimensione nei livelli di maggior dettaglio, effettuandone l'espansione, o comprimere le dimensioni, visualizzando i dati aggregati ai livelli superiori (Aggregazioni);

- Slice and Dice, una delle principali funzionalità olap, consente di ristrutturare le informazioni in modo da renderne più efficace la visualizzazione. Permette di selezionare un sottoinsieme delle celle del cubo, ottenuta “affettando e tagliando” a cubetti il cubo stesso, e selezionano e proiettano riducendo la dimensionalità dei dati. Slice taglia una fetta del cubo con restrizioni su una dimensione, Dice taglia un cubetto con restrizione su due o più dimensioni. - si può anche richiedere l'esposizione delle percentuali o dei Rank delle righe o delle colonne rispetto al totale delle stesse o al totale generale della griglia; - si può eseguire su qualsiasi misura del cubo, un'ampia gamma di funzioni (media, massimo,minimo,ecc.) e di operazioni di calcolo; - si possono rappresentare graficamente i dati esposti nella griglia, selezionando lo stile di diagramma desiderato tra un' ampia gamma di modelli disponibili. Qualsiasi funzione sulla griglia si riflette automaticamente sul grafico.
La Tabella a Doppia Entrata è una tabella a due variabili. Di fatto permette il confronto tra due entità, una posta sull'ascissa e una sull'ordinata e fra ciascuno degli elementi che la costituiscono per individuare relazioni esistenti o realizzabili.
La Tabella di Contingenza è un tipo di tabella a doppia entrata costituita da righe che rappresentano i possibili valori (o categorie) di una variabile e da colonne che rappresentano i possibili valori (o categorie) di una seconda variabile. I dati nel corpo della tabella sono il numero di volte in cui compare ogni coppia di valori/categorie

Nessun commento:

Posta un commento