Datawarehouse e Business Intelligence: Strumenti open source per soluzioni enterprise

In un precedente articolo abbiamo dato la classica definizione di data warehouse (l’articolo può essere letto qui).

Ora vediamo quali sono gli strumenti che si possono usare seguendo ovviamente una logica open source come da nostra prassi:

  1. Una buona conoscenza di cosa è e cosa non è un datawarehouse;
  2. Un buon database server;
  3. Una buona suite di Business Intelligence (BI nel seguito) per poter estrapolare informazioni dai dati contenuti nel data warehouse costruito;

Per quanto riguarda il punto 1 non c’e’ che un percorso: documentarsi in rete, leggere e studiare qualche buon libro teorico, sperimentare alcuni piccoli progetti di prova. Un percorso lungo che pero’ ne vale la pena se si vuole lavorare nel settore.

Per quanto riguarda il punto due le alternative open source da tenere in considerazione, ovviamente a mio parere, sono soprattutto due: Mysql e Postgresql. Nei nostri progetti scegliamo spesso Mysql ma non in modo esclusivo.

Per quanto riguarda il punto 3 da tempo abbiamo scelto la piattaforma Open Source  di Pentaho (esiste anche la versione commerciale). E nel seguito vediamo anche il perchè.

La piattaforma pentaho integra tutta una serie di prodotti utili per la costruzione di un sistema completo di BI:

  1. Mondrian: il motore Olap;
  2. Kettle: lo strumento ETL;
  3. Report Designer:tool visuale per creare analisi e report;
  4. Weka: il tool per le analisi di data mining;
  5. Dashboards: per creare cruscotti aziendali si semplice e immediato uso;
  6. Il server vero e proprio.

Il server pentaho, cuore del motore, puo’ essere eseguito dentro un web server Java EE compliant quale Apache Tomcat oppure Jboss. Questo componente provvede a garantire i servizi di scheduling, sicurezza, integrazione, navigazione dei contenuti, invio di e-mail e molto altro.

Il sistema è abbastanza semplice da installare e da provare sugli ambineti più comuni quali Microsoft Windows, Linux, Mac OS X avendo la pazienda di scaricare  molte decine di megabyte dal sito di pentaho oppure dal classico Sourceforge.

In un prossimo articolo vedremo come installare il server e gli altri applicativi necessari al progetto. Per adesso se volete provare installate il server e visualizzate gli esempi che vengono installati con essi.

Articoli Correlati

Password: gli utenti usano ancora password troppo semplici

I tempi passano ma alcune brutte abitudini rimangono.  Le password che l’utente medio utilizza sui sistemi informatici sono ancora troppo semplici.

Da recenti studi, sembra che le password più usate siano queste:

  1. 12345
  2. 123456
  3. qwerty
  4. 65432
  5. password
  6. il nome della persona
  7. il login
  8. 12345678
  9. 111111
  10. etc…

Beh che dire… sono troppo semplici ed espongono l’utente ad una molteplicità di problemi: furto di credenziali, accessi non desiderati, e molto altro.

Eppure metodi semplici ci sono: utilizzare maiuscole minuscole all’interno di una frase che conoscete, utilizzare i numeri, aggiungere qualche simbolo speciale.

Facciamo un esempio.

Utilizziamo una semplice password: password. Troppo semplice vero? Proviamo a complicarla:

  1. PaSSwoRd
  2. !PAssw0RD! (non è una o, è uno zero)
  3. !P455m0rD! (qui abbiamo giocato che la a rovesciata è simila al 4 e la s è simile al 5)

Semplice no? e non sono neanche molto semplici da trovare, neanche con un attacco brute force.

Ma vediamo le linee quida canoniche per creare password complesse e difficili da individuare:

  • lunghe almeno 8 caratteri
  • non deve essere un termine con un senso compiuto che puo’ essere messo in relazione con la persona o con il sistema sul quale viene utilizzato
  • non deve essere rintracciabile su un comune vocabolario (in qualsiasi lingua)
  • non deve essere costituita esclusivamente da una successione di cifre
  • deve contenere lettere maiuscole, minuscole, cifre, simboli e ogni altro carattere normalmente disponibile sulla tastiera
  • non devono essere troppo difficili da ricordare
  • non vanno scritte su foglietti o altri supporti
  • vanno cambiate spesso (almeno ogni tre mesi)
  • si devono utilizzare password diverse per sistemi diversi
  • non utilizzare a rotazione un ristretto numero di password.

Tutto qui. Non è semplicissimo ma neanche impossibile. A voi ora il divertimento di trovare password difficili!!

Articoli Correlati