Datawarehouse e Business Intelligence: Strumenti open source per soluzioni enterprise

In un precedente articolo abbiamo dato la classica definizione di data warehouse (l’articolo può essere letto qui).

Ora vediamo quali sono gli strumenti che si possono usare seguendo ovviamente una logica open source come da nostra prassi:

  1. Una buona conoscenza di cosa è e cosa non è un datawarehouse;
  2. Un buon database server;
  3. Una buona suite di Business Intelligence (BI nel seguito) per poter estrapolare informazioni dai dati contenuti nel data warehouse costruito;

Per quanto riguarda il punto 1 non c’e’ che un percorso: documentarsi in rete, leggere e studiare qualche buon libro teorico, sperimentare alcuni piccoli progetti di prova. Un percorso lungo che pero’ ne vale la pena se si vuole lavorare nel settore.

Per quanto riguarda il punto due le alternative open source da tenere in considerazione, ovviamente a mio parere, sono soprattutto due: Mysql e Postgresql. Nei nostri progetti scegliamo spesso Mysql ma non in modo esclusivo.

Per quanto riguarda il punto 3 da tempo abbiamo scelto la piattaforma Open Source  di Pentaho (esiste anche la versione commerciale). E nel seguito vediamo anche il perchè.

La piattaforma pentaho integra tutta una serie di prodotti utili per la costruzione di un sistema completo di BI:

  1. Mondrian: il motore Olap;
  2. Kettle: lo strumento ETL;
  3. Report Designer:tool visuale per creare analisi e report;
  4. Weka: il tool per le analisi di data mining;
  5. Dashboards: per creare cruscotti aziendali si semplice e immediato uso;
  6. Il server vero e proprio.

Il server pentaho, cuore del motore, puo’ essere eseguito dentro un web server Java EE compliant quale Apache Tomcat oppure Jboss. Questo componente provvede a garantire i servizi di scheduling, sicurezza, integrazione, navigazione dei contenuti, invio di e-mail e molto altro.

Il sistema è abbastanza semplice da installare e da provare sugli ambineti più comuni quali Microsoft Windows, Linux, Mac OS X avendo la pazienda di scaricare  molte decine di megabyte dal sito di pentaho oppure dal classico Sourceforge.

In un prossimo articolo vedremo come installare il server e gli altri applicativi necessari al progetto. Per adesso se volete provare installate il server e visualizzate gli esempi che vengono installati con essi.

Articoli Correlati

Password: gli utenti usano ancora password troppo semplici

I tempi passano ma alcune brutte abitudini rimangono.  Le password che l’utente medio utilizza sui sistemi informatici sono ancora troppo semplici.

Da recenti studi, sembra che le password più usate siano queste:

  1. 12345
  2. 123456
  3. qwerty
  4. 65432
  5. password
  6. il nome della persona
  7. il login
  8. 12345678
  9. 111111
  10. etc…

Beh che dire… sono troppo semplici ed espongono l’utente ad una molteplicità di problemi: furto di credenziali, accessi non desiderati, e molto altro.

Eppure metodi semplici ci sono: utilizzare maiuscole minuscole all’interno di una frase che conoscete, utilizzare i numeri, aggiungere qualche simbolo speciale.

Facciamo un esempio.

Utilizziamo una semplice password: password. Troppo semplice vero? Proviamo a complicarla:

  1. PaSSwoRd
  2. !PAssw0RD! (non è una o, è uno zero)
  3. !P455m0rD! (qui abbiamo giocato che la a rovesciata è simila al 4 e la s è simile al 5)

Semplice no? e non sono neanche molto semplici da trovare, neanche con un attacco brute force.

Ma vediamo le linee quida canoniche per creare password complesse e difficili da individuare:

  • lunghe almeno 8 caratteri
  • non deve essere un termine con un senso compiuto che puo’ essere messo in relazione con la persona o con il sistema sul quale viene utilizzato
  • non deve essere rintracciabile su un comune vocabolario (in qualsiasi lingua)
  • non deve essere costituita esclusivamente da una successione di cifre
  • deve contenere lettere maiuscole, minuscole, cifre, simboli e ogni altro carattere normalmente disponibile sulla tastiera
  • non devono essere troppo difficili da ricordare
  • non vanno scritte su foglietti o altri supporti
  • vanno cambiate spesso (almeno ogni tre mesi)
  • si devono utilizzare password diverse per sistemi diversi
  • non utilizzare a rotazione un ristretto numero di password.

Tutto qui. Non è semplicissimo ma neanche impossibile. A voi ora il divertimento di trovare password difficili!!

Articoli Correlati

Un sistema di gestione di gruppi di lavoro: e-groupware

Nella nostra filosofia di utilizzo di sistemi open source per il lavoro quotidiano nella nostra azienda, da qualche anno utilizziamo, e proponiamo ai nostri clienti, una applicazione estremamente flessibile per la gestione di gruppi di lavoro multi utente web based: e-groupware.

La raffinata gestione degli utenti e/o dei gruppi lo rende particolarmente adatto all’utilizzo in intranet aziendali, soprattutto quando si sviluppano e si monitorizzano progetti condivisi.

La sua struttura modulare è composta da:

  1. agenda condivisa tra gli utenti con un raffinato sistema di permessi e di esportazione dei dati in modalità standard verso altri dispositivi;
  2. una rubrica condivisa e/o personale con tutti i campi necessari gia’ predisposti ma a cui si possono aggiungere campi personalizzati;
  3. un document management integrato in cui si possono indicizzare tutti i documenti di una azienda, con una semplice gestione del versioning (noi abbiamo qualcosa come un 20.000 documenti all’interno e tutto funziona molto bene)
  4. un file manager per ogni singolo utente del sistema;
  5. la possibilità di gestire tutte le attività di un singolo e/o di un gruppo quali: cose da fare, e-mail, note, chiamate telefonica, con una raffinata gestione dell’avanzamento del lavoro stesso;
  6. un modulo per la gestione dei progetti a cui si possono allegare attività, documenti, fogli ore;
  7. un modulo per gestire correttamente le risorse di una azienda quali le sale riunioni, macchine particolari, strumenti condivisi;
  8. Un modulo relativo al foglio ore in cui indicare quanto tempo si è utilizzato per un progetto, per una attività, per un cliente;
  9. per chi si occupa di software un buon bug tracking;
  10. un modulo per la creazione di un proprio portale intranet per la condivisione del lavoro aziendale;
  11. un modulo per la gestione delle proprie mail;
  12. un modulo wiki, abbastanza semplice ma completo;
  13. un modulo per la gestione di una semplice bacheca elettronica (poco utilizzato, noi troviamo più utile il modulo wiki)
  14. un bel modulo per la gestione della conoscenza aziendale;
  15. molto altro ancora in quanto è possibile creare proprie applicazioni e moduli grazie alle API messe a disposizione dal sistema

Che dire, associato alla semplicità dell’installazione su qualsiasi piattaforma (Mac, Linux, Windows) e alla fruizione dei contenuti tramite un semplice browser (Internet Explorer, Mozilla Firefox, Opera, Safari e tanti altri) lo rendono un prodotto che tutte le aziende dovrebbero avere.

Articoli Correlati

Siae ed equo compenso.

E’ la notizia che sta infervorando i siti internet ed i blog oggi.

Oggi se ne sono lette di tutti i tipi sia pro che contro. Io vorreri riportare l’articolo scritto su pmi.it da Noemi Ricci che spiega molto bene quali saranno i costi per gli utilizzatori di apparati informatici in ambito professionale (e quindi che al 99% non comprano sistemi per fare copie illegali). Per tutti i link visitate l’articolo originale.

Ecco l’articolo che vi riporto per comodità.

“Il Decreto Bondi ha introdotto una sorta di tassa su dispositivi di archiviazione di massa che memorizzano opere protette da diritti d’autore: sconcerto tra imprese e consumatori. Rincari sui prodotti e disincentivo all’innovazione?

Sconcerto e allarme nel mondo Hi-Tech dopo la firma del Decreto di rideterminazione del compenso per “Copia privata” del Ministro Sandro Bondi: da ora in poi dovrà essere stabilita una quota anticipata per il diritto d’autore, da pagare all’acquisto di memorie di massa (cellulari, pc, dvd, cd, penne USB, smartphone, lettori mp3 e tutti i dispositivi che consentano la riproduzione di opere audiovisive protette dalla legge 633/41 sul diritto d’autore).

Una sorta di tassa, che di fatto porterà all’aumento del prezzo dei prodotti hi-tech, come stabilito in un apposito allegato tecnico.

L’equo compenso per copia privata, regolamentato nell’art. 71 septies della legge sul copyright viene dunque esteso a tutti i dispositivi tecnologici dotati di memoria, proprio in un momento di crisi che richiederebbe incentivi piuttosto che balzelli.

Quantificando, i prezzi aumenteranno proporzionalmente alla capacità di memoria: ad esempio 36 centesimi per una chiavetta Usb da 4 Giga, 50 centesimi per un Dvd riscrivibile, quasi 10 euro in più per i dischi rigidi da 15 Giga montati sui lettori Mp3 e 30 euro per un hard disk da 250 gigabyte.

Ad autori ed editori verrà preventivamente corrisposto l’ammontare dei diritti stabilito, anche qualora gli utenti utilizzino questi dispositivi per registrare opere originali.

È però necessario sottolineare che l’allegato tecnico al decreto prevede un sistema automatico di adeguamento degli aumenti coatti dei costi su base annuale, e nell’arco di un triennio anche mediante un tavolo di lavoro, al quale parteciperanno tutti i soggetti interessati. La SIAE potrà stabilire, per talune categorie di utilizzi o settori, delle esenzioni dai pagamenti.

Scontente le associazioni dei consumatori come Altroconsumo, che giudica il decreto un «favore alla Siae ingiusto soprattutto perché applicato sulle tasche dei consumatori in un momento di crisi».

Il presidente di Confidustria Anie l’ha definito «l’unico esempio di penalizzazione dell’innovazione» e ha descritto come profondamente iniqua la sua estensione a tecnologie come cellulari, pc, decoder e console di gioco che non hanno come funzionalità principale la duplicazione di contenuti digitali.

La Società Italiana degli Autori ed Editori risponde alle accuse sottolineando che l’equo compenso non è una tassa e descrivendo questa azione come «un capitolo di rilevante importanza per la tutela dei contenuti culturali in Italia».

Per la SIAE, «si è colmato un vuoto normativo che sacrificava il ruolo dei titolari dei diritti sulle opere dell’ingegno da più di 6 anni» e che permette all’Italia di allinearsi ai principi e alle regole che l’Unione Europea. “

Articoli Correlati

Utilizzare wget dietro un proxy

Wget è una utility che viene utilizzata moltissimo su server unix in assenza di interfaccia grafica. E’ utilizzato per scaricare pagine web (o interi siti in locale) e per automatizzare alcuni processi includendolo in script eseguibili sia per operazioni riguardanti il protocollo HTTP che per il protocollo FTP.

Molto spesso in ambito aziendale  i server sono confinati dietro ad un proxy per l’accesso alla rete e quindi?

Ecco un breve tutorial per bypassare la situazione:

  1. Bisogna settare una variabile d’ambiente: in linux aprire un terminale (oppure inserire nello script) e digitare export http_proxy=”http://proxy.esempio.it:8080” avendo cura di inserire il vostro indirizzo del proxy e la porta su cui è in ascolto;
  2. utilizzare il comnado wget http://url da visitare;

Nel caso in cui volete utilizzare il protocollo ftp:

  1. La variabile d’ambiente da settare è diversa: export ftp_proxy=”ftp://proxy.esempio.it:8080
  2. Utilizzare il comando wget ftp://url da visitare;

Nel caso il vostro server proxy necessiti di autenticazione, i passi sono molto simili in ambedue i casi:

  1. Settare la variabile d’ambiente in questo modo: export http_proxy="http://username:password@proxy.esempio.it:8080" (la modifica è ovvia per l'ftp)
  2. Utilizzare il comando come al solito

Articoli Correlati

Installare java su distribuzione ubuntu

Capita spesso, molto spesso di utilizzare java su ubuntu.

Per installarlo è molto semplice:

  1. Aprire un terminale;
  2. Digitare sudo apt-get update;
  3. Digitare sudo apt-get install sun-java6-jdk;
  4. Rispondere yes alla domanda ed accettare i termini di licenza;
  5. Digitare sudo gedit /etc/environment sullo stesso terminale;
  6. Aggiungere alla fine del file la seguente riga: JAVA_HOME=”/usr/lib/jvm/java-6-sun” e salvare;
  7. Se volete attivare subito la variabile digitare source /etc/environment. Per abilitarla pero’ su tutte le sessioni dovrete  scollegarvi e ricollegarvi;
  8. Se vi serve anche il supporto java su Mozilla Firefox dovete installare anche il plugin con  sudo apt-get install sun-java6-plugin

Articoli Correlati