Il termine “sistema di analisi statistica” viene utilizzato per fare riferimento a un software che consente all’utente di eseguire analisi statistiche su set di dati. Un altro termine comunemente usato per questo tipo di software è linguaggio di programmazione statistica. Quando in maiuscolo, Statistical Analysis System (SAS) è anche il nome proprio di uno dei più noti pacchetti software di questo tipo.
Un sistema di analisi statistica fornisce l’automazione e la potenza di elaborazione necessarie per facilitare la manipolazione e l’analisi dei set di dati. Questi pacchetti facilitano il calcolo di statistiche sia descrittive che induttive. I calcoli statistici descrittivi comunemente usati includono il calcolo della tendenza centrale, della distribuzione di frequenza e dell’associazione. L’analisi statistica induttiva che può essere eseguita con un sistema di analisi statistica include test di ipotesi statistiche, come il test t, il test z e il test chi-quadrato. Molti sistemi di analisi statistica supportano anche altri test, come l’analisi della varianza (ANOVA) e i suoi parenti, e vari tipi di test di regressione.
I sistemi di analisi statistica sono utilizzati in un’ampia varietà di contesti. Gli scienziati naturali e sociali negli ambienti di ricerca accademica e commerciale sono gli utenti più frequenti di questi tipi di pacchetti software. Le aziende possono anche utilizzare un sistema di analisi statistica per la ricerca operativa, la gestione dei progetti e altre applicazioni di business intelligence.
Con alcuni pacchetti software, l’interfaccia a riga di comando (CLI) viene utilizzata più spesso, mentre altri dispongono principalmente di un’interfaccia utente grafica (GUI), spesso con menu a discesa. La maggior parte dei pacchetti software fornisce funzionalità sia CLI che GUI, anche se l’utente potrebbe non essere in grado di accedere a tutte le funzionalità da entrambe le interfacce. Sebbene una GUI sia più familiare per gli utenti non tecnici, l’utilizzo di una CLI per creare programmi consente una replica più semplice delle analisi.
Molti pacchetti software statistici utilizzano linguaggi di programmazione di quarta generazione (4GL). Grazie al loro livello di astrazione più elevato e alla sintassi più naturale, la manipolazione e l’analisi dei dati in 4GL è più rapida e semplice rispetto ai linguaggi di programmazione di livello inferiore. Prima dello sviluppo del 4GL, l’analisi statistica assistita da computer era complicata e richiedeva una maggiore esperienza di programmazione.
È disponibile un gran numero di applicazioni software di analisi statistica con varie interfacce, capacità ed estensioni. Le applicazioni software proprietarie rimangono popolari, ma anche molte applicazioni software open source sono ampiamente utilizzate. Praticamente tutti i pacchetti software statistici verranno eseguiti su sistemi operativi Windows® e la maggior parte dispone anche di versioni Macintosh® e Linux®. Alcune applicazioni sono compatibili anche con i sistemi operativi Unix®.