Il teorema di Bayes, a volte chiamato regola di Bayes o principio di probabilità inversa, è un teorema matematico che segue molto rapidamente dagli assiomi della teoria della probabilità. In pratica, viene utilizzato per calcolare la probabilità aggiornata di qualche fenomeno target o ipotesi H dati nuovi dati empirici X e alcune informazioni di base, o probabilità a priori.
La probabilità a priori di alcune ipotesi è solitamente rappresentata da una percentuale compresa tra 0% e 100%, o un numero compreso tra 0 e 1. Questa probabilità è spesso chiamata grado di confidenza, ed è destinata a variare da osservatore a osservatore, poiché non tutti gli osservatori hanno avuto la stessa esperienza e quindi non possono fare stime di probabilità equivalenti per nessuna data ipotesi. L’applicazione del teorema di Bayes in un contesto scientifico si chiama inferenza bayesiana, che è una formalizzazione quantitativa del metodo scientifico. Consente la revisione ottimale delle distribuzioni di probabilità teoriche dati i risultati sperimentali.
Il teorema di Bayes nel contesto dell’inferenza scientifica dice quanto segue: “La nuova probabilità che un’ipotesi H sia vera (chiamata probabilità a posteriori) data la nuova evidenza X è uguale alla probabilità che osserveremmo questa evidenza X dato che H è effettivamente vera (chiamata probabilità condizionale, o verosimiglianza), moltiplicata per la probabilità a priori che H sia vera, il tutto diviso per la probabilità di X.”
Una riaffermazione comune di quanto sopra in termini di come il risultato di un test contribuisce alla probabilità che un dato paziente abbia il cancro può essere mostrata come segue:
p(positivo|cancro)*p(cancro)
_______________________________________________
p(positivo|cancro)*p(cancro) + p(positivo|~cancro)*p(~cancro)
La barra verticale significa “dato”. La probabilità che il paziente abbia il cancro dopo un risultato positivo su un determinato test del cancro è equivalente alla probabilità di un risultato positivo dato il cancro (derivato da risultati passati) per la probabilità precedente che una data persona abbia il cancro (relativamente basso) tutto diviso per stesso numero, più la probabilità di un falso positivo moltiplicata per la probabilità precedente di non avere il cancro.
Sembra complicato, ma l’equazione di cui sopra può essere utilizzata per determinare la probabilità aggiornata di qualsiasi ipotesi dato qualsiasi risultato sperimentale quantificabile.