A probabilidade empírica é um cálculo da probabilidade com base na ocorrência real de um determinado tipo de evento. É diferente da probabilidade estimada, ou teórica, que produz um valor baseado em princípios gerais ao invés de fatos observados. A probabilidade empírica descreve um processo mais indutivo, que diminui o erro resultante de modelos incorretos, mas aumenta o erro resultante de eventos aleatórios.
Um exemplo simples para compreender os dois tipos de probabilidades é um simples lançamento de moeda repetido. Digamos que uma moeda seja jogada 100 vezes. Sai cara 54 vezes e coroa 46 vezes. Existem duas maneiras diferentes de estimar a probabilidade de que o próximo lançamento dê cara. A probabilidade teórica é de 50 por cento. Essa probabilidade permanece constante de um salto para o outro. A probabilidade empírica, por outro lado, é de 54%. A moeda deu cara 54% das vezes até agora; com base apenas nesses dados, pode-se esperar que seja um pouco mais provável que surja cabeças novamente. A probabilidade empírica muda com a chegada de novos dados. Se após 200 lançamentos, a moeda deu cara 104 vezes, a probabilidade empírica de a próxima moeda ser cara agora é de 52%.
As probabilidades empíricas se tornam mais confiáveis quanto mais dados existem. Se o modelo para produzir a probabilidade teórica for bom – no exemplo acima, se a moeda for justa – as probabilidades teóricas e empíricas convergirão conforme o tamanho da amostra aumenta. Depois de um milhão de lançamentos de moeda, um observador deve esperar que a probabilidade empírica esteja muito próxima da probabilidade prevista, 50%.
Quanto mais os dois tipos de probabilidade divergem, mais um observador pode considerar alterar os parâmetros de seu modelo de probabilidade teórica. Na falácia do jogador clássico, em que uma moeda sai cara 99 vezes, um livro de matemática básico dirá que a próxima moeda ainda tem 50% de chance de ser coroa. Essa resposta é baseada na suposição de que a moeda é justa: que ela tenha peso e resistência do ar uniformemente distribuídos, que seja lançada de forma eficaz e aleatória, e assim por diante. A probabilidade estimada pode dizer ao jogador nesta situação que a moeda não é justa. O desvio extremo da probabilidade teórica sugere que pode haver algo errado com uma das suposições usadas para calculá-la.
A probabilidade empírica nem sempre tem que ser o dobro da probabilidade teórica. Pode ser usado para calcular a probabilidade de um evento sobre o qual pouco mais se sabe. Por exemplo, se uma pessoa estiver virando um objeto de dois lados cujos dois lados têm propriedades diferentes, ela pode confiar mais em um elemento empírico da probabilidade de cair em um determinado lado. Mais uma vez, quanto mais dados ela tiver, maior será a qualidade de seu cálculo empírico.
Pessoas nas áreas de economia e finanças podem muito bem usar a probabilidade empírica para ajudar a informar suas decisões. Um economista, depois de criar um modelo teórico de mercado, deve querer comparar seus cálculos com um cálculo empírico das probabilidades envolvidas. Ela pode confiar fortemente em probabilidades empíricas para preencher coeficientes em seu modelo que ela pode não ter outra maneira de calcular. Na prática, os modelos econômicos úteis quase sempre combinam elementos de probabilidade teórica e empírica.