Qu’est-ce qu’une probabilité empirique ?

La probabilité empirique est un calcul de probabilité basé sur l’occurrence réelle d’un certain type d’événement. Elle est distincte de la probabilité estimée ou théorique, qui produit une valeur basée sur des principes généraux plutôt que sur des faits observés. La probabilité empirique décrit un processus plus inductif, qui diminue l’erreur résultant de modèles incorrects mais augmente l’erreur résultant d’événements aléatoires.

Un exemple simple pour comprendre les deux types de probabilités est un simple retournement de pièces répété. Disons qu’une pièce est retournée 100 fois. Il revient face 54 fois et face 46 fois. Il y a deux manières différentes d’estimer la probabilité que le prochain lancer soit face. La probabilité théorique est de 50 %. Cette probabilité reste constante d’un flip à l’autre. La probabilité empirique, quant à elle, est de 54 %. La pièce est tombée face 54% du temps jusqu’à présent; sur la seule base de ces données, on pourrait s’attendre à ce qu’il soit légèrement plus susceptible de revenir face à face. La probabilité empirique change avec l’arrivée de nouvelles données. Si après 200 lancers, la pièce est retournée 104 fois face, la probabilité empirique que la prochaine pièce soit face est maintenant de 52%.

Plus il y a de données, plus les probabilités empiriques deviennent fiables. Si le modèle pour produire la probabilité théorique est bon – dans l’exemple ci-dessus, si la pièce est juste – les probabilités théoriques et empiriques convergeront à mesure que la taille de l’échantillon augmente. Après un million de lancers de pièces, un observateur doit s’attendre à ce que la probabilité empirique soit très proche de la probabilité prédite, 50 %.

Plus les deux types de probabilités divergent, plus un observateur peut envisager de modifier les paramètres de son modèle de probabilité théorique. Dans le sophisme du joueur classique, dans lequel une pièce revient 99 fois face, un manuel de mathématiques de base dira que la prochaine pièce a encore 50 % de chances d’être pile. Cette réponse est basée sur l’hypothèse que la pièce est juste : qu’elle a un poids et une résistance à l’air uniformément répartis, qu’elle est lancée de manière efficace et aléatoire, et ainsi de suite. La probabilité estimée pourrait indiquer au joueur dans cette situation que la pièce n’est pas juste. Un écart extrême par rapport à la probabilité théorique suggère qu’il peut y avoir quelque chose qui ne va pas avec l’une des hypothèses utilisées pour le calculer.

La probabilité empirique ne doit pas toujours être le double de la probabilité théorique. Il peut être utilisé pour calculer la probabilité d’un événement dont on sait peu de choses. Par exemple, si une personne retournait un objet à deux faces dont les deux côtés ont des propriétés différentes, elle pourrait s’appuyer davantage sur un élément empirique de la probabilité qu’il atterrisse sur un certain côté. Encore une fois, plus elle dispose de données, meilleure est la qualité de son calcul empirique.

Les personnes travaillant dans les domaines de l’économie et de la finance pourraient bien utiliser la probabilité empirique pour éclairer leurs décisions. Un économiste, après avoir créé un modèle théorique de marché, devrait vouloir vérifier ses calculs par rapport à un calcul empirique des probabilités impliquées. Elle pourrait s’appuyer fortement sur des probabilités empiriques pour remplir des coefficients dans son modèle qu’elle n’aurait peut-être pas d’autre moyen de calculer. Dans la pratique, les modèles économiques utiles combinent presque toujours des éléments de probabilité théorique et empirique.