Al realizar una investigación, a veces se hace necesario analizar datos comparando más de dos muestras o grupos. Un tipo de prueba de estadística inferencial, el análisis de varianza (ANOVA), permite el examen de varias muestras al mismo tiempo con el fin de determinar si existe una relación significativa entre ellas. El razonamiento es idéntico a las pruebas t, solo el análisis de varianza incluye variables independientes de dos o más muestras. Se determinan las diferencias entre muestras, así como la diferencia dentro de una muestra. ANOVA se basa en cuatro supuestos: el nivel de medición, el método de muestreo, la distribución de la población y la homogeneidad de la varianza.
Para determinar si las diferencias son significativas, ANOVA se ocupa de las diferencias entre las muestras y dentro de ellas, lo que se denomina varianza. El ANOVA puede averiguar si la varianza es mayor entre muestras en comparación con la de los miembros de la muestra. Si se determina que esto es cierto, las diferencias se consideran significativas.
La realización de una prueba ANOVA implica la aceptación de ciertas suposiciones. La primera es que se utiliza el método de muestreo aleatorio independiente y la elección de miembros de la muestra de una sola población no influye en la elección de miembros de poblaciones posteriores. Las variables dependientes se miden principalmente a nivel de razón de intervalo; sin embargo, es posible aplicar el análisis de varianza a medidas de nivel ordinal. Se puede asumir que la población está distribuida normalmente, aunque esto no es verificable, y las varianzas poblacionales son las mismas, lo que significa que las poblaciones son homogéneas.
La hipótesis de investigación asume que al menos una media es diferente de las otras, pero las distintas medias no se identifican como mayores o menores. Solo se predice el hecho de que existe una diferencia. El ANOVA prueba la hipótesis nula, lo que significa que no hay diferencia entre todos los valores medios, de manera que A = B = C. Esto requiere establecer el alfa, refiriéndose al nivel de probabilidad donde se rechazará la hipótesis nula.
El índice F es un estadístico de prueba que se usa específicamente para el análisis de varianza, ya que el puntaje F muestra dónde comienza el área de rechazo para la hipótesis nula. Desarrollada por el estadístico Ronald Fisher, la fórmula para F es la siguiente: F = estimación de la varianza entre grupos (MSB) dividida por la estimación de la varianza dentro del grupo (MSW), de modo que F = MSB / MSW. Cada una de las estimaciones de varianza consta de dos partes: la suma de los cuadrados (SSB y SSW) y los grados de libertad (gl). Utilizando las Tablas estadísticas para investigación biológica, agrícola y médica, se puede establecer el alfa y basarse en esto, y se puede rechazar la hipótesis nula de que no hay diferencia. Se puede concluir que existe una diferencia significativa entre todos los grupos, si ese es el caso.