Las estadísticas inferenciales son datos que se utilizan para hacer generalizaciones sobre una población a partir de una muestra. Se basan en el uso de una técnica de muestreo aleatorio diseñada para garantizar que una muestra sea representativa. Un ejemplo simple de estadísticas inferenciales probablemente se puede encontrar en la portada de casi cualquier periódico, con cualquier artículo que afirme que «el X% de la población Y piensa / hace / siente / cree Z». Una afirmación como «el 33% de las personas de entre 24 y 30 años prefiere el pastel al pastel» se basa en estadísticas inferenciales. No sería práctico interrogar a todos los jóvenes de entre 24 y 30 años sobre sus preferencias en cuanto a los postres, por lo que, en cambio, se encuestó a una muestra representativa de la población con el objetivo de hacer una inferencia sobre la población en general.
Estadística inferencial y descriptiva
Otra forma de utilizar los datos de la encuesta es la estadística descriptiva. En este caso, se realizan declaraciones que simplemente describen los datos recopilados. Es posible que el mismo conjunto de datos se utilice de forma descriptiva o inferencial. Por ejemplo, en el período previo a una elección en los EE. UU., 1,000 personas en una ciudad podrían ser interrogadas sobre sus intenciones de voto, con el resultado de que 430 dijeron que votarían por los demócratas, 410 dijeron que votarían por los republicanos, y 160 estaban indecisos o no querían decirlo. . Un ejemplo de utilizar estos datos de forma descriptiva sería afirmar simplemente que el 43% de las 1,000 personas entrevistadas en esta localidad tienen la intención de votar por los demócratas. Una declaración inferencial sería «Los demócratas tienen una ventaja del 2%»; una inferencia sobre las intenciones de voto en general se ha extraído de una muestra.
Métodos
Antes de sacar conclusiones generales de una muestra, es importante emplear los métodos correctos; de lo contrario, estas conclusiones pueden no ser válidas. Las fuentes comunes de error están en la forma en que se junta la muestra, y varios factores pueden influir en la validez de la población de la muestra. El tamaño es fundamental, porque cuanto menor es el tamaño, mayor es el riesgo de que la muestra no sea representativa de la población en su conjunto. También se debe tener cuidado para eliminar las fuentes de sesgo. En el ejemplo anterior, factores como la edad, el género y los ingresos pueden tener una influencia considerable sobre las intenciones de voto, por lo que si la muestra no se compuso de tal manera que refleje a la población general, la conclusión puede no ser válida.
Los métodos de muestreo deben elegirse con cuidado; por ejemplo, si alguien tomó una muestra de conveniencia que incluía cada décimo nombre en la guía telefónica o cada décimo transeúnte en un centro comercial, esta muestra podría no ser válida. El sesgo de la muestra también es una consideración. Por ejemplo, es posible que los jóvenes de 10 a 10 años que asistan a una convención de amantes de la tarta tengan más probabilidades de disfrutar de la tarta que de la tarta, lo que significaría que una encuesta sobre preferencias de postres que utilizara a los asistentes a la conferencia como muestra no sería muy representativa.
Utiliza materiales de
El uso de estadísticas inferenciales es una piedra angular de la investigación sobre poblaciones y eventos, porque generalmente es difícil, ya menudo imposible, encuestar a cada miembro de una población u observar cada evento. En cambio, los investigadores intentan obtener una muestra representativa y la utilizan como base para conclusiones más generales. Por ejemplo, no habría sido posible verificar los registros médicos de todos los fumadores para establecer un vínculo entre el tabaquismo y el cáncer de pulmón, pero se han establecido firmemente numerosas muestras aleatorias que comparan a fumadores con no fumadores y eliminan otros factores de riesgo. este enlace.
Los investigadores que trabajan con estadísticas inferenciales tratan de mantener sus métodos y prácticas transparentes y lo más rigurosos posible para garantizar la integridad de sus resultados. Las declaraciones basadas en encuestas informales y encuestas rápidas pueden no ser muy útiles, pero en áreas como la investigación médica y los ensayos clínicos, los estándares son mucho más estrictos y las estadísticas inferenciales han proporcionado una gran cantidad de información valiosa. En otras áreas, se utilizan todos los días para hacer amplias generalizaciones sobre las poblaciones que pueden dar forma a las políticas públicas, el diseño de productos, el marketing y las campañas políticas.