?Qu? es la regresi?n lineal simple?

La regresi?n lineal simple se aplica a las estad?sticas y ayuda a describir datos (x, y) que parecen tener una relaci?n lineal, lo que permite cierta predicci?n de y si se conoce x. Estos datos a menudo se trazan en diagramas de dispersi?n y la f?rmula para la regresi?n lineal crea una l?nea que mejor se ajusta a todos los puntos, siempre que realmente tengan una correlaci?n lineal. No se ajustar? exactamente a todos los puntos, pero deber?a ser una l?nea donde la suma de los cuadrados de la diferencia entre los datos reales y los datos esperados (residuales) crea el n?mero m?s bajo, que a menudo se llama la l?nea o l?nea de m?nimos cuadrados. mejor ajuste. La ecuaci?n de la l?nea para datos de muestra y datos de poblaci?n son los siguientes: y = b0 + b1x e Y = B0 + B1x.

Cualquier persona familiarizada con el ?lgebra puede notar la similitud de esta l?nea con y = mx + b, y de hecho los dos son relativamente id?nticos, excepto que los dos t?rminos en el lado derecho de la ecuaci?n se cambian, de modo que B1 es igual a la pendiente o m. La raz?n de esta reorganizaci?n es que se vuelve elegante y f?cil agregar t?rminos adicionales con caracter?sticas tales como exponentes que podr?an describir diferentes formas no lineales de relaci?n.

Las f?rmulas para obtener una l?nea de regresi?n lineal simple son relativamente complejas y engorrosas, y la mayor?a de las personas no dedican mucho tiempo a escribirlas porque tardan mucho tiempo en completarse. En cambio, varios programas, como Excel o muchos tipos de calculadoras cient?ficas, pueden calcular f?cilmente una l?nea de m?nimos cuadrados. La l?nea solo es apropiada para la predicci?n si existe evidencia clara de una fuerte correlaci?n entre los conjuntos de datos (x, y). Una calculadora generar? una l?nea, independientemente de si tiene sentido usarla.

Al mismo tiempo que se genera una ecuaci?n de l?nea de regresi?n lineal simple, las personas deben observar el nivel de correlaci?n. Esto significa evaluar r, el coeficiente de correlaci?n, contra una tabla de valores para determinar si existe una correlaci?n lineal. Adem?s, evaluar los datos traz?ndolos como un diagrama de dispersi?n es una buena manera de tener una idea de si los datos tienen una relaci?n lineal.

Entonces, lo que se puede hacer con una l?nea de regresi?n lineal simple, siempre que tenga una correlaci?n lineal, es que los valores se pueden sustituir por x, para obtener un valor predicho para y. Esta predicci?n tiene sus l?mites. Los datos presentes, particularmente si se trata solo de una muestra, pueden tener una correlaci?n lineal ahora, pero podr?an no m?s tarde con la adici?n de material de muestra adicional.

Alternativamente, una muestra completa puede compartir una correlaci?n mientras que una poblaci?n entera no. Por lo tanto, la predicci?n es limitada, y ir m?s all? de los valores de datos disponibles se llama extrapolaci?n y no se recomienda. Adem?s, si la gente supiera que si no existe una correlaci?n lineal, la mejor estimaci?n de x es la media de todos los datos de y.

Esencialmente, la regresi?n lineal simple es una herramienta estad?stica ?til que se puede usar, con discreci?n, para predecir los valores y basados ??en el valor del hacha. Casi siempre se ense?a con la idea de la correlaci?n lineal, ya que determinar la utilidad de una l?nea de regresi?n requiere el an?lisis de r. Afortunadamente, con muchos programas t?cnicos modernos, las personas pueden graficar diagramas de dispersi?n, agregar l?neas de regresi?n y determinar el coeficiente de correlaci?n r con un par de entradas.

Inteligente de activos.