Qu’est-ce que la r?gression lin?aire simple??

La r?gression lin?aire simple s’applique aux statistiques et aide ? d?crire les donn?es (x,y) qui semblent avoir une relation lin?aire, permettant une certaine pr?diction de y si x est connu. Ces donn?es sont souvent trac?es sur des nuages ??de points et la formule de r?gression lin?aire cr?e une ligne qui correspond le mieux ? tous les points, ? condition qu’ils aient vraiment une corr?lation lin?aire. Il ne correspondra pas exactement ? tous les points, mais ce devrait ?tre une ligne o? la somme des carr?s de la diff?rence entre les donn?es r?elles et les donn?es attendues (r?sidus) cr?e le nombre le plus bas, qui est souvent appel? la ligne des moindres carr?s ou la ligne de meilleur ajustement. L’?quation de la droite pour les donn?es d’?chantillon et les donn?es de population est la suivante : y = b0 + b1x et Y = B0 + B1x.

Toute personne familiaris?e avec l’alg?bre peut noter la similitude de cette ligne avec y = mx + b, et en fait les deux sont relativement identiques, sauf que les deux termes du c?t? droit de l’?quation sont intervertis, de sorte que B1 est ?gal ? pente ou m. La raison de ce r?arrangement est qu’il devient alors ?l?gamment facile d’ajouter des termes suppl?mentaires avec des caract?ristiques telles que des exposants qui pourraient d?crire diff?rentes formes de relation non lin?aires.

Les formules pour obtenir une droite de r?gression lin?aire simple sont relativement complexes et lourdes, et la plupart des gens ne passent pas beaucoup de temps ? les ?crire car elles prennent beaucoup de temps ? compl?ter. Au lieu de cela, divers programmes, comme pour Excel ou pour de nombreux types de calculatrices scientifiques, peuvent facilement calculer une ligne des moindres carr?s. La ligne n’est appropri?e pour la pr?diction que s’il existe des preuves claires d’une forte corr?lation entre les ensembles de donn?es (x,y). Une calculatrice g?n?rera une ligne, peu importe si cela a du sens de l’utiliser.

En m?me temps qu’une simple ?quation de droite de r?gression lin?aire est g?n?r?e, les gens doivent examiner le niveau de corr?lation. Cela signifie ?valuer r, le coefficient de corr?lation, par rapport ? une table de valeurs pour d?terminer s’il existe une corr?lation lin?aire. De plus, ?valuer les donn?es en les tra?ant sous forme de nuage de points est un bon moyen de savoir si les donn?es ont une relation lin?aire.

Ce qui peut alors ?tre fait avec une simple ligne de r?gression lin?aire, ? condition qu’elle ait une corr?lation lin?aire, c’est que les valeurs peuvent ?tre substitu?es dans x, pour obtenir une valeur pr?dite pour y. Cette pr?diction a ses limites. Les donn?es pr?sentes, en particulier s’il ne s’agit que d’un ?chantillon, peuvent avoir une corr?lation lin?aire maintenant, mais pas plus tard avec l’ajout d’?chantillons suppl?mentaires.

Alternativement, un ?chantillon entier peut partager une corr?lation alors qu’une population enti?re ne le fait pas. La pr?diction est donc limit?e, et aller bien au-del? des valeurs de donn?es disponibles est appel? extrapolation et n’est pas encourag?. De plus, si les gens savent que s’il n’existe aucune corr?lation lin?aire, la meilleure estimation de x est la moyenne de toutes les donn?es y.

Essentiellement, la r?gression lin?aire simple est un outil statistique utile qui peut, avec discr?tion, ?tre utilis? pour pr?dire les valeurs y en fonction de la valeur de la hache. Il est presque toujours enseign? avec l’id?e de corr?lation lin?aire puisque d?terminer l’utilit? d’une ligne de r?gression n?cessite l’analyse de r. Heureusement, avec de nombreux programmes techniques modernes, les utilisateurs peuvent repr?senter graphiquement des nuages ??de points, ajouter des lignes de r?gression et d?terminer le coefficient de corr?lation r avec quelques entr?es.

SmartAsset.