L’interpolation consiste à découvrir un motif dans un ensemble de points de données pour estimer une valeur entre deux points. L’interpolation linéaire est l’un des moyens les plus simples d’interpoler : une ligne reliant deux points est utilisée pour estimer les valeurs intermédiaires. Les polynômes d’ordre supérieur peuvent remplacer les fonctions linéaires pour des résultats plus précis, mais plus compliqués. L’interpolation peut être opposée à l’extrapolation, qui est utilisée pour estimer des valeurs en dehors d’un ensemble de points plutôt qu’entre eux.
Un ensemble discret de points de données a des points avec deux coordonnées ou plus. Dans un nuage de points XY typique, la variable horizontale est x et la variable verticale est y. Les points de données avec une coordonnée x et y peuvent être tracés sur ce graphique pour une visualisation facile. Dans les applications pratiques, x et y représentent des quantités finies du monde réel. X représente généralement une variable indépendante, telle que le temps ou l’espace, tandis que y représente une variable dépendante, telle que la population.
Souvent, les données ne peuvent être recueillies qu’à des points discrets. Dans l’exemple du suivi de la population d’un pays, un recensement ne peut être effectué qu’à certains moments. Ces mesures pourraient être tracées sous forme de points de données discrets sur un graphique XY.
Si un recensement n’est effectué que tous les cinq ans, il est impossible de connaître la population exacte entre les recensements. Dans l’interpolation linéaire, deux points de données sont connectés avec une fonction linéaire. Cela signifie que la variable dépendante (population) est supposée changer à un taux constant pour atteindre le point de données suivant. Si la population un an après un recensement est nécessaire, on pourrait interpoler linéairement les deux points de données pour estimer une valeur intermédiaire basée sur la ligne de connexion. Il est généralement évident que la variable réelle ne change pas de manière linéaire entre les points de données, mais cette simplification est souvent suffisamment précise.
Parfois, cependant, l’interpolation linéaire introduit trop d’erreurs dans ses estimations. La population, par exemple, affiche une croissance exponentielle dans de nombreux scénarios. Dans une croissance exponentielle, le taux de croissance lui-même augmente – une population plus élevée entraîne plus de naissances, ce qui augmente le taux total d’augmentation de la population. Dans un nuage de points XY, ce type de comportement montrerait une tendance incurvée vers le haut. Une méthode d’interpolation plus précise peut être appropriée pour ce type d’étude.
L’interpolation polynomiale consiste à connecter de nombreux points de données avec une fonction polynomiale. Une fonction linéaire est en fait une simple variété d’une fonction polynomiale, à savoir un polynôme d’ordre un. Les polynômes, cependant, peuvent avoir des ordres supérieurs à un : l’ordre deux est une parabole, l’ordre trois est une fonction cubique, et ainsi de suite. Un ensemble de points de données de population peut être mieux interpolé avec une fonction polynomiale qu’une fonction linéaire car la première peut se courber de haut en bas pour correspondre aux données.