Il existe une gamme de méthodes d’échantillonnage différentes utilisées lors de la sélection d’un panel de test pour la recherche. Cette recherche peut consister à tester soit une théorie ou un produit spécifique, la réalisation d’un sondage d’opinion, ou toute autre recherche qui vise à couvrir un groupe particulier dans son intégralité. Ce groupe est connu sous le nom de population, bien qu’il puisse impliquer n’importe quel type de groupe, pas seulement les citoyens d’un pays.
Avec une petite population, comme le personnel qui travaille dans un bureau particulier, il est généralement possible d’interroger ou de tester toutes les personnes impliquées. C’est ce qu’on appelle une étude de recensement. Avec la plupart des populations, telles que tout le monde en Chine âgé de 65 ans ou plus, il est impossible d’interroger ou de tester tout le monde, donc un échantillon doit être sélectionné. Les différentes manières de choisir ces participants sont appelées méthodes d’échantillonnage.
Les méthodes d’échantillonnage entrent dans l’une des deux catégories principales : probabilité et non-probabilité. Dans une méthode d’échantillonnage probabiliste, tout le monde a une probabilité connue d’être sélectionné, bien que cette probabilité puisse varier d’une personne à l’autre. Dans une méthode d’échantillonnage non probabiliste, certaines personnes n’ont aucune chance d’être sélectionnées car les participants sont choisis parmi des sections spécifiées de la population. Cela peut être plus pratique, mais a un prix : contrairement à l’échantillonnage probabiliste, l’échantillonnage non probabiliste rend impossible l’estimation de la précision avec laquelle le groupe échantillon représente l’ensemble de la population.
La forme la plus simple d’échantillonnage probabiliste consiste à sélectionner au hasard des personnes à partir d’une liste de l’ensemble de la population. Une variante de cette méthode, l’échantillonnage systématique, consiste à sélectionner des personnes à intervalles fixes le long de la liste, par exemple chaque centième personne. Ces deux méthodes d’échantillonnage ont des défauts, car le groupe d’échantillonnage résultant peut ne pas représenter la composition de la population. Par exemple, le groupe échantillon peut avoir trois enfants et sept adultes, ce qui n’est clairement pas représentatif si l’ensemble de la population est composé de 20 % d’enfants et de 80 % d’adultes.
Ce problème peut être résolu en utilisant un échantillonnage stratifié, dans lequel la population est divisée en groupes particuliers partageant des facteurs communs et les participants sont sélectionnés au hasard dans ces groupes dans les proportions appropriées. Dans l’exemple ci-dessus, les chercheurs sélectionneraient au hasard deux personnes dans une liste de tous les enfants et huit personnes dans une liste de tous les adultes. Naturellement, cela peut être étendu pour couvrir d’autres types de groupes, par exemple par sexe, pour constituer un échantillon qui reflète plus précisément l’ensemble de la population.
La forme la plus simple d’échantillonnage non probabiliste est connue sous le nom d’échantillonnage de commodité. Les chercheurs choisissent simplement les participants les plus faciles à joindre. Il y a clairement un fort risque que cela soit très peu représentatif de la population. Par exemple, si les chercheurs frappent aux portes pendant la journée, ils seront moins susceptibles d’avoir des participants qui occupent un emploi à temps plein.
L’échantillonnage par quota combine un échantillonnage stratifié et un échantillonnage de commodité et implique généralement des chercheurs qui cherchent des participants pour remplir les quotas. Dans l’exemple ci-dessus, les chercheurs pourraient frapper aux portes jusqu’à ce qu’ils aient parlé à un total de deux enfants et huit adultes. Bien que cette méthode signifie que le groupe échantillon est dans les bonnes proportions, le processus de sélection ne permet pas de savoir à quel point il est représentatif. Dans notre exemple, les huit adultes pourraient tous être au chômage, ce qui les rendrait non représentatifs de l’opinion de l’ensemble de la population dans une question sur les prestations de sécurité sociale. Pour cette raison, l’échantillonnage par quotas est classé comme un type d’échantillonnage non probabiliste.