Échantillonnage systématique
Qu’est-ce que l’échantillonnage systématique?
L’échantillonnage systématique est un type de méthode d’ échantillonnage probabiliste dans lequel les membres de l’échantillon d’une population plus large sont sélectionnés en fonction d’un point de départ aléatoire, mais avec un intervalle périodique fixe. Cet intervalle, appelé intervalle d’échantillonnage, est calculé en divisant la taille de la population par la taille souhaitée de l’échantillon.
Bien que l’échantillon de population ait été sélectionné à l’avance, l’échantillonnage systématique est toujours considéré comme aléatoire si l’intervalle périodique est déterminé à l’avance et si le point de départ est aléatoire.
Il existe plusieurs méthodes d’échantillonnage d’une population pour l’inférence statistique; l’échantillonnage systématique est une forme d’échantillonnage aléatoire.
Comment fonctionne l’échantillonnage systématique
Comme l’échantillonnage aléatoire simple d’une population peut être inefficace et prendre beaucoup de temps, les statisticiens se tournent vers d’autres méthodes, telles que l’échantillonnage systématique. Le choix d’une taille d’échantillon par une approche systématique peut être fait rapidement. Une fois qu’un point de départ fixe a été identifié, un intervalle constant est sélectionné pour faciliter la sélection des participants.
L’échantillonnage systématique est préférable à l’échantillonnage aléatoire simple lorsque le risque de manipulation des données est faible. Si un tel risque est élevé lorsqu’un chercheur peut manipuler la longueur de l’intervalle pour obtenir les résultats souhaités, une technique d’échantillonnage aléatoire simple serait plus appropriée.
L’échantillonnage systématique est populaire auprès des chercheurs et des analystes en raison de sa simplicité. Les chercheurs partent généralement du principe que les résultats sont représentatifs de la plupart des populations normales, à moins qu’une caractéristique aléatoire n’existe de manière disproportionnée dans chaque » n ème » échantillon de données (ce qui est peu probable). En d’autres termes, une population doit présenter un degré naturel de hasard le long de la métrique choisie. Si la population présente un type de schéma standardisé, le risque de choisir accidentellement des cas très fréquents est plus évident.
Dans l’échantillonnage systématique, comme pour d’autres méthodes d’échantillonnage, une population cible doit être sélectionnée avant la sélection des participants. Une population peut être identifiée sur la base d’un nombre quelconque de caractéristiques souhaitées qui conviennent au but de l’étude en cours. Certains critères de sélection peuvent inclure l’âge, le genre, la race, le lieu, le niveau d’éducation et / ou la profession.
Retenons
- L’échantillonnage systématique est un type de méthode d’échantillonnage probabiliste dans lequel les membres de l’échantillon d’une population plus importante sont sélectionnés en fonction d’un point de départ aléatoire, mais avec un intervalle périodique fixe (l’intervalle d’échantillonnage).
- En raison de sa simplicité, l’échantillonnage systématique est populaire auprès des chercheurs.
- Parmi les autres avantages de cette méthodologie, citons l’élimination du phénomène de la sélection par grappes et la faible probabilité de contamination des données.
- Les inconvénients incluent une sur ou sous-représentation de modèles particuliers et un risque accru de manipulation des données.
Exemples d’échantillonnage systématique
Comme exemple hypothétique d’échantillonnage systématique, supposons que sur une population de 10 000 personnes, un statisticien sélectionne chaque centième personne à échantillonner. Les intervalles d’échantillonnage peuvent également être systématiques, tels que le choix d’un nouvel échantillon à prélever toutes les 12 heures.
Autre exemple, si vous souhaitez sélectionner un groupe aléatoire de 1 000 personnes sur une population de 50 000 personnes en utilisant un échantillonnage systématique, tous les participants potentiels doivent être placés dans une liste et un point de départ sera sélectionné. Une fois la liste formée, chaque 50ème personne de la liste (commençant le compte au point de départ sélectionné) serait choisie comme participant, puisque 50 000/1 000 = 50.
Par exemple, si le point de départ sélectionné était 20, la 70ème personne de la liste serait choisie, suivie de la 120ème, etc. Une fois la fin de la liste atteinte et si d’autres participants sont requis, le décompte est bouclé au début de la liste pour terminer le décompte.
Échantillonnage systématique ou échantillonnage en grappes
L’échantillonnage systématique et l’échantillonnage en grappes diffèrent dans la façon dont ils extraient des points d’échantillonnage de la population incluse dans l’échantillon. L’échantillonnage en grappes décompose la population en grappes, tandis que l’échantillonnage systématique utilise des intervalles fixes de la plus grande population pour créer l’échantillon.
L’échantillonnage systématique sélectionne un point de départ aléatoire dans la population, puis un échantillon est prélevé à intervalles fixes et réguliers de la population en fonction de sa taille. L’échantillonnage en grappes divise la population en grappes, puis prend un échantillon aléatoire simple de chaque grappe.
L’échantillonnage en grappes est considéré comme moins précis que les autres méthodes d’échantillonnage. Cependant, cela peut réduire les coûts d’obtention d’un échantillon. L’échantillonnage en grappes est une procédure d’échantillonnage en deux étapes. Il peut être utilisé lorsque compléter une liste de toute la population est difficile. Par exemple, il pourrait être difficile de constituer l’ensemble de la population des clients d’une épicerie à interroger.
Cependant, une personne peut créer un sous-ensemble aléatoire de magasins, ce qui constitue la première étape du processus. La deuxième étape consiste à interroger un échantillon aléatoire des clients de ces magasins. Il s’agit d’un processus manuel simple qui permet d’économiser du temps et de l’argent.
Limites de l’échantillonnage systématique
Un des risques que les statisticiens doivent prendre en compte lors de la réalisation d’un échantillonnage systématique concerne l’organisation de la liste utilisée avec l’intervalle d’échantillonnage. Si la population placée sur la liste est organisée selon un modèle cyclique qui correspond à l’intervalle d’échantillonnage, l’échantillon sélectionné peut être biaisé.
Par exemple, le service des ressources humaines d’une entreprise souhaite sélectionner un échantillon d’employés et demander leur avis sur les règles de l’entreprise. Les employés sont regroupés en équipes de 20 personnes, chaque équipe étant dirigée par un responsable. Si la liste utilisée pour sélectionner la taille de l’échantillon est organisée avec des équipes regroupées, le statisticien risque de ne choisir que des gestionnaires (ou aucun gestionnaire) en fonction de l’intervalle d’échantillonnage.