Échantillonnage en Term ES
I. Fluctuation d'échantillonnage et prise de décision
1. Fluctuation d'échantillonnage
Définition :
Un échantillon de taille est constitué de résultats de répétitions indépendantes de la même expérience.
Exemple :
On tire au hasars une boule dans une urne dans laquelle la proportion des boules blanches est .
Voici les fréquences obtenues à partir de 10 échantillons de taille 100.
Les fréquences observées fluctuent. Ce phénomène s'appelle fluctuation d'échantillonnage.
Propriété :
Soit la variable aléatoire qui à tout échantillon de taille associe la fréquence d'un caractère. Soit la proportion de ce caractère de la population.
Soit l'intervalle défini par
L'intervalle est appelé intervalle de fluctuation asymptotique au seuil de 95% (au risque de 5%)
prend ses valeurs dans l'intervalle avec une probabilité proche de quand devient grand.
On utilisera cette approximation sous les conditions suivantes :
Exemple :
Il y a 50% de garçons dans une population, on choisit au hasard 100 individus dans cette population.
Déterminer l'intervalle de fluctuation asymptotique à 95% de la population de garçons.
On note l'intervalle de fluctation asymptotique de la population de garçons.
Les conditions précédentes sont bien réunies ici.
On peut interpréter ce résultats de la manière suivante :
- Dans au moins 95% des cas (avec une probabilité de ), la proportion de garçons dans l'échantillon sera comprise entre et
- Il y aura au moins entre et garçons parmi les personnes.
Remarque :
En 2nd et en 1ère, on étudie d'autres intervalles de fluctuation moins précis.
- En 2nd :
- En 1ère : , où et sont déterminés à l'aide de la loi binomiale.
2. Prise de décision
Propriété :
On considère une population dans laquelle on suppose que la proportion d'un caractère est . On observe comme la fréquence de ce caractère dans un échantillon de taille . Soit l'hypothèse : "la proportion de ce caractère dans la population est "
Soit l'intervalle de fluctuation de la fréquence à 95% dans les échantillons de tailles :
La règle de décision est la suivante :
- Si appartient à , on considère que l'hypothèse selon laquelle la proportion est dans la population n'est pas remise en question.
L'écart entre et n'est pas suffisemment significatif. Cet écart est dû à la fluctuation d'échantillonnage. - Si n'appartient pas à , on rejète l'hypothèse selon laquelle la proportion vaut dans la population. L'échantillon de taille n'est pas représentatif de l'ensemble de la population.
Exercice d'application :
On lance 100 fois une pièce. On obtient 30 fois pile. La pièce est-elle équilibrée ?
Hypothèse : "La pièce est équilibrée"
Les conditions sont respectées.
On note l'intervalle de fluctuation asymptotique à 95%.
Soit la fréquence observée :
On rejète l'hypothèse au seuil de 95%. On est sûr à 95% que la pièce n'est pa truquée, avec donc un risque d'erreur de 5%.
II. Intervalle de confiance
Propriété :
Soit la fréquence observée (ou estimation ponctuelle) dans un échantillon de taille et la proportion que l'on veut estimer dans l'ensemble de la population. Sous les conditions , l'intervalle
contient la proportion avec une probabilité d'au moins .
Cet intervalle est appelé intervalle de confiance de au niveau de confiance (au risque de 5%)
Exemple :
Lors d'une élection, on interroge 100 personnes sur leur vote à la sortie des urnes.
63 disent avoir voté pour le candidat A.
Soit le pourcentage final de voix obtenu par le candidat A. Déterminer un intervalle de confiance de au niveau de confiance et interpréter.
On interroge 100 personnes, donc .
Soit la fréquence observée :
Soit l'intervalle de confiance de au niveau de confiance .
On peut alors interpréter que dans 95% des cas, le candidat A obtiendra entre et des votes.
Remarque :
Plus l'échantillon est grand, plus l'intervalle est précis. La longueur ou l'amplitude de l'intervalle de confiance indique la précision obtenue. L'amplitude de l'intervalle est égale à .
Si nous voulons une précision inférieure à , on devra résoudre l'inéquation