Échantillonnage en Term ES

I. Fluctuation d'échantillonnage et prise de décision

1. Fluctuation d'échantillonnage

Définition :
Un échantillon de taille nn est constitué de résultats de nn répétitions indépendantes de la même expérience.

Exemple :
On tire au hasars une boule dans une urne dans laquelle la proportion des boules blanches est 0,60{,}6.
Voici les fréquences obtenues à partir de 10 échantillons de taille 100.

0,51;0,62;0,68;0,55;0,47;0,6;0,69;0,58;0,61;0,670{,}51 ; 0{,}62;0{,}68;0{,}55;0{,}47;0{,}6;0{,}69;0{,}58;0{,}61;0{,}67

Les fréquences observées fluctuent. Ce phénomène s'appelle fluctuation d'échantillonnage.

Propriété :
Soit FnF_n la variable aléatoire qui à tout échantillon de taille nn associe la fréquence d'un caractère. Soit pp la proportion de ce caractère de la population.
Soit InI-n l'intervalle défini par

In=[p1,96p(1p)n;p+1,96p(1p)n]I_n=\left[ p-\dfrac{1{,}96\sqrt{p(1-p)}}{\sqrt n};p+\dfrac{1{,}96\sqrt{p(1-p)}}{\sqrt n}\right]

L'intervalle InI_n est appelé intervalle de fluctuation asymptotique au seuil de 95% (au risque de 5%)

FnF_n prend ses valeurs dans l'intervalle InI_n avec une probabilité proche de 0,950{,}95 quand nn devient grand.
On utilisera cette approximation sous les conditions suivantes :

n30n\geq 30

np5np\geq 5

n(1p)5n(1-p)\geq 5

Exemple :
Il y a 50% de garçons dans une population, on choisit au hasard 100 individus dans cette population.
Déterminer l'intervalle de fluctuation asymptotique à 95% de la population de garçons.

On note InI_n l'intervalle de fluctation asymptotique de la population de garçons.
p=0,5 ;n=100 ;n×p=50 ;n×(1p)=50p=0{,}5\ ; n=100\ ; n\times p=50\ ; n\times (1-p)=50
Les conditions précédentes sont bien réunies ici.

In=[0,51,960,5(10,5)100;0,5+1,960,5(10,5)100]I_n=\left[ 0{,}5-\dfrac{1{,}96\sqrt{0{,}5(1-0{,}5)}}{\sqrt 100};0{,}5+\dfrac{1{,}96\sqrt{0{,}5(1-0{,}5)}}{\sqrt 100}\right]

In=[0,402 ;0,598]I_n=\lbrack 0{,}402\ ; 0{,}598\rbrack

On peut interpréter ce résultats de la manière suivante :

  • Dans au moins 95% des cas (avec une probabilité de 0,950{,}95), la proportion de garçons dans l'échantillon sera comprise entre 40,2%40{,}2\% et 59,8%59{,}8\%
  • Il y aura au moins entre 4040 et 6060 garçons parmi les 100100 personnes.

Remarque :
En 2nd et en 1ère, on étudie d'autres intervalles de fluctuation moins précis.

  • En 2nd : [p1n]\left[ p-\dfrac{1}{\sqrt n}\right]
  • En 1ère : [an;bn]\left[\dfrac{a}{n};\dfrac{b}{n}\right], où aa et bb sont déterminés à l'aide de la loi binomiale.

2. Prise de décision

Propriété :
On considère une population dans laquelle on suppose que la proportion d'un caractère est pp. On observe ff comme la fréquence de ce caractère dans un échantillon de taille nn. Soit l'hypothèse : "la proportion de ce caractère dans la population est pp"
Soit InI_n l'intervalle de fluctuation de la fréquence à 95% dans les échantillons de tailles nn :

In=[p1,96p(1p)n;p+1,96p(1p)n]I_n=\left[ p-\dfrac{1{,}96\sqrt{p(1-p)}}{\sqrt n};p+\dfrac{1{,}96\sqrt{p(1-p)}}{\sqrt n}\right]

La règle de décision est la suivante :

  • Si ff appartient à InI_n, on considère que l'hypothèse selon laquelle la proportion est pp dans la population n'est pas remise en question.
    L'écart entre ff et pp n'est pas suffisemment significatif. Cet écart est dû à la fluctuation d'échantillonnage.
  • Si ff n'appartient pas à InI_n, on rejète l'hypothèse selon laquelle la proportion vaut pp dans la population. L'échantillon de taille nn n'est pas représentatif de l'ensemble de la population.

Exercice d'application :
On lance 100 fois une pièce. On obtient 30 fois pile. La pièce est-elle équilibrée ?

Hypothèse : "La pièce est équilibrée"
p=0,5 ;n=100 ;n×p=50 ;n×(1p)=50p=0{,}5\ ; n=100\ ; n\times p=50\ ; n\times (1-p)=50
Les conditions sont respectées.
On note InI_n l'intervalle de fluctuation asymptotique à 95%.

In=[p1,96p(1p)n;p+1,96p(1p)n]I_n=\left[ p-\dfrac{1{,}96\sqrt{p(1-p)}}{\sqrt n};p+\dfrac{1{,}96\sqrt{p(1-p)}}{\sqrt n}\right]

In=[0,402 ;0,598]I_n=\lbrack 0{,}402\ ; 0{,}598\rbrack

Soit ff la fréquence observée : f=30100=0,3f=\dfrac{30}{100}=0{,}3
fInf\notin I_n
On rejète l'hypothèse au seuil de 95%. On est sûr à 95% que la pièce n'est pa truquée, avec donc un risque d'erreur de 5%.

II. Intervalle de confiance

Propriété :
Soit ff la fréquence observée (ou estimation ponctuelle) dans un échantillon de taille nn et pp la proportion que l'on veut estimer dans l'ensemble de la population. Sous les conditions n30 ;nf5 ;n(1f)5n\geq 30\ ; nf\geq 5\ ; n(1-f)\geq 5, l'intervalle

[f1n ;f+1n]\left[f-\dfrac{1}{\sqrt n}\ ; f+\dfrac{1}{\sqrt n}\right]

contient la proportion pp avec une probabilité d'au moins 0,950{,}95.
Cet intervalle est appelé intervalle de confiance de pp au niveau de confiance 0,950{,}95 (au risque de 5%)

Exemple :
Lors d'une élection, on interroge 100 personnes sur leur vote à la sortie des urnes.
63 disent avoir voté pour le candidat A.
Soit pp le pourcentage final de voix obtenu par le candidat A. Déterminer un intervalle de confiance de pp au niveau de confiance 0,950{,}95 et interpréter.

On interroge 100 personnes, donc n=100n=100.
Soit ff la fréquence observée : f=0,63f=0{,}63

nf=63>5nf=63>5

n(1f)=37>5n(1-f)=37>5

Soit InI_n l'intervalle de confiance de pp au niveau de confiance 0,950{,}95.

In=[f1n ;f+1n]=[0,63110 ;0,63+110]=[0,53 ;0,73]\begin{array}{ccc} I_n&=&\left[f-\dfrac{1}{\sqrt n}\ ; f+\dfrac{1}{\sqrt n}\right]\\ &=&\left[0{,}63-\dfrac{1}{10}\ ; 0{,}63+\dfrac{1}{10}\right]\\ &=&\lbrack 0{,}53\ ; 0{,}73\rbrack\\ \end{array}

On peut alors interpréter que dans 95% des cas, le candidat A obtiendra entre 53%53\% et 73%73\% des votes.

Remarque :
Plus l'échantillon est grand, plus l'intervalle est précis. La longueur ou l'amplitude de l'intervalle de confiance indique la précision obtenue. L'amplitude de l'intervalle est égale à 2n\dfrac{2}{\sqrt n}.
Si nous voulons une précision inférieure à t%t\%, on devra résoudre l'inéquation

2nt100\dfrac{2}{\sqrt n}\leq \dfrac{t}{100}


Posez vos questions

D'autres interrogations sur ce cours ? Démarrez une discussion et obtenez des réponses à des exercices pratiques.

Accéder au forum