Vous êtes invités à annoter le contenu de ce cours. Les annotations peuvent être des corrections typographiques, des propositions ou des questions. Pour ajouter des annotations, choisissez le text que vous voulez commenter et cliquez sur . Pour accéder aux annotations crées par d'autres personnes, cliquez sur le coin supérieur de la page .

TP Intervalle de confiance

4.4 IC pour la moyenne et la variance de la loi normale

On se propose d’étudier le poids des poulpes femelles. On va construire des intervalles de confiances pour la moyenne et la variance de cette variable, à l’aide du fichier de données poulpe.csv .

  1. Récupérer le fichier poulpe.csv et charger le dans votre session .

  2. Sélectionner les poulpes femelles.

  3. Calculer les estimateurs de la moyenne et de la variance. Représenter les données sur un histogramme.

  4. Déterminer un intervalle de confiance à \(95\%\) pour la moyenne, en calculant les bornes de l’intervalle avec la fonction qt().

  5. Retrouver cet intervalle à l’aide de la fonction t.test().

  6. Déterminer un intervalle de confiance à \(95\%\) pour la variance.

  7. Créer une fonction ICvar() ayant comme arguement un vecteur d’observations, et un risque \(\alpha\), et qui sort l’intervalle de confiance pour la variance de l’échantillon.

4.5 IC pour une proportion et effet de la confiance

Soit \(X_1,\ldots,X_n\) un échantillon de la loi de Bernoulli de paramètre \(p\). L’emm et l’emv de \(p\) est \(\hat{p}_n = \overline{X}_n=\frac{1}{n} \sum_{i=1}^n X_i\). L’intervalle de confiance approximativement de niveau \(1-\alpha\) pour \(p\) si \(np > 5\) et \(n(1-p)>5\) est

\[IC_{1-\alpha}(p)= \Big[\hat{p}_n + z_{\alpha/2} \sqrt{\frac{\hat{p}_n(1-\hat{p}_n)}{n}}, \hat{p}_n - z_{\alpha/2} \sqrt{\frac{\hat{p}_n(1-\hat{p}_n)}{n}}\Big]\]

\(z_{\alpha/2}\) désigne le quantile d’ordre \(\alpha/2\) d’une loi normale centrée réduite.

  1. Choisir une valeur de \(p\), strictement comprise entre \(0\) et \(1\). Tirer \(100\) échantillons de taille \(100\) de la loi de Bernoulli de paramètre \(p\).
  2. Pour \(\alpha=0.1\), puis \(0.05\), puis \(0.01\), calculer les valeurs prises par les \(100\) intervalles de confiance bilatéraux de niveau \(1-\alpha\) pour \(p\).
  3. Calculer en pourcentage le nombre d’intervalles qui contiennent la valeur de \(p\). Interpréter.
  4. Représenter graphiquement les intervalles par des segments horizontaux superposés, et la vraie valeur du paramètre \(p\) par un trait rouge vertical. (Indication: utiliser les fonctions matplot() et abline(). On pourra aussi colorier différemment les IC qui contiennent ou pas \(p\)).
  5. Refaire la simulation précédante en tirant \(100\) échantillons de taille \(20\) au lieu de \(100\) et en choisissant \(p\) entre \(0\) et \(0.2\). Pour \(\alpha=0.05\), calculer le nombre d’intervalles qui ne contiennent pas la valeur de \(p\). Interpréter.

4.6 IC pour le paramètre \(\lambda\) d’une loi exponentielle

Soit \(X_1,\ldots,X_n\) un échantillon de la loi exponentielle de paramètre \(\lambda\). L’emv de \(\lambda\) est \(\hat{\lambda} = n/(X_1+\ldots+X_n)\). La variable aléatoire \(Y=2\lambda X\) suit une loi exponentielle de paramètre \(1/2\), qui est aussi une loi \(\chi^2(2)\) (preuve ). Soit donc \(Y_i = 2\lambda X_i\) un échantillon iid de loi \(\chi^2(2)\).

Soit \(T=2\lambda \sum_{i=1}^n X_i = \sum_{i=1}^n Y_i\). Donc \(T\) suit la loi \(\chi^2(2n)\).

  1. Construire un IC pour \(\lambda\) (sur papier).
  2. Un modèle théorique suggère que le durée des appels téléphoniques suit une distribution exponentielle de paramètre \(\lambda\). Un échantillon aléatoire de \(n = 10\) durées d’appel suivantes (en minutes):
2.84 2.37 7.52 2.76 3.83 1.32 8.43 2.25 1.63 0.27

Calculer l’IC de \(\lambda\) à niveau de confiance \(95\%\) selon cet échantillon.

Simulation

  1. Choisir maintenant une valeur de \(\lambda\). Tirer \(100\) échantillons de taille \(10\) de la loi exponentielle de paramètre \(\lambda\).
  2. Calculer les \(100\) valeurs prises par l’estimateur \(T\) sur ces échantillons.
  3. Pour \(\alpha=0.1\), puis \(0.05\), puis \(0.01\), calculer les valeurs prises par les \(100\) intervalles de confiance bilatéraux de niveau \(1-\alpha\) pour \(\lambda\).
  4. Calculer en pourcentage le nombre d’intervalles qui contiennent la valeur de \(\lambda\).
  5. Représenter graphiquement les intervalles par des segments horizontaux superposés, et la vraie valeur du paramètre \(\lambda\) par un trait rouge vertical.