Eléments de statistique descriptive avec R

Mohamad Ghassany

30/03/2018

Données quantitatives discrètes

Le nombre d’arbres plantés sur les parcelles d’un lotissement a été compté. Les données obtenues sont les suivantes:

\[1,2,4,1,6,3,2,1,2,0,1,2,2,1,3,0,3,2,1,2,2,3,2,3.\]

  1. Quelle est la nature de variable étudiée?
  2. Rentrer ces données sous la forme d’un vecteur nommé arbres et affichez ce vecteur.
  3. Trier les valeurs de ce vecteur par ordre croissant.
  4. Donner la taille de l’échantillon (c’est-à-dire le nombre de composantes de ce vecteur) en la notant n et affichez sa valeur.

Effectifs et fréquence

  1. Montrer la séquence des modalités et la séquence des effectifs correspondants.
  2. Montrer le tableau de fréquences et de pourcentages.
  3. Calculer et afficher les effectifs cumulés et les fréquences cumulées.

Mesures de tendance centrale

  1. Calculer le nombre moyen d’arbres par parcelle.
  2. Calculer le nombre maximum et le nombre minimum d’arbres sur une parcelle.
  3. Calculer le nombre médian d’arbres par parcelle.
  4. Utiliser la fonction summary() pour obtenir un tableau récapitulatif des indicateurs.

Indicateurs de dispersion

  1. Calculer la variance et l’écart-type du nombre d’arbres plantés sur les parcelles.

  2. Calculer maintenant l’écart-type et vérifier que l’écart-type est la racine carrée de la variance.

  3. Calculer la variance vous-même. La variance obtenue est elle la même que la précédente?

Le logiciel R utilise n − 1 pour le dénomiateur dans la définition de la variance, c’est-à-dire \(\frac{1}{n-1} \sum_{i=1}^n (x_i - \bar{x})^2\) (d’écart-type noté σn − 1 ou s. Cette quantité est souvent préférée dans les applications numériques pour des questions d’estimation).

Représentations graphiques

  1. La fontion plot() affiche par défaut un nuage de points avec en abscisse le numéro de l’observation (ici de 1 à 24) et en ordonnée le nombre d’arbres. Tester cette fonction. Modifier le titre de la figure, les noms des axes, la couleur et la forme des points affichés.

  2. Afficher la courbe des fréquence cumulées. (Indication: Utiliser la fonction ecdf()).

  3. Tracer un diagramme en bâtons par la fonction barplot() à partir du tableau des effectifs ou des fréquences.