Calcul et interprétation d’estimateurs

Un chercheur mesure l’activité d’une enzyme particulière chez des souris soumises ou non à un traitement, et obtient les valeurs suivantes.

  • Souris traitées: \(x_1 = \{5, 8, 6, 2, 250, 7\}\)
  • Souris non-traitées: \(x_2 = \{7, 3, 2, 5, 8, 4\}\)
  1. Calculez pour chaque tous les estimateurs de tendence centrale et de dispersion discutés au cours.

  2. Sur base des propriétés générales de ces estimateurs, discutez des différences entre valeurs, interprétez les différences observées entre estimateurs alternatifs pour un même jeu de données.

  3. Fournissez une interprétation préliminaire des différences observées entre groupes.

treated control
n 6.00 6.00
sum 278.00 29.00
sum.of.squared.values 62678.00 167.00
mean 46.33 4.83
Q1 5.25 3.25
median 6.50 4.50
Q3 7.75 6.50
sample.var 8299.56 4.47
sample.sd 91.10 2.11
IQR 2.50 3.25

Devoir-maison

Partie 1: échantillonnage et estimation

Poursuivez l’analyse ci-dessus

  1. Calculez l’espace inter-quartile standardisé.

  2. Calculez les statistiques descriptives du premier échantillon après avoir supprimé la valeur aberrante. On appellera cet échantillon “non-traité filtré”.

  3. A partir des 3 jeux de paramètres d’échantillons (non-traité, traité, non-traité flitré), inférez les paramètres des populations dont ils sont extraites.

  4. Résumez les résultats dans un tableau, et founissez-en une interprétation générale.

Partie 2: test de comparaison de moyennes

Sur base des données de l’exercice précédent, effectuez un test de comparaison de moyennes. Dans différentes conditions:

  1. Traité versus non traité, sans filtrage, en estimant les paramètres sur base des moments.

  2. Traité versus non traité, sans filtrage, en estimant les paramètres sur base des quartiles.

  3. Traité versus filtré, en estimant les paramètres sur base des moments..

Dans chaque cas répondez aux questions suviantes.

  1. Formulez l’hypothèse nulle et l’hypothèse alternative.

  2. Choisissez un test de comparaison de moyenne, en justifiant votre choix.

  3. Calculez la statistique du test et sa probabilité critique (p-value), avec les différents estimateurs ci-dessus (a, b, c).

  4. Interprétez les résultats.

Simulations : tirages aléatoires

  1. Générez une population de \(N = 10000\) nombres aléatoires, tirés selon une loi normale de moyenne 10 et d’écart-type 2.

  1. Effectuez un tirage aléatoire de \(n = 10\) nombres dans cette population, et calculez les paramètres de tendance centrale et dispersion pour cet échantillons.
  1. Sur base de ces paramètres d’échantillons, estimez les paramètres de population correspondants.

  2. Répétez cette opération \(R = 10000\) fois en stockant les statistiques d’échantillon dans un tableau.

[1] 1.724444
[1] 1.841802
r sum sum.of.squares mean var sd Q1 median Q3 IQR IQRs
1 106.26078 1181.544 10.626077 5.2408432 2.2892888 10.127704 11.205686 12.18078 2.053078 1.5219487
2 101.07563 1052.261 10.107563 3.0632925 1.7502264 9.502976 10.032571 11.55330 2.050324 1.5199076
3 103.72546 1084.133 10.372546 0.8235473 0.9074951 9.819562 10.365001 11.04528 1.225716 0.9086249
4 107.67321 1177.543 10.767321 1.8190786 1.3487322 9.985165 10.994104 11.83173 1.846562 1.3688586
5 100.99995 1111.490 10.099995 9.1390643 3.0230885 7.934574 10.092926 11.82565 3.891072 2.8844560
6 96.92615 984.656 9.692615 4.5188239 2.1257526 8.042950 9.767269 10.48624 2.443287 1.8112113
**Figure.** Comparaison des paramètres d'échantillons basés sur les moments (moyenne, écart-type) et sur les quartiles (médiane, espace inter-quartile).

Figure. Comparaison des paramètres d’échantillons basés sur les moments (moyenne, écart-type) et sur les quartiles (médiane, espace inter-quartile).

  1. Dessinez les histogrammes des distributions d’échantillonnage des paramètres mesurés sur l’échantillon: moyenne, médiane, écart-type.

  2. Faites la même expérience avec différentes tailles d’échantillon: \(n= 2\), \(n=4\), \(n=16\), \(n=64\) et comparez les histogrammes obtenus.

  3. Interprétez les résultats (et on en discute en début de séance prochaine).

Devoir-maison

Effectuez des échantillonnages répétésau sein de différentes distributions:

  1. Normale de moyenne 10 et d’écarts-types divers (1, 2, 4, 8).
  2. Uniforme (entre 0 et 1)
  3. De Poisson, de paramètre \(\lambda = 2.5\) (espérance).

Dans chaque cas, dessinez les histogrammes d’échantillonnage de la moyenne, la médiane et l’écart-type, et interprétez les résultats.