Exercice 27 : Conduite

Un expérimentateur veut savoir si les femmes conduisent mieux que les hommes au vu des notes de conduite suivantes :
Hommes : 24,28,29,29,34,36,40,41 et 60.
Femmes : 21,31,34,37,38,39,42,43,44,50 et 51.
Nous supposerons que $Y^{H}\leadsto N\left( \mu^{H} ,\sigma_{H} \right) $ et $Y^{F}\leadsto N\left( \mu^{F},\sigma_{F} \right) $, et nous choisirons un seuil de signification de $5\%$.
R> yH
[1] 24 28 29 29 34 36 40 41 60

R> yF
 [1] 21 31 34 37 38 39 42 43 44 50 51
R> mean(yH)
[1] 35.66667
R> mean(yF)
[1] 39.09091
R> sd(yH)
[1] 10.75872
R> sd(yF)
[1] 8.561011
R> # deltaEst.H0 <- (instruction R à fournir dans la rédaction)
R> deltaEst.H0
[1] -0.7935825
R> pt(deltaEst.H0,18)
[1] 0.2188878

Réponse

Préliminaire : puisque \(\mathtt{(mean(yH)-mean(yF)-0)}\simeq-3.424242\) est du même signe (i.e. négatif) que \(\mathtt{deltaEst.H0}\) (car p-valeur gauche inférieure à \(50\%\)), on a :
  • paramètre d'intérêt : \(d_\mu=\mu^{H}-\mu^{F}\)
  • sa future estimation : \(\widehat{ d_\mu }\left({\mathbf{ { Y^{H},Y^{F} } }}\right)=\widehat{ \mu^{H} }\left({\mathbf{ { Y^{H} } }}\right)-\widehat{ \mu^{F} }\left({\mathbf{ { Y^{F} } }}\right)\)

Hypothèses de test : \(\mathbf{H}_0:\) \(d_\mu=0\) vs \(\mathbf{H}_1:\) \(d_\mu<0\)
Statistique de test sous \(\mathbf{H}_0\) : $$ \widehat{ \delta_{d_\mu,0} }\left({\mathbf{ { Y^{H},Y^{F} } }}\right) = {\displaystyle \frac{\widehat{ d_\mu }\left({\mathbf{ { Y^{H},Y^{F} } }}\right)-0}{ \widehat{ \sigma_{\widehat{ d_\mu}} }\left({\mathbf{ { Y^{H},Y^{F} } }}\right) }} \leadsto \mathcal{S}t(9+11-2) $$
Règle de décision : Accepter \(\mathbf{H}_1\) si p-valeur (gauche) < \(5\%\)
Conclusion : puisqu'au vu des données, $$ p-valeur\overset{\mathtt{R}}{=}\mathtt{pt((mean(yH)-mean(yF)-0)/seDMeanG(yH,yF),18)} \simeq 21.89\%\nless5\%, $$ on NE peut PAS (plutôt) penser (avec un risque de \(5\%\)) que les femmes conduisent mieux que les hommes.

Traitement hors exercice pour vérifier si l'hypothèse sur l'égalité des variances de X et Y n'était pas abusive :
R> # deltaEst.H0 <- (instruction R à fournir dans la rédaction)
R> deltaEst.H0
[1] 1.579323
R> pf(deltaEst.H0,8,10)
[1] 0.7550565

Réponse

Préliminaire :
  • paramètre d'intérêt : \(r_{\sigma^2}=\displaystyle \frac{\sigma^2_{H}}{\sigma^2_{F}}\)
  • sa future estimation : \(\widehat{ r_{\sigma^2} }\left({\mathbf{ { Y^{H},Y^{F} } }}\right)=\widehat{ \sigma^2_{H} }\left({\mathbf{ { Y^{H} } }}\right)/\widehat{ \sigma^2_{F} }\left({\mathbf{ { Y^{F} } }}\right)\)

Hypothèses de test : \(\mathbf{H}_0:\) \(r_{\sigma^2}=1\) vs \(\mathbf{H}_1:\) \(r_{\sigma^2}\neq1\)
Statistique de test sous \(\mathbf{H}_0\) : $$ \widehat{ \delta_{r_{\sigma^2},1} }\left({\mathbf{ { Y^{H},Y^{F} } }}\right) = {\displaystyle \frac{\widehat{ r_{\sigma^2} }\left({\mathbf{ { Y^{H},Y^{F} } }}\right)}{1}} \leadsto \mathcal{F}(9-1,11-1) $$
Règle de décision : Accepter \(\mathbf{H}_1\) si p-valeur (biltatérale) < \(5\%\)
Conclusion : puisqu'au vu des données, $$ p-valeur\overset{\mathtt{R}}{=}\mathtt{2*(1-pf((var(yH)/var(yF))/1,8,10))} \simeq 48.99\%\nless5\%, $$ on NE peut PAS (plutôt) penser (avec un risque de \(5\%\)) que les variances des notes sont différentes.