Un pilote de course en Formule 1 hésite entre deux équipes. Il fait alors des essais dans chacune des deux équipes pour savoir laquelle est la plus performante.
(1) Pour l'équipe 1, le pilote commence par faire 20 premiers tours. Les données des temps effectués par tour sont exprimées en secondes et stockées dans le vecteur $\mathtt{y1}$. Au vu des données peut-on montrer que le temps moyen de la voiture de l'équipe 1 est inférieur à 51 secondes avec un risque d'erreur de première espèce fixé à \(5\%\) ?
R> mean(y1)
[1] 50.21973R> sd(y1)
[1] 2.276776R># deltaEst.H0 <- (instruction R à fournir dans la rédaction)R> pt(deltaEst.H0,19)
[1] 0.07092418
Réponse
Hypothèses de test : \(\mathbf{H}_0:\) \(\mu^{E1}=51\) vs \(\mathbf{H}_1:\) \(\mu^{E1}<51\)
Statistique de test sous \(\mathbf{H}_0\) :
\[
\widehat{ \delta_{\mu^{E1},51} }\left({\mathbf{ { Y^{E1} } }}\right) = {\displaystyle \frac{\widehat{ \mu^{E1} }\left({\mathbf{ { Y^{E1} } }}\right)-51}{
\widehat{ \sigma_{\widehat{ \mu^{E1}}} }\left({\mathbf{ { Y^{E1} } }}\right)
}} \leadsto \mathcal{S}t(20-1)
\]
Règle de décision : Accepter \(\mathbf{H}_1\) si
p-valeur (gauche) < \(5\%\)
Conclusion :
puisqu'au vu des données,
$$
p-valeur\overset{\mathtt{R}}{=}\mathtt{pt((mean(y1)-51)/seMean(y1),19)} \simeq 7.09\%\nless5\%,
$$
on NE peut PAS (plutôt) penser (avec un risque de \(5\%\)) que le temps moyen de la voiture de l'équipe 1 est inférieur à 51 secondes.
(2) Le pilote effectue 20 tours supplémentaires (les données sont toujours stockées dans le vecteur $\mathtt{y1}$ ).
Même question que précédemment avec ce nouveau jeu de données complétées.
R>y1
[1] 47.8967450.0408754.5324054.3671848.8064551.4407749.7266944.81843
[9] 50.3791048.3203753.5515050.3861150.3789949.4458550.4726250.66881...
[33] 48.8342351.9397849.1988652.6703449.2136048.3567849.4311648.95199R> mean(y1)
[1] 50.39458R> sd(y1)
[1] 1.965069R># deltaEst.H0 <- (instruction R à fournir dans la rédaction)R>deltaEst.H0
[1] -1.948534
Réponse
Hypothèses de test : \(\mathbf{H}_0:\) \(\mu^{E1}=51\) vs \(\mathbf{H}_1:\) \(\mu^{E1}<51\)
Statistique de test sous \(\mathbf{H}_0\) :
\[
\widehat{ \delta_{\mu^{E1},51} }\left({\mathbf{ { Y^{E1} } }}\right) = {\displaystyle \frac{\widehat{ \mu^{E1} }\left({\mathbf{ { Y^{E1} } }}\right)-51}{
\widehat{ \sigma_{\widehat{ \mu^{E1}}} }\left({\mathbf{ { Y^{E1} } }}\right)
}} \underset{Approx.}{\leadsto} \mathcal{N}(0,1)
\]
Règle de décision : Accepter \(\mathbf{H}_1\) si
\(\widehat{ \delta_{\mu^{E1},51} }\left({\mathbf{ { y^{E1} } }}\right) < \delta^-_{lim,5\%}\)
Conclusion :
puisqu'au vu des données,
$$\begin{aligned}
\widehat{ \delta_{\mu^{E1},51} }\left({\mathbf{ { y^{E1} } }}\right) &\overset{\mathtt{R}}{=} \mathtt{(mean(y1)-51)/seMean(y1)}\simeq -1.948534\\& < \delta^-_{lim,5\%} \overset{\mathtt{R}}{=} \mathtt{-qnorm(1-.05)}\simeq-1.644854
\end{aligned}$$
on peut (plutôt) penser (avec un risque de \(5\%\)) que le temps moyen de la voiture de l'équipe 1 est inférieur à 51 secondes.
(3) Avec la voiture de l'équipe 2, le pilote effectue 50 tours. Les données des temps effectués par tour sont exprimées en secondes et stockées dans le vecteur $\mathtt{y2}$. Au vu des données peut-on montrer que le temps moyen de la voiture de l'équipe 2 est inférieur à 51 secondes avec un risque d'erreur de première espèce fixé à \(5\%\) ?
R>y2
[1] 51.8937151.3581452.1630551.8322852.9765351.4351350.8937051.50756
[9] 51.5446852.2291751.2112252.9625251.6179752.4022550.2109751.73468...
[49] 53.5597452.44708R> mean(y2)
[1] 52.02422R> sd(y2)
[1] 0.8670206R># deltaEst.H0 <- (instruction R à fournir dans la rédaction)R>deltaEst.H0
[1] 8.353126R> pnorm(deltaEst.H0)
[1] 1
Réponse
Hypothèses de test : \(\mathbf{H}_0:\) \(\mu^{E2}=51\) vs \(\mathbf{H}_1:\) \(\mu^{E2}<51\)
Statistique de test sous \(\mathbf{H}_0\) :
\[
\widehat{ \delta_{\mu^{E2},51} }\left({\mathbf{ { Y^{E2} } }}\right) = {\displaystyle \frac{\widehat{ \mu^{E2} }\left({\mathbf{ { Y^{E2} } }}\right)-51}{
\widehat{ \sigma_{\widehat{ \mu^{E2}}} }\left({\mathbf{ { Y^{E2} } }}\right)
}} \underset{Approx.}{\leadsto} \mathcal{N}(0,1)
\]
Règle de décision : Accepter \(\mathbf{H}_1\) si
p-valeur (gauche) < \(5\%\)
Conclusion :
puisqu'au vu des données,
$$
p-valeur\overset{\mathtt{R}}{=}\mathtt{pnorm((mean(y2)-51)/seMean(y2))} \simeq 100.0\%\nless5\%,
$$
on NE peut PAS (plutôt) penser (avec un risque de \(5\%\)) que le temps moyen de la voiture de l'équipe 2 est inférieur à 51 secondes.
(4) Quel est l'ordre de grandeur de la p$-$valeur du précédent test ? Donc à la vue des sorties R précédentes, les données permettent-elles de laisser penser qu'une certaine assertion d'intérêt (à préciser) est vraie ?
Réponse
Affirmation d'intérêt : \(\mathbf{H}_1:\) \(\mu^{E2}>51\)
Application numérique : puisqu'au vu des données,
$$
p-valeur\overset{\mathtt{R}}{=}\mathtt{1-pnorm((mean(y2)-51)/seMean(y2))} \simeq 0.0\% < 5\%,
$$
on peut (plutôt) penser (avec un risque de \(5\%\)) que le temps moyen de la voiture de l'équipe 2 est inférieur à 51 secondes.
(5) Au vu des données peut-on montrer que le temps moyen de l'équipe 1 est inférieur à celui de l'équipe 2 avec un risque d'erreur de première espèce fixé à \(5\%\) ?
Cela est-il surprenant au regard le la conclusion de la question précédente ?
R># deltaEst.H0 <- (instruction R à fournir dans la rédaction)R>deltaEst.H0
[1] -4.878811
Réponse
Préliminaire : puisque \(\mathtt{(mean(y1)-mean(y2)-0)}\simeq-1.629639\) est du même signe (i.e. positif) que \(\mathtt{deltaEst.H0}\) , on a :
Hypothèses de test : \(\mathbf{H}_0:\) \(d_\mu=0\) vs \(\mathbf{H}_1:\) \(d_\mu<0\)
Statistique de test sous \(\mathbf{H}_0\) :
\[
\widehat{ \delta_{d_\mu,0} }\left({\mathbf{ { Y^{E1},Y^{E2} } }}\right) = {\displaystyle \frac{\widehat{ d_\mu }\left({\mathbf{ { Y^{E1},Y^{E2} } }}\right)-0}{
\widehat{ \sigma_{\widehat{ d_\mu}} }\left({\mathbf{ { Y^{E1},Y^{E2} } }}\right)
}} \underset{Approx.}{\leadsto} \mathcal{N}(0,1)
\]
Règle de décision : Accepter \(\mathbf{H}_1\) si
\(\widehat{ \delta_{d_\mu,0} }\left({\mathbf{ { y^{E1},y^{E2} } }}\right) < \delta^-_{lim,5\%}\)
Conclusion :
puisqu'au vu des données,
$$\begin{aligned}
\widehat{ \delta_{d_\mu,0} }\left({\mathbf{ { y^{E1},y^{E2} } }}\right) &\overset{\mathtt{R}}{=} \mathtt{(mean(y1)-mean(y2)-0)/seDMean(y1,y2)}\simeq -4.878811\\& < \delta^-_{lim,5\%} \overset{\mathtt{R}}{=} \mathtt{-qnorm(1-.05)}\simeq-1.644854
\end{aligned}$$
on peut (plutôt) penser (avec un risque de \(5\%\)) que le temps moyen de l'équipe 1 est inférieur à celui de l'équipe 2.
Cela n'est pas surprenant au regard des questions précédentes puisque nous avions conclu que l'on pouvait plutôt penser que le temps de l'équipe 1 (resp. 2) était inférieur (resp. supérieur) à 51 secondes.
(6) Au vu des données peut-on montrer que la variance des temps de l'équipe 2 est inférieure à celle de l'équipe 1 avec un risque d'erreur de première espèce fixé à \(5\%\) ?
R># deltaEst.H0 <- (instruction R à fournir dans la rédaction)R>deltaEst.H0
[1] 3.161661
Réponse
Préliminaire : puisque \(\mathtt{(var(y1)-var(y2)-0)}\simeq3.109772\) est du même signe (i.e. positif) que \(\mathtt{deltaEst.H0}\) , on a :
Hypothèses de test : \(\mathbf{H}_0:\) \(d_{\sigma^2}=0\) vs \(\mathbf{H}_1:\) \(d_{\sigma^2}>0\)
Statistique de test sous \(\mathbf{H}_0\) :
\[
\widehat{ \delta_{d_{\sigma^2},0} }\left({\mathbf{ { Y^{E1},Y^{E2} } }}\right) = {\displaystyle \frac{\widehat{ d_{\sigma^2} }\left({\mathbf{ { Y^{E1},Y^{E2} } }}\right)-0}{
\widehat{ \sigma_{\widehat{ d_{\sigma^2}}} }\left({\mathbf{ { Y^{E1},Y^{E2} } }}\right)
}} \underset{Approx.}{\leadsto} \mathcal{N}(0,1)
\]
Règle de décision : Accepter \(\mathbf{H}_1\) si
\(\widehat{ \delta_{d_{\sigma^2},0} }\left({\mathbf{ { y^{E1},y^{E2} } }}\right) > \delta^+_{lim,5\%}\)
Conclusion :
puisqu'au vu des données,
$$\begin{aligned}
\widehat{ \delta_{d_{\sigma^2},0} }\left({\mathbf{ { y^{E1},y^{E2} } }}\right) &\overset{\mathtt{R}}{=} \mathtt{(var(y1)-var(y2)-0)/seDVar(y1,y2)}\simeq 3.161661\\& > \delta^+_{lim,5\%} \overset{\mathtt{R}}{=} \mathtt{qnorm(1-.05)}\simeq1.644854
\end{aligned}$$
on peut (plutôt) penser (avec un risque de \(5\%\)) que la variance des temps de l'équipe 2 est inférieure à celle de l'équipe 1.
(7) Exprimez littéralement les deux conclusions des deux tests précédents. Si vous étiez le pilote, quelle équipe choisiriez-vous ?
Réponse
Au regard des deux questions précédentes, on peut plutôt penser au vu des données que la voiture de l'équipe 1 est plus performante (en moyenne) que celle de l'équipe 2. En revanche cette dernière est plus régulière que la voiture de l'équipe 1. Le choix entre les deux équipes est donc un choix à faire entre performance moyenne et régularité.