Exercice 34 : Effet des vacances sur la connaissance des étudiants
Un enseignant veut savoir si les vacances nuisent au suivi des connaissances. Il commence tout d'abord par évaluer le niveau moyen avant les vacances. Le niveau de compréhension d'un étudiant est évalué par un devoir dont la note est comprise entre 0 et 10. Il considère que le niveau moyen de compréhension est satisfaisant si la note moyenne (que l'on notera $\mu^{AV}$) de l'ensemble des étudiants de la promotion est strictement supérieure à 6. Pour appuyer son analyse, il n'interroge que 40 individus et stocke les informations dans un vecteur \texttt{yAV} (\textbf{les traitements R sont fournis en fin de document}).
(1)
Avec un risque d'erreur de première espèce préfixé à $5\%$, l'enseignant parvient-il à montrer que le niveau moyen de compréhension est satisfaisant ?
R>yAV
[1] 67876977899598898595878858689769569985
[39] 65R> mean(yAV)
[1] 7.275R># deltaEst.H0 <- (instruction R à fournir dans la rédaction)R> pnorm(deltaEst.H0)
[1] 1
Réponse
Hypothèses de test : $\mathbf{H}_0:$ $\mu^{AV}=6$ vs $\mathbf{H}_1:$ $\mu^{AV}>6$
Statistique de test sous $\mathbf{H}_0$ :
$$
\widehat{ \delta_{\mu^{AV},6} }\left({\bold{ { Y^{AV} } }}\right) = {\displaystyle \frac{\widehat{ \mu^{AV} }\left({\bold{ { Y^{AV} } }}\right)-6}{
\widehat{ \sigma_{\widehat{ \mu^{AV}}} }\left({\bold{ { Y^{AV} } }}\right)
}} \underset{Approx.}{\leadsto} \mathcal{N}(0,1)
$$
Règle de décision : Accepter $\mathbf{H}_1$ si
p-valeur (droite) < $5\%$
Conclusion :
puisqu'au vu des données,
$$
p-valeur\overset{\mathtt{R}}{=}\mathtt{1-pnorm((mean(yAV)-6)/seMean(yAV))} \simeq 0.0\% < 5\%,
$$
on peut (plutôt) penser (avec un risque de $5\%$) que le niveau moyen de compréhension est satisfaisant.
(2)
Proposez l'instruction $\mathtt{R}$, permettant d'obtenir l'intervalle de confiance au niveau de confiance $95\%$ de la note moyenne.
R># IC <- (Instruction R à fournir dans la rédaction)R>IC
[1] 6.825717.72429
(3)
Avec un risque d'erreur de première espèce préfixé à $5\%$, l'enseignant parvient-il à montrer \redstd que l'hétérogénéité des notes est faible c'est-à-dire que la variance des notes est inférieure à 3 ?
R> var(yAV)
[1] 2.101923R># deltaEst.H0 <- (instruction R à fournir dans la rédaction)R>deltaEst.H0
[1] -3.147746
Réponse
Hypothèses de test : $\mathbf{H}_0:$ $\sigma^2_{AV}=3$ vs $\mathbf{H}_1:$ $\sigma^2_{AV}<3$
Statistique de test sous $\mathbf{H}_0$ :
$$
\widehat{ \delta_{\sigma^2_{AV},3} }\left({\bold{ { Y^{AV} } }}\right) = {\displaystyle \frac{\widehat{ \sigma^2_{AV} }\left({\bold{ { Y^{AV} } }}\right)-3}{
\widehat{ \sigma_{\widehat{ \sigma^2_{AV}}} }\left({\bold{ { Y^{AV} } }}\right)
}} \underset{Approx.}{\leadsto} \mathcal{N}(0,1)
$$
Règle de décision : Accepter $\mathbf{H}_1$ si
$\widehat{ \delta_{\sigma^2_{AV},3} }\left({\bold{ { y^{AV} } }}\right) < \delta^-_{lim,5\%}$
Conclusion :
puisqu'au vu des données,
$$\begin{aligned}
\widehat{ \delta_{\sigma^2_{AV},3} }\left({\bold{ { y^{AV} } }}\right) &\overset{\mathtt{R}}{=} \mathtt{(var(yAV)-3)/seVar(yAV)}\simeq -3.147746\\& < \delta^-_{lim,5\%} \overset{\mathtt{R}}{=} \mathtt{-qnorm(1-.05)}\simeq-1.644854
\end{aligned}$$
on peut (plutôt) penser (avec un risque de $5\%$) que l'hétérogénéité des notes est faible.
(4)
Après les vacances, 30 nouveaux étudiants sont invités à passer le même devoir. Les informations sont stockées dans le vecteur $\mathtt{yAP1}$ (voir fin exercice). On notera $\mu^{AP1}$ la note moyenne obtenue à ce devoir par l'ensemble des étudiants après les vacances. L'enseignant peut-il penser \redstd, au seuil de $5\%$, que les vacances sont nuisibles dans le sens que le niveau moyen de compréhension a diminué de plus de deux points ?
R>yAP1
[1] 554757655477445555564655656575R> mean(yAP1)
[1] 5.333333R># deltaEst.H0 <- (instruction R à fournir dans la rédaction)R> pnorm(deltaEst.H0)
[1] 0.4198664
Réponse
Préliminaire : puisque $\mathtt{(mean(yAV)-mean(yAP1)-2)}\simeq-0.05833333$ est du même signe (i.e. négatif) que $\mathtt{deltaEst.H0}$ (car p-valeur gauche inférieure à $50\%$), on a :
Hypothèses de test : $\mathbf{H}_0:$ $d_\mu=2$ vs $\mathbf{H}_1:$ $d_\mu>2$
Statistique de test sous $\mathbf{H}_0$ :
$$
\widehat{ \delta_{d_\mu,2} }\left({\bold{ { Y^{AV},Y^{AP1} } }}\right) = {\displaystyle \frac{\widehat{ d_\mu }\left({\bold{ { Y^{AV},Y^{AP1} } }}\right)-2}{
\widehat{ \sigma_{\widehat{ d_\mu}} }\left({\bold{ { Y^{AV},Y^{AP1} } }}\right)
}} \underset{Approx.}{\leadsto} \mathcal{N}(0,1)
$$
Règle de décision : Accepter $\mathbf{H}_1$ si
p-valeur (droite) < $5\%$
Conclusion :
puisqu'au vu des données,
$$
p-valeur\overset{\mathtt{R}}{=}\mathtt{1-pnorm((mean(yAV)-mean(yAP1)-2)/seDMean(yAV,yAP1))} \simeq 58.01\%\nless5\%,
$$
on NE peut PAS (plutôt) penser (avec un risque de $5\%$) que le niveau moyen de compréhension a diminué de plus de deux points.
(5)
Peut-on plutôt penser (Rédaction abrégée) avec un risque d'erreur de $5\%$ que la variance des notes après les vacances est plus de 2 fois plus grande qu'avant les vacances ?
R> var(yAP1)
[1] 0.9195402R># deltaEst.H0 <- (instruction R à fournir dans la rédaction)R> pnorm(deltaEst.H0)
[1] 0.9991686
Réponse
Préliminaire : puisque $\mathtt{(var(yAV)/var(yAP1)-0.5)}\simeq1.785841$ est du même signe (i.e. positif) que $\mathtt{deltaEst.H0}$ (car p-valeur gauche supérieure à $50\%$), on a :
$r_{\sigma^2}=\displaystyle \frac{\sigma^2_{AV}}{\sigma^2_{AP1}}$ Affirmation d'intérêt : $\mathbf{H}_1:$ $r_{\sigma^2}<0.5$ avec $r_{\sigma^2}=\displaystyle \frac{\sigma^2_{AV}}{\sigma^2_{AP1}}$
Application numérique : puisqu'au vu des données,
$$
p-valeur\overset{\mathtt{R}}{=}\mathtt{pnorm((var(yAV)/var(yAP1)-0.5)/seRVar(yAV,yAP1))} \simeq 99.92\%\nless5\%,
$$
on NE peut PAS (plutôt) penser (avec un risque de $5\%$) que la variance des notes après les vacances est plus de 2 fois plus grande qu'avant les vacances.
(6)
Pensant que le problème précédent est mal posé (puisque ce ne sont pas les mêmes étudiants qui ont passé le devoir avant et après les vacances), il demande aux 40 étudiants ayant passé le devoir avant les vacances de le repasser. On stocke les notes associées à dans le vecteur $\mathtt{yAP2}$ (voir fin exercice). Avec un risque d'erreur de première espèce préfixé à $5\%$, l'enseignant parvient-il à prouver (Rédaction abrégée) que les vacances sont nuisibles dans le sens que le niveau moyen de compréhension a diminué de plus de deux points (et qu'il faudrait donc les supprimer) ?
R>yAP2
[1] 23542646776267654253737736345547248773
[39] 54R> mean(yAP2)
[1] 4.825R># deltaEst.H0 <- (instruction R à fournir dans la rédaction)R> pnorm(deltaEst.H0)
[1] 0.9948867
Réponse
Préliminaire : puisque $\mathtt{(mean(yAV-yAP2)-2)}\simeq0.45$ est du même signe (i.e. positif que $\mathtt{deltaEst.H0}$ (car p-valeur gauche supérieure à $50\%$), on a :
variable d'intérêt : $Y^{D}=Y^{AV}-Y^{AP2}$
paramètre d'intérêt : $\mu^{D}$=moyenne de $Y^{D}$=$\mu^{AV}-\mu^{AP2}$
Hypothèses de test : $\mathbf{H}_0:$ $\mu^{D}=2$ vs $\mathbf{H}_1:$ $\mu^{D}>2$
Statistique de test sous $\mathbf{H}_0$ :
$$
\widehat{ \delta_{\mu^{D},2} }\left({\bold{ { Y^{D} } }}\right) = {\displaystyle \frac{\widehat{ \mu^{D} }\left({\bold{ { Y^{D} } }}\right)-2}{
\widehat{ \sigma_{\widehat{ \mu^{D}}} }\left({\bold{ { Y^{D} } }}\right)
}} \underset{Approx.}{\leadsto} \mathcal{N}(0,1)
$$
Règle de décision : Accepter $\mathbf{H}_1$ si
p-valeur (droite) < $5\%$
Conclusion :
puisqu'au vu des données,
$$
p-valeur\overset{\mathtt{R}}{=}\mathtt{1-pnorm((mean(yAV-yAP2)-2)/seMean(yAV-yAP2))} \simeq 0.51\% < 5\%,
$$
on peut (plutôt) penser (avec un risque de $5\%$) que le niveau moyen de compréhension a diminué de plus de deux points.