Un psychologue est intéressé par le rapport adjectif-verbe pour caractériser le style de discours d'un individu. Il veut alors savoir s'il y a une différence de style entre les étudiants. Un échantillon de 10 étudiants de chaque formation est choisi. Chque étudiant écrit un ensemble de textes libres. Le rapport entre le nombre de verbes et le nombre d'adjectifs utilisés par chaque est étudiant est donné dans le tableau suivant :
$$
\begin{array}{|c|c:c:c:c:c:c:c:c:c:c|}\hline
scientifique&1.04& 0.93& 0.75& 0.33& 1.62& 0.76& 0.97& 1.21& 0.8 &1.18 \\\hline
litteraire& 1.32& 2.3 & 1.98 &0.59& 1.02 &0.88& 0.92& 1.39 &1.95 &1.25 \\
\hline
\end{array}
$$
(1) Peut-on plutôt penser que les scientifiques d'une part et les littéraires d'autre part utilisent plus de deux fois plus d'adjectifs que de verbes ?
Hypothèses de test : $\mathbf{H}_0:$ $\mu^{sc}=0.5$ vs $\mathbf{H}_1:$ $\mu^{sc}>0.5$
Statistique de test sous $\mathbf{H}_0$ :
$$
\widehat{ \delta_{\mu^{sc},0.5} }\left({\bold{ { Y^{sc} } }}\right) = {\displaystyle \frac{\widehat{ \mu^{sc} }\left({\bold{ { Y^{sc} } }}\right)-0.5}{
\widehat{ \sigma_{\widehat{ \mu^{sc}}} }\left({\bold{ { Y^{sc} } }}\right)
}} \leadsto \mathcal{S}t(10-1)
$$
Règle de décision : Accepter $\mathbf{H}_1$ si
p-valeur (droite) < $5\%$
Conclusion :
puisqu'au vu des données,
$$
p-valeur\overset{\mathtt{R}}{=}\mathtt{1-pt((mean(sc)-0.5)/seMean(sc),9)} \simeq 0.11\% < 5\%,
$$
on peut (plutôt) penser (avec un risque de $5\%$) que les scientifiques utilisent en moyenne plus de deux fois plus d'adjectifs que de verbes.
Hypothèses de test : $\mathbf{H}_0:$ $\mu^{litt}=0.5$ vs $\mathbf{H}_1:$ $\mu^{litt}>0.5$
Statistique de test sous $\mathbf{H}_0$ :
$$
\widehat{ \delta_{\mu^{litt},0.5} }\left({\bold{ { Y^{litt} } }}\right) = {\displaystyle \frac{\widehat{ \mu^{litt} }\left({\bold{ { Y^{litt} } }}\right)-0.5}{
\widehat{ \sigma_{\widehat{ \mu^{litt}}} }\left({\bold{ { Y^{litt} } }}\right)
}} \leadsto \mathcal{S}t(10-1)
$$
Règle de décision : Accepter $\mathbf{H}_1$ si
p-valeur (droite) < $5\%$
Conclusion :
puisqu'au vu des données,
$$
p-valeur\overset{\mathtt{R}}{=}\mathtt{1-pt((mean(litt)-0.5)/seMean(litt),9)} \simeq 0.04\% < 5\%,
$$
on peut (plutôt) penser (avec un risque de $5\%$) que les littéraires utilisent en moyenne plus de deux fois plus d'adjectifs que de verbes.
(2) Peut-on penser que le discours des littéraires est plus littéraire que celui des scientifiques avec un risque d'erreur de 5\% ?
R># deltaEst.H0 <- (instruction R à fournir dans la rédaction)R>deltaEst.H0
[1] -1.945469R> pt(deltaEst.H0,18)
[1] 0.03375338
Réponse
Préliminaire : puisque $\mathtt{(mean(sc)-mean(litt)-0)}\simeq-0.401$ est du même signe (i.e. négatif) que $\mathtt{deltaEst.H0}$ (car p-valeur gauche inférieure à $50\%$), on a :
Hypothèses de test : $\mathbf{H}_0:$ $d_\mu=0$ vs $\mathbf{H}_1:$ $d_\mu<0$
Statistique de test sous $\mathbf{H}_0$ :
$$
\widehat{ \delta_{d_\mu,0} }\left({\bold{ { Y^{sc},Y^{litt} } }}\right) = {\displaystyle \frac{\widehat{ d_\mu }\left({\bold{ { Y^{sc},Y^{litt} } }}\right)-0}{
\widehat{ \sigma_{\widehat{ d_\mu}} }\left({\bold{ { Y^{sc},Y^{litt} } }}\right)
}} \leadsto \mathcal{S}t(10+10-2)
$$
Règle de décision : Accepter $\mathbf{H}_1$ si
p-valeur (gauche) < $5\%$
Conclusion :
puisqu'au vu des données,
$$
p-valeur\overset{\mathtt{R}}{=}\mathtt{pt((mean(sc)-mean(litt)-0)/seDMeanG(sc,litt),18)} \simeq 3.38\% < 5\%,
$$
on peut (plutôt) penser (avec un risque de $5\%$) que le discours des littéraire est en moyenne plus littéraire que celui des scientifiques.
Traitement hors exercice pour vérifier si l'hypothèse sur l'égalité des variances n'était pas abusive :
R># deltaEst.H0 <- (instruction R à fournir dans la rédaction)R>deltaEst.H0
[1] 0.3837905R> pf(deltaEst.H0,9,9)
[1] 0.08494635
Hypothèses de test : $\mathbf{H}_0:$ $r_{\sigma^2}=1$ vs $\mathbf{H}_1:$ $r_{\sigma^2}\neq1$
Statistique de test sous $\mathbf{H}_0$ :
$$
\widehat{ \delta_{r_{\sigma^2},1} }\left({\bold{ { Y^{sc},Y^{litt} } }}\right) = {\displaystyle \frac{\widehat{ r_{\sigma^2} }\left({\bold{ { Y^{sc},Y^{litt} } }}\right)}{1}} \leadsto \mathcal{F}(10-1,10-1)
$$
Règle de décision : Accepter $\mathbf{H}_1$ si
p-valeur (biltatérale) < $5\%$
Conclusion :
puisqu'au vu des données,
$$
p-valeur\overset{\mathtt{R}}{=}\mathtt{2*pf((var(sc)/var(litt))/1,9,9)} \simeq 16.99\%\nless5\%,
$$
on NE peut PAS (plutôt) penser (avec un risque de $5\%$) que les variances des rapports adjectif-verbe sont différentes.