(1) Proposer le Schéma de Formalisation pour la variable aléatoire correspondant à un futur lancer de dé.
Réponse
Expérience ℰ : Lancer un dé
Variable d’intérêt :Y la face supérieure du dé
Loi de proba :ℙ(Y=k) = 1/6 avec k = 1, ⋯, 6 (si le dé est équilibré).
(2) Quelle expérimentation mettriez-vous en oeuvre pour vérifier qu'un dé est rigoureusement non pipé (i.e. parfaitement équilibré) ? Pensez-vous qu'il existe un tel type de dé ?
(3) Application: Un expérimentateur propose l'expérience suivante avec un dé (en théorie vendu) équilibré et un autre dont il a volontairement légèrement déséquilibré une ou plusieurs de ses faces. Les résultats des deux dés sont fournis dans un ordre arbitraire dans les tableaux ci-dessous. Sauriez-vous reconnaître les deux dés et, en particulier, déterminer les probabilités d'apparition des faces (sachant que, pour chaque dé, il n'y a en théorie pas plus de 2 choix possibles pour celles-ci) ? A partir de combien de lancers ($m$) êtes-vous en mesure de faire votre choix ?
$m$
$\overline{\left({ y_{[\cdot]}=1}\right)}_{ m}$
$\overline{\left({ y_{[\cdot]}=2}\right)}_{ m}$
$\overline{\left({ y_{[\cdot]}=3}\right)}_{ m}$
$\overline{\left({ y_{[\cdot]}=4}\right)}_{ m}$
$\overline{\left({ y_{[\cdot]}=5}\right)}_{ m}$
$\overline{\left({ y_{[\cdot]}=6}\right)}_{ m}$
$\overline{\left({ y_{[\cdot]}}\right)}_{ m}$
100
$21\%$
$14\%$
$15\%$
$22\%$
$16\%$
$12\%$
$3.34$
1000
$15.5\%$
$16.8\%$
$17.3\%$
$17.1\%$
$15.9\%$
$17.4\%$
$3.533$
10000
$16.46\%$
$16.43\%$
$16.45\%$
$17.23\%$
$16.46\%$
$16.97\%$
$3.5171$
100000
$16.4\%$
$16.52\%$
$16.28\%$
$17.05\%$
$16.83\%$
$16.92\%$
$3.5214$
1000000
$16.47\%$
$16.52\%$
$16.49\%$
$16.85\%$
$16.77\%$
$16.89\%$
$3.5161$
$m$
$\overline{\left({ y_{[\cdot]}=1}\right)}_{ m}$
$\overline{\left({ y_{[\cdot]}=2}\right)}_{ m}$
$\overline{\left({ y_{[\cdot]}=3}\right)}_{ m}$
$\overline{\left({ y_{[\cdot]}=4}\right)}_{ m}$
$\overline{\left({ y_{[\cdot]}=5}\right)}_{ m}$
$\overline{\left({ y_{[\cdot]}=6}\right)}_{ m}$
$\overline{\left({ y_{[\cdot]}}\right)}_{ m}$
100
$13\%$
$13\%$
$16\%$
$21\%$
$23\%$
$14\%$
$3.7$
1000
$16.1\%$
$18.1\%$
$15.6\%$
$17.3\%$
$18.6\%$
$14.3\%$
$3.471$
10000
$16.92\%$
$17\%$
$16.47\%$
$16.91\%$
$17.13\%$
$15.57\%$
$3.4704$
100000
$16.73\%$
$16.64\%$
$16.53\%$
$16.59\%$
$16.88\%$
$16.63\%$
$3.5015$
1000000
$16.68\%$
$16.66\%$
$16.68\%$
$16.67\%$
$16.71\%$
$16.61\%$
$3.499$
(4) Pour comprendre comment ont été déterminés les résultats des tableaux précédents, proposer les instructions R permettant d'obtenir (avec yy désignant les 100 premiers lancers du dé équilibré):
Proportion de face 1 :
Résultat
Proportion de face 2 :
Résultat
Proportion des faces 2 ou 3 :
Résultat
Moyenne des faces :
Résultat
Proportion des faces entre 2 et 5 inclus :
Résultat
Proportion des faces entre 2 et 5 exclus :
Résultat
(5) Ayant à présent identifié (du moins nous l'espérons!) le dé équilibré, sauriez vous compléter le tableau suivant correspondant à l'éventuelle dernière ligne du tableau précédent lui correspondant :
$m$
$\overline{\left({ y_{[\cdot]}=1}\right)}_{ m}$
$\overline{\left({ y_{[\cdot]}=2}\right)}_{ m}$
$\overline{\left({ y_{[\cdot]}=3}\right)}_{ m}$
$\overline{\left({ y_{[\cdot]}=4}\right)}_{ m}$
$\overline{\left({ y_{[\cdot]}=5}\right)}_{ m}$
$\overline{\left({ y_{[\cdot]}=6}\right)}_{ m}$
$\overline{\left({ y_{[\cdot]}}\right)}_{ m}$
$\infty$
1/6
1/6
1/6
1/6
1/6
1/6
3.5
Comment noteriez-vous ces quantités via l'A.M.P. ?
(6) Considérons le dé (théoriquement) équilibré. Observons les expressions dans le tableau ci-dessous obtenues par le mathématicien (A.M.P.). Sauriez-vous les calculer (N.B. : c'est une question personnelle et il est donc possible de répondre NON) ? On rappelle (pour votre culture) les formules d'obtentions de la moyenne (ou espérance) de $Y$ :
$$
\mathbb{E}\left( Y \right)=\sum_{k=1}^6 k\times\mathbb{P}\left( Y=k \right)
$$
ainsi que celle de la variance
$$
\mathbb{V}ar\left( Y \right)=\sum_{k=1}^6 (k-\mathbb{E}\left( Y \right))^2\times\mathbb{P}\left( Y=k \right)=\mathbb{E}\left( Y^2 \right)-\mathbb{E}\left( Y \right)^2=\sum_{k=1}^6 k^2\times\mathbb{P}\left( Y=k \right)-\mathbb{E}\left( Y \right)^2
$$
$\mathbb{P}\left( Y\in [2,4[ \right)$
$\mathbb{E}\left( Y \right)$
$\mathbb{V}ar\left( Y \right)$
$\sigma({Y})$
$q_{ 5\%}\left( { Y} \right)$
$q_{ 50\%}\left( { Y} \right)$
$q_{ 95\%}\left( { Y} \right)$
$33.33\%$
$3.5$
$2.9167$
$1.7078$
$1$
$3.5$
$6$
(7) Remarque (pour les amateurs) : Puisque $\mathbb{P}\left( Y=k \right)=\frac16$, les valeurs du tableau pour $\mathbb{E}\left( Y \right)$, $\mathbb{V}ar\left( Y \right)$ et $q_{ p}\left( { Y} \right)$ ($p=5\%$, $50\%$ et $95\%$ ) ont simplement été obtenues en appliquant les formules de Statistique Descriptive pour la série de chiffres $1,2,3,4,5,6$.
(8) Comprenons comment ces quantités peuvent être obtenues (ou intreprétées) par l'expérimentateur en les confrontant à ses résultats sur $m=1000000$ lancers (A.E.P.). Proposez aussi les instructions R ayant permis de les construire sachant que ces résultats ont été stockés dans le vecteur yy en R.
(9) Quelle approche (A.M.P. ou A.E.P.) vous semble être la plus facile à appréhender ? Comprenez-vous les intérêts propres à chacune d'entre elles ?
Exercice 6 : Moyenne de deux dés
(1) Soient $Y_V$ et $Y_R$ deux variables aléatoires correspondant aux faces de 2 dés (Vert et Rouge) à lancer. Définissons $\overline Y=(Y_V+Y_R)/2$ correspondant à la moyenne, ici la demi-somme de deux faces.
Proposez le Schéma de Formalisation pour $\overline Y$.
Réponse
Expérience ℰ : Lancer de 2 dés
Variable d’intérêt :$\overline Y$ la moyenne des faces supérieures des 2 dés
Loi de proba :$\mathbb{P}\left( \overline Y=s/2 \right)=???$ avec s = 2, ⋯, 12.
(2) Comparez $\mathbb{P}\left( \overline Y=1 \right)$, $\mathbb{P}\left( \overline Y=6 \right)$ et $\mathbb{P}\left( \overline Y=3.5 \right)$. Sauriez-vous les évaluer ?
Réponse
Une erreur courante est de penser que toutes modalités sont équiprobables. Pourtant, il est assez intuitif de penser le contraire car il y a 6 possibilités (1 et 6, 2 et 5, 3 et 4, 4 et 3, 5 et 2, 6 et 1) pour obtenir la moyenne 3.5 et seulement une pour obtenir soit 1 soit 6. On est alors à même de penser que le résultat 3.5 est 6 fois plus probable que 1 ou 6. Comme il y a 36 (6 × 6) possibilités différentes pour les résultats des 2 dés (en tenant compte de leur couleur). On peut affirmer que : $\mathbb{P}\left( \overline Y=1 \right)=\mathbb{P}\left( \overline Y=6 \right)=\frac1{36}$ et $\mathbb{P}\left( \overline Y=3.5 \right)=\frac6{36}=\frac16$ Pour les évaluations des probas, voir le calcul ci-après proposé par le mathématicien.
(3) Que peut-on espérer en moyenne sur la valeur de $M$ ? (cette quantité rappelons-le est notée $\mathbb{E}\left( \overline Y \right)$).
Réponse
On peut espèrer la valeur $(1+2+3+4+5+6)/6=(7× 3)/6=7/2=3.5$).
(4) Un joueur se propose de lancer $m=5000$ fois deux dés. A chaque lancer, il note la moyenne et stocke l'ensemble des informations dans un vecteur noté ym en R. Voici quelques résultats d'instructions R :
Pourriez-vous proposer les notations mathématiques (norme CQLS) correspondant aux résultats obtenus dans la sortie R ci-dessus ?
Cette approche expérimentale confirme-t-elle le résultat du mathématicien affirmant que pour toute modalité $s/2$ de $\overline Y$ avec $s=2,\cdots,12$ (les modalités de la somme $S=2× \overline Y$ des 2 dés),
$$
\mathbb{P}\left( \overline Y=s/2 \right)= \mathbb{P}\left( 2× \overline Y=s \right) = \left\{ \begin{array}{ll}
\frac{s-1}{36} & \text{ si } s\leq 7 \\
\frac{13-s}{36} & \text{ si } s \geq 7
\end{array} \right.
$$
Voici les résultats de l'A.M.P. présentés dans le tableau suivant (que vous pouvez vérifier si vous avez l'âme d'un mathématicien) :
$\mathbb{P}\left( \overline Y=1 \right)$
$\mathbb{P}\left( \overline Y=3.5 \right)$
$\mathbb{P}\left( \overline Y=6 \right)$
$\mathbb{E}\left( \overline Y \right)$
$\mathbb{V}ar\left( \overline Y \right)$
$2.78\%$
$16.67\%$
$2.78\%$
$3.5$
$1.4583$
Réponse
Les premières instructions proposent les évaluations de $\overline{\left({ {\overline y}_{[\cdot]}=s/2}\right)}_{ 5000}$ pour $s=2,12,7$. On retrouve le résultat
$$
\overline{\left({ {\overline y}_{[\cdot]}=s/2}\right)}_{ 5000} \simeq \overline{\left({ {\overline y}_{[\cdot]}=s/2}\right)}_{ +\infty} = \mathbb{P}\left( \overline Y=s/2 \right).
$$
(5) Pourriez-vous aussi vérifier la validité des formules sur l'espérance et variance de la moyenne de variables aléatoires réelles en s'appuyant sur les résultats de l'A.M.P. fournis ci-après.
Résumé A.M.P.
Soit $λ$ un réel et $Y_1$ et $Y_2$ deux variables indépendantes,
Espérance (ou Moyenne)$: \mathbb{E}\left( Y_1+Y_2 \right)=\mathbb{E}\left( Y_1 \right)+\mathbb{E}\left( Y_2 \right)$ et $\mathbb{E}\left( λ Y \right)=λ \mathbb{E}\left( Y \right)$
Variance$: \mathbb{V}ar\left( Y_1+Y_2 \right)=\mathbb{V}ar\left( Y_1 \right)+\mathbb{V}ar\left( Y_2 \right)$ et $\mathbb{V}ar\left( λ Y \right)=λ^2 \mathbb{V}ar\left( Y \right)$
Réponse
\begin{eqnarray*}
\mathbb{E}\left( \overline Y \right)&=&\mathbb{E}\left( (Y_1+Y_2)/2 \right)=\mathbb{E}\left( Y_1+Y_2 \right)/2 \\
&=&(\mathbb{E}\left( Y_1 \right)+\mathbb{E}\left( Y_2 \right))/2=7/2=3.5 \\
&\simeq& \mathtt{mean(ym)=3.5031}\\
&et& \\
\mathbb{V}ar\left( \overline Y \right)&=&\mathbb{V}ar\left( (Y_1+Y_2)/2 \right)=\mathbb{V}ar\left( Y_1+Y_2 \right)/4 \\
&=&(\mathbb{V}ar\left( Y_1 \right)+\mathbb{V}ar\left( Y_2 \right))/4=1.458333 \\
&\simeq& \mathtt{var(ym)=1.468134}
\end{eqnarray*}
puisque les 2 dés sont naturellement indépendants entre eux.
Exercice 7 : Réel au hasard sur l'intervalle unité
(1) Soit $Y_1$ une variable aléatoire suivant une loi uniforme sur $[0,1]$ (en langage math., $Y_1\leadsto \mathcal{U}([0,1])$), correspondant au choix ``au hasard'' d'un réel dans l'intervalle $[0,1]$.
L'objectif est l'évaluation (exacte ou approximative) des probabilités suivantes $\mathbb{P}\left( Y_1=0.5 \right)$ et $\mathbb{P}\left( 0.25 < Y_1 < 0.5 \right)$, le chiffre moyen $\mathbb{E}\left( Y_1 \right)$ (espéré), l'écart-type $\sigma(Y_1)$ ainsi que la variance $\mathbb{V}ar\left( Y_1 \right)$ ?
Parmi ces quantités, lequelles sauriez-vous intuitivement (i.e. sans calcul) déterminer ?
Réponse
Intuitivement, il est possible de dire que $\mathbb{P}\left( Y_1=0.5 \right)=0$, $\mathbb{P}\left( 0.25 < Y_1 < 0.5 \right)=25\%$ et $\mathbb{E}\left( Y_1 \right)=1/2$.
(2) Via A.E.P. : Un expérimentateur réalise cette expérience en choisissant 10000 réels au hasard (par exemple en tapant 10000 fois sur la touche RAND d'une calculatrice). Il stocke les informations dans son logiciel préféré (libre et gratuit) R dans un vecteur noté y1. Déterminez approximativement les quantités de la première question.
(3) Via A.M.P. : Un mathématicien obtient par le calcul les résultats suivant pour une variable aléatoire $Y$ représentant un chiffre au hasard dans l'intervalle $[a,b]$ (i.e. $Y\leadsto\mathcal{U}([a,b])$) :
pour tout a ≤ t1 ≤ t2 ≤ b, $\mathbb{P}\left( t_1\leq Y \leq t_2 \right)=\frac{t_2-t_1}{b-a}$ .
$\mathbb{E}\left( Y \right)=\frac{a+b}2$
$\mathbb{V}ar\left( Y \right)=\frac{(b-a)^2}{12}$
(4) Question optionnelle : lesquels de ces résultats vous semblent intuitifs (i.e. déterminables sans calcul) ?
Déterminez exactement les quantités de la première question.
R>1/12
[1] 0.08333333R> sqrt(1/12)
[1] 0.2886751
Réponse
Ce résultat correspond au calcul de
$\left({\overleftrightarrow{\left({ y_{1,[\cdot]}}\right)}_{ 1000}}\right)^2 =0.08296901 \simeq \left({\overleftrightarrow{\left({ y_{1,[\cdot]}}\right)}_{ \infty}} \right)^2=\mathbb{V}ar\left( Y_1 \right)=1/12\simeq 0.0833$.
(5) L'A.E.P. confirme-t'elle les résultats théoriques de l'A.M.P. ?
Exercice 8
(1) On se propose maintenant d'étudier la variable $\overline Y=(Y_1+Y_2)/2$ où $Y_1$ et $Y_2$ sont deux variables aléatoires indépendantes suivant une loi uniforme sur $[0,1]$. Quel est l'ensemble des valeurs possibles (ou modalités) de $\overline Y$ ? Pensez-vous que la variable $\overline Y$ suive une loi uniforme ?
Nous nous proposons d'évaluer (excatement ou approximativement) les probabilités $\mathbb{P}\left( 0< \overline Y \leq \frac14 \right)$, $\mathbb{P}\left( \frac38< \overline Y \leq \frac58 \right)$, $\mathbb{P}\left( \frac34< \overline Y \leq 1 \right)$, la moyenne $\mathbb{E}\left( \overline Y \right)$, l'écart-type $\sigma(\overline Y)$ et la variance $\mathbb{V}ar\left( \overline Y \right)$. Lesquelles parmi ces quantités sont déterminables intuitivement ou via un simple calcul mental ? Etes-vous capable de comparer les trois probabilités précédentes ?
Réponse
Sans développement mathématique trop compliqué, on peut affirmer que
$\mathbb{E}\left( \overline Y \right)=(\mathbb{E}\left( Y_1 \right)+\mathbb{E}\left( Y_2 \right))/2=0.5$,
$\mathbb{V}ar\left( \overline Y \right)=(\mathbb{V}ar\left( Y_1 \right)+\mathbb{V}ar\left( Y_2 \right))/4=2\frac1{12}/4=\frac1{24}$,
$\sigma(\overline Y)=\sqrt{\mathbb{V}ar\left( \overline Y \right)}=\frac1{\sqrt{24}}=\frac1{2\sqrt{6}}$,
$\mathbb{P}\left( 0< \overline Y \leq \frac14 \right)$ et $\mathbb{P}\left( \frac38< \overline Y \leq 1 \right)$ sont les mêmes tandis que $\mathbb{P}\left( \frac38< \overline Y \leq \frac58 \right)$ est la plus grande des probabilités d’appartenance de $\overline Y$ à un intervalle de longueur $\frac14$.
(2) Via A.E.P. : Un expérimentateur réalise à nouveau l'expérience de choisir 10000 réels entre 0 et 1. Les informations sont stockées dans le vecteur y2. Déterminez approximativement les quantités de la premire question.
(3) Via l'A.M.P. : Par des développements plutôt avancés, le mathématicien obtient pour tout réel $t$ :
$$
\mathbb{P}\left( \overline Y\leq t \right)=\mathbb{P}\left( S:=2\times \overline Y\leq 2×t \right)= \left\{ \begin{array}{ll}
0 & \text{ si } t\leq 0 \\
2t^2 & \text{ si } 0\leq t\leq 1/2 \\
4t-1-2t^2& \text{ si } 1/2 \leq t \leq 1 \\
1 & \text{ si } t\geq 1
\end{array} \right..
$$
Etes-vous en mesure de déterminer les valeurs exactes de la première question ?
Réponse
$\mathbb{P}\left( 0 < \overline Y \leq \frac14 \right)= \mathbb{P}\left( \overline Y \leq \frac14 \right)= 2(\frac14)^2 = \frac18$
$\mathbb{P}\left( \frac34 < \overline Y \leq 1 \right) = \mathbb{P}\left( \overline Y \leq 1 \right) - \mathbb{P}\left( \overline Y \leq \frac34 \right)=1 - \frac78= \frac18$
$\mathbb{P}\left( \frac38 < \overline Y \leq \frac58 \right) = \mathbb{P}\left( \overline Y \leq \frac58 \right) - \mathbb{P}\left( \overline Y \leq \frac38 \right) = \frac{80-32-25}{32} -\frac9{32}=\frac{7}{16}.$
(4) L'A.E.P. confirme-t'elle les résultats théoriques de l'A.M.P. ?