Probabilités

Loi Binomiale

D’une épreuve de Bernoulli à la loi binomiale :



Le petit programme ci-dessous permet de déterminer l’intervalle de fluctuation pour un seuil donné.

Et on pourra vérifier l’intervalle graphiquement avec l’applet suivant.


Loi normale

La célèbre gaussienne (ou courbe en cloche) :


On peut à nouveau tirer profit de l’applet géogebra qui précède pour obtenir des intervalles de fluctuation.


Densité de probabilités

Nouvelle énigme permettant de parler des densités de probabilité :

Quelle est la distance moyenne entre deux points pris au hasard sur un segment ?



On peut vérifier la solution statistiquement avec un petit programme simplissime :



Probabilités conditionnelles et Bayes

Les probabilités conditionnelles au tribunal, chez le médecin et dans un vieux jeu télévisé américain :


Chaînes de Markov

Le jeu de Penney a d’étonnantes propriétés. Les chaînes de Markov aident à le démystifier :



Curiosités et énigmes

Spaghetti et inégalité triangulaire

Une petite énigme à base d’inégalité triangulaire :

Quelle est la probabilité de pouvoir faire un triangle avec les 3 bouts obtenus en cassant aléatoirement un spaghetti en deux endroits ?



Anniversaires simultanés

Quelle est la probabilité que deux élèves d’une classe est un anniversaire le même jour ?

Lorsqu’on n’a jamais fait le calcul ou entendu parler du résultat, notre intuition nous amène généralement à soupçonner une probabilité bien plus petite qu’elle ne l’est.
C’est d’ailleurs assez fréquent que notre intuition soit aux fraises lorsqu’il s’agit d’estimer une probabilité ou expliquer des statistiques (voir le paradoxe de Simpson).



Paradoxe des deux enfants

Le paradoxe des deux enfants repose grandement sur la formulation et provoque encore parfois des débats passionnés.




Paradoxe de Cover

Où comment un tirage aléatoire permet de gagner de l’information !

On vous présente deux papiers pliés où sont écrits deux nombres choisis aléatoirement $a$ et $b$.

Vous choisissez un des deux papiers et l’ouvrez pour découvrir le nombre $X$ (soit $a$, soit $b$). Puis on vous demande lequel des deux papiers contient le plus grand nombre.

Cela semble du 50-50, et pourtant… Si vous tirez un nombre aléatoire $Z$ selon une distribution continue sur $\mathbb{R}$, vous pouvez augmenter vos chances ! Il suffit de comparer $Z$ à $X$ : si $Z>X$ vous choisissez $Y$ comme plus grand nombre (l’autre papier) et si $Z<X$, vous choisissez $X$.

Dans le code ci-dessous, on tire deux nombres aléatoires $a$ et $b$ selon une distribution normale centrée sur 0 et d’écart-type 100, puis on tire au sort le nombre $X$. Petite différence par rapport à ce qui précède, on se sert d’une fonction logistique pour “envoyer” $X$ entre 0 et 1 puis on le compare à un $Z$ tiré uniformément entre 0 et 1.
On voit qu’on obtient alors un taux de succès autour de 75% !

Par quel miracle ?

Déjà, comme $Z$ est issue d’une loi continues, on n’aura jamais $Z=a$ ou $Z=b$ et pour que la méthode permette de deviner correctement, il faut que :

  • $X=\max(a,b)$ (une chance sur deux) et $Z<X$
  • $X=\min(a,b)$ (une chance sur deux) et $Z>X$

La probabilité de succès est donc :

D'où $P_\text { succ }=\frac{1}{2}P(Z<\max (a, b))+\frac{1}{2}[1-P(Z<\min (a, b))]=\frac{1}{2}+\frac{1}{2}[P(Z<\max (a, b))-P(Z < \min (a, b))]=\frac{1}{2}+\tfrac12\color{#970E53}P\left(\min(a,b) < Z<\max(a,b)\right)$
Puisque $Z$ suit une loi continue ${\color{#970E53}P\left(\min(a,b) < Z<\max(a,b)\right)}>0$. On se retrouve donc bien avec une probabilité supérieure à $\tfrac12$.

Dans une démonstration similaire (qu’on retrouve dans cet article de John Baez retraçant l’origine du paradoxe), Greg Egan utilise une fonction $f:\mathbb{R}\rightarrow ]0,1[$ strictement croissante (si $x<y$, $f(x)<f(y)$) pour ramener $X$ dans $]0,1[$. C’est en suivant cette méthode qu’on a utilisé dans le code la fonction logistique $f(x)=\frac{\mathrm{e}^x}{\mathrm{e}^x +1}$.
Le nombre aléatoire $Z$ est alors choisi uniformément entre $0$ et $1$ et on compare $Z$ à $f(X)$ plutôt qu’à $X$.
Supposons $a>b$.
La probabilité de deviner correctement devient :

On obtient ainsi $P_\text { succ }=\frac{1}{2}+\frac{1}{2}(f(a)-f(b))>\frac{1}{2}$ puisque $f(a)>f(b)$ par croissance stricte de $f$.

Les deux démonstrations sont équivalentes. Suffit de poser $f(x)=P(Z<x)$ (bien strictement croissante) pour s’en convaincre. $P_\text { succ }$ devient alors $\frac{1}{2}+\frac{1}{2}(P(Z<\max(a,b))-P(Z<\min(a,b))$.

Dans le code ci-dessus, les nombres $a$ et $b$ sont volontairement très éloignés de 0 ($\sigma=100$). La fonction logistique donne alors soit $\approx 0$ (nombre $\ll 0$), soit $\approx 1$ (nombre $\gg 0$). Donc $f(a)-f(b)$ va donner $1$ lorsque $a$ et $b$ sont de signes différents (50% des cas) et $0$ dans les autres cas. Ça nous donne une espérance de succès de $\tfrac12+\tfrac12\tfrac12=\tfrac34$.
En diminuant $\sigma$, on diminue le pourcentage de succès (on retrouve que l’efficacité de la méthode est d’autant plus grande que $Z$ a de chances d’être entre $a$ et $b$).

Si $a$, $b$ et $Z$ sont tirés uniformément dans $[0,1]$, on obtient une espérance de succès de $\tfrac23$. En effet, on a alors $P_\text { succ }(a,b)=\tfrac12 + \tfrac12|a-b|$. Or comme on l’a vu plus haut, $\mathbb{E}[|a-b|]=\tfrac13$, donc $\mathbb{E}[P_\text{succ}(a,b)]=\tfrac12+\tfrac12\tfrac13=\tfrac23$.

Cela finit par sérieusement perdre de sa magie… Si la loi d’où est tiré $Z$ est adaptée aux valeurs de $a$ et $b$, tout va pour le mieux, mais dès que ce n’est plus le cas, on se retrouve bêtement autour de 50%… Il suffit par exemple d’un $\mu\gg\sigma$ dans loi normale du code. La fonction logistique va envoyer tout le monde sur $\approx 1$ et on n’aura quasi jamais $Z>f(a)$.

Certes, le hasard permet d’augmenter ses chances, mais tant que la distribution des nombres sur les papiers et celle du nombre aléatoire tiré ne se correspondent pas, l’avantage obtenu sera infinitésimal… Le tirage n’apporte donc en soit aucune information importante. Celle-ci viendrait plutôt du choix adéquat de la distribution de $Z$ puisqu’il impliquerait de connaître celle de $a$ et $b$ !