Paradoxe des deux enveloppes

Paradoxe des deux enveloppes.

En théorie de la décision, le paradoxe des deux enveloppes est un raisonnement probabiliste aboutissant à un résultat absurde. Inspiré d'un problème posé en 1930 par le mathématicien belge M. Kraïtchik[1], ce paradoxe a été formulé par Martin Gardner[2] en 1982. Il en existe plusieurs réfutations, certaines[3] ne faisant d'ailleurs pas appel au calcul des probabilités.

Énoncé

Il existe plusieurs variantes du paradoxe. Le plus souvent, il est proposé la situation de décision suivante[4],[5] : deux enveloppes contiennent chacune un chèque. On sait que l'un des chèques porte un montant double de l'autre, mais on n'a aucune information sur la façon dont les montants ont été déterminés. Un animateur propose à un candidat de choisir une des enveloppes, le montant du chèque contenu dans l'enveloppe choisie lui sera acquis.

Le paradoxe proprement dit réside dans l'argument qui va suivre : avant que le candidat n'ouvre l'enveloppe choisie, l'animateur lui conseille de changer son choix avec le raisonnement suivant.

Soit V {\displaystyle V} la valeur du chèque dans l'enveloppe choisie. Il y a deux cas possibles :

  • une chance sur deux que l'autre enveloppe contienne un chèque deux fois plus important (donc de valeur 2 V {\displaystyle 2V} ) ;
  • une chance sur deux que l'autre enveloppe contienne un chèque deux fois plus petit (donc de valeur V / 2 {\displaystyle V/2} ).

L'espérance du montant obtenu en changeant d'enveloppe serait alors E p r = 50 % × 2 V + 50 % × V / 2 = V + V / 4 = 5 / 4 × V {\displaystyle E_{pr}=50\%\times 2V+50\%\times V/2=V+V/4=5/4\times V} qui est supérieur à V {\displaystyle V} .

Le candidat aurait donc intérêt à changer d'enveloppe, ce qui est absurde puisque les deux enveloppes jouent le même rôle, et que le candidat, n'ayant pas encore ouvert la première, n'a aucun moyen de les distinguer.

Résolutions du paradoxe

Calcul d’espérances mathématiques

L'espérance mathématique permet de définir sur un grand nombre d'épreuves le gain moyen d'une loi de probabilité.

Espérance mathématique associée à chaque enveloppe

Afin de déterminer le gain moyen obtenu par le choix d’une enveloppe, on associe à la première enveloppe (resp. la seconde) la variable aléatoire X 1 {\displaystyle X_{1}} (resp. X 2 {\displaystyle X_{2}} ).

La loi de probabilité de la variable aléatoire X 1 {\displaystyle X_{1}} est l’ensemble des 2 solutions possibles proposées par le jeu (noté sous la forme {valeur ; probabilité d’apparition}) : { M ; 50 % } {\displaystyle \{M\,;50\%\}} et { 2 M ; 50 % } {\displaystyle \{2M\,;50\%\}} , M {\displaystyle M} et 2 M {\displaystyle 2M} sont les deux montants possibles proposés par le jeu.

Pour la variable aléatoire X 2 {\displaystyle X_{2}} , l’ensemble est constitué de façon similaire : { 2 M ; 50 % } {\displaystyle \{2M\,;50\%\}} et { M ; 50 % } {\displaystyle \{M\,;50\%\}} [6].

L’espérance du contenu de l’enveloppe 1 est par définition : E 1 = E ( X 1 ) = 50 % . M + 50 % .2 M = 3 / 2. M {\displaystyle E_{1}=E(X_{1})=50\%.M+50\%.2M=3/2.M} .

Pour l’enveloppe 2, on a de façon similaire : E 2 = E ( X 2 ) = 50 % .2 M + 50 % . M = 3 / 2. M {\displaystyle E_{2}=E(X_{2})=50\%.2M+50\%.M=3/2.M} .

On constate que E 1 = E 2 = 3 / 2. M {\displaystyle E_{1}=E_{2}=3/2.M} , ce qui est logique car les deux enveloppes ont un rôle identique.

Espérance mathématique associée à chaque changement

Si l'on change d’enveloppe, par exemple de l’enveloppe 1 à l’enveloppe 2, on obtient l’espérance E 12 {\displaystyle E_{12}} d’obtenir le gain de l’enveloppe 2 moins celui obtenu avec l’enveloppe 1 : E 12 = E ( X 2 X 1 ) = E ( X 2 ) E ( X 1 ) {\displaystyle E_{12}=E(X_{2}-X_{1})=E(X_{2})-E(X_{1})}

Ceci est dû à la propriété de linéarité des calculs d’espérance.

On conclut E 12 = 0 {\displaystyle E_{12}=0} .

De façon similaire E 21 = E 12 = 0 {\displaystyle E_{21}=E_{12}=0} .

Sur un grand nombre d’épreuves, on ne peut pas espérer de gain en permutant les choix des enveloppes.

Espérance mathématique associée à chaque changement (variante)

Si l’on considère les 2 changements possibles[5] :

  • passer d’un montant M {\displaystyle M} à un montant 2 M {\displaystyle 2M}  ;
  • passer d’un montant 2 M {\displaystyle 2M} à un montant M {\displaystyle M} .

On obtient resp. deux gains possibles :

  • le premier est positif de valeur + M {\displaystyle +M} avec une probabilité d’apparition de 50% ;
  • le second est négatif de valeur M {\displaystyle -M} avec une probabilité d’apparition de 50%.

Ceci définit une seconde loi de probabilité avec deux issues possibles (noté {valeur ; probabilité}) : { + M ; 50 % } {\displaystyle \{+M\,;50\%\}} et { M ; 50 % } {\displaystyle \{-M\,;50\%\}} .

Cette seconde loi de probabilité a pour espérance : E c h = 1 / 2. M 1 / 2. M = 0 {\displaystyle E_{ch}=1/2.M-1/2.M=0} .

Ce calcul aboutit lui aussi à un gain moyen nul, il s'agit simplement d'une alternative au calcul détaille de E 12 {\displaystyle E_{12}} ou de E 21 {\displaystyle E_{21}} .

Espérance mathématique calculée par le présentateur

Il est intéressant de voir en quoi le raisonnement de l’animateur aurait un défaut. Celui-ci propose la formule suivante :

E p r = 50 % .2 M c + 50 % . M c / 2 {\displaystyle E_{pr}=50\%.2M_{c}+50\%.M_{c}/2} M c {\displaystyle M_{c}} est le montant de l’enveloppe choisie. On note que l’on ne connait pas M c {\displaystyle M_{c}} qui vaut soit M {\displaystyle M} , soit 2 M {\displaystyle 2M} .

Par définition de l’espérance mathématique d’une loi de probabilité, on obtient de cette formule les deux solutions (noté {valeur ; probabilité d’apparition}) : { 2 M c ; 50 % } {\displaystyle \{2M_{c}\,;50\%\}} et { M c / 2 ; 50 % } {\displaystyle \{M_{c}/2\,;50\%\}} .

Pour chacune de ces deux solutions, il faut envisager les deux cas possibles M c = M {\displaystyle M_{c}=M} et M c = 2 M {\displaystyle M_{c}=2M}  :

  • dans le premier cas, on obtient ( 2 M ; 50 % ) {\displaystyle (2M\,;50\%)} et ( M / 2 ; 50 % ) {\displaystyle (M/2\,;50\%)}  ;
  • dans le second : ( 4 M ; 50 % ) {\displaystyle (4M\,;50\%)} et ( M ; 50 % ) {\displaystyle (M\,;50\%)} .

On constate que les solutions possibles ( M / 2 ; 50 % {\displaystyle (M/2\,;50\%} ) et ( 4 M ; 50 % {\displaystyle (4M\,;50\%} ) sont contraires aux hypothèses et invalident le raisonnement du présentateur.

En examinant de plus près la formule du présentateur, les deux solutions { 2 M c ; 50 % } {\displaystyle \{2M_{c}\,;50\%\}} et { M c / 2 ; 50 % } {\displaystyle \{M_{c}/2\,;50\%\}} définissent une autre loi de probabilité. Ainsi E p r {\displaystyle E_{pr}} correspond à un autre protocole :

  • ouvrir l’enveloppe choisie,
  • lire son contenu M c {\displaystyle M_{c}} ,
  • puis remplacer (avec des probabilités égales) le contenu de la seconde par 2 M c {\displaystyle 2M_{c}} ou M c / 2 {\displaystyle M_{c}/2} .

Le présentateur a commis une confusion entre deux lois de probabilité distinctes.

Pour résumer, le présentateur raisonne sur l'Univers { 2 M c ; M c / 2 } {\displaystyle \{2M_{c}\,;M_{c}/2\}} correspondant au protocole juste ci-dessus, alors que l'Univers du paradoxe des deux enveloppes est { M ; 2 M } {\displaystyle \{M\,;2M\}} .

Remarques

Supposons que E 12 > 0 {\displaystyle E_{12}>0} . Que se passerait-il si l’on permutait plusieurs fois ? Il faudrait détailler les calculs de E 121 {\displaystyle E_{121}} , E 1212 {\displaystyle E_{1212}} , etc. On pourrait conjecturer une impossibilité, par exemple obtenir les deux relations incompatibles E 121 > E 12 > 0 {\displaystyle E_{121}>E_{12}>0} et E 121 = E 1 = 0 {\displaystyle E_{121}=E_{1}=0} .

Variables aléatoires

Il est cependant possible, en fonction de la modélisation exacte du raisonnement de l'animateur, de considérer que l'erreur réside dans l'interprétation des espérances et non dans leur calcul : David Madore fait ainsi remarquer[3] que si l'on considère qu'il y a deux variables aléatoires, X 1 {\displaystyle X_{1}} , valant M {\displaystyle M} ou 2 M {\displaystyle 2M} , et correspondant (avec probabilités ( 1 / 2 ; 1 / 2 ) {\displaystyle (1/2\,;1/2)} ) au contenu de la première enveloppe, et X 2 {\displaystyle X_{2}} , valant 2 M {\displaystyle 2M} ou M {\displaystyle M} , et correspondant au contenu de la seconde enveloppe, alors l'espérance de X 1 {\displaystyle X_{1}} est bien égale à celle de X 2 {\displaystyle X_{2}} et vaut 3 M / 2 {\displaystyle 3M/2} . Cependant l'espérance du rapport X 2 / X 1 {\displaystyle X_{2}/X_{1}} vaut ( 2 M / M + M / 2 M ) / 2 = 5 / 4 {\displaystyle (2M/M+M/2M)/2=5/4}  ; l'erreur de raisonnement consiste alors à interpréter ce dernier résultat comme signifiant que X 2 {\displaystyle X_{2}} est plus intéressant que X 1 {\displaystyle X_{1}} (et donc qu'il faut changer d'enveloppe), alors que la seule conclusion à en tirer est le résultat surprenant, mais nullement paradoxal, que : E ( X 2 / X 1 ) = E ( X 1 / X 2 ) > 1 {\displaystyle E(X_{2}/X_{1})=E(X_{1}/X_{2})>1} .

Modifications de l'énoncé

Si le candidat est autorisé à consulter le contenu de la première enveloppe, une approche probabiliste à ce problème de décision redevient possible : Keith Devlin (suivant une analyse de Amos Storkey) fait ainsi remarquer que si l'animateur a choisi le contenu des enveloppes selon une règle (probabiliste ou non) connue du joueur, il devient possible de prendre une décision rationnelle d'échange en fonction du contenu de la première enveloppe (par exemple, si la règle propose un choix aléatoire uniforme de valeurs d'enveloppes, de choisir d'échanger si le contenu découvert est inférieur à la moyenne des choix offerts par la règle), et David Madore montre même qu'on peut (si peu vraisemblable que cela paraisse) obtenir une probabilité strictement supérieure à 1/2 de choisir la bonne enveloppe quelle que soit la règle utilisée par l'animateur, et ce sans connaitre celle-ci[3]. Avec une information supplémentaire, l'échange peut procurer un gain.

Attention à ne pas confondre avec le paradoxe de Bertrand ou paradoxe de Monty Hall.

Un autre protocole de choix des enveloppes

John Broome, repris par d'autres auteurs, propose le protocole suivant[7] : l'animateur place dans les enveloppes les montants 2 n {\displaystyle 2^{n}} et 2 n + 1 {\displaystyle 2^{n+1}} avec une probabilité 2 n 3 n + 1 {\displaystyle {\frac {2^{n}}{3^{n+1}}}} pour n {\displaystyle n} positif ou nul[8]. Il remarque d'abord que lorsque l'enveloppe choisie contient M c = 1 {\displaystyle M_{c}=1} on a intérêt à échanger puisque l'autre enveloppe contient 2 {\displaystyle 2} puis il montre que lorsque M c = 2 n {\displaystyle M_{c}=2^{n}} avec n > 0 {\displaystyle n>0} il y a un gain de 1 10 × M c {\displaystyle {\frac {1}{10}}\times M_{c}} espéré dans l'échange. Il en conclut que dans tous les cas le candidat a intérêt à changer même s'il n'ouvre pas l'enveloppe. Ce qui est paradoxal puisque, si le candidat n'ouvre pas les enveloppes, on a déjà montré qu'il n'y a aucun gain à espérer dans l'échange. Déduire un avantage lorsqu'on n'ouvre pas l'enveloppe de l'avantage espéré en prenant connaissance du contenu de l'enveloppe semble donc abusif ; l'explication vient de ce qu'avec cette distribution, l'espérance (que l'on change ou non d'enveloppe) est infinie[7].

Références

  1. M. Kraïtchik, La mathématique des jeux ou Récréations mathématiques, Paris, Vuibert, , 566 p.
  2. M. Gardner, La magie des paradoxes [« Aha! Gotcha: Paradoxes to Puzzle and Delight »], éd. Belin, (réimpr. 1985 pour l'édition française), p. 106.
  3. a b et c Explication du paradoxe par David Madore
  4. (en) CASPER J. ALBERS, BARTELD P. KOOI and WILLEM SCHAAFSMA, « Trying to resolve the two-envelope problem » [PDF]
  5. a et b Jean-Paul Delahaye, Paradoxes. Rubrique de divertissements mathématiques pour ceux qui aiment se prendre la tête. Paradoxe des deux enveloppes. (lire en ligne)
  6. Stricto sensu, il est abusif de considérer ces probabilités comme toutes deux de 50% : l'organisateur du jeu ne disposant pas d'un budget infini, la distribution de probabilité de la somme maximale doit être supposée avoir une valeur moyenne estimable, par exemple 100 000 . Cette estimation faite, la distribution de probabilité la moins prévenue, c'est-à-dire celle d'entropie maximale est une exponentielle décroissante. En ce cas, l'autre enveloppe a davantage de chances de spécifier un montant plus petit que plus grand. Voir Inférence bayésienne
  7. a et b [1]
  8. Cette distribution est bien une loi, puisque l'on a (voir série géométrique) n = 0 2 n / 3 n + 1 = 1 {\displaystyle \scriptstyle \sum _{n=0}^{\infty }2^{n}/3^{n+1}=1}  ; on peut cependant remarquer que la variable aléatoire ainsi définie n'a pas d'espérance, puisque n = 0 ( 1 / 2 ) ( 2 n + 2 n + 1 ) ( 2 n / 3 n + 1 ) = + {\displaystyle \scriptstyle \sum _{n=0}^{\infty }(1/2)(2^{n}+2^{n+1})(2^{n}/3^{n+1)}=+\infty }

Liens externes

  • David Madore, Un peu de probabilités
  • [PDF] Olivier Rioul, Probabilité sans peine?,
  • Jean-Paul Delahaye, « Section paradoxes.6.1 »(Archive.org • Wikiwix • Archive.is • Google • Que faire ?), sur accromath.uqam.ca,
  • (en) Barry Nalebuff, L'autre enveloppe est toujours plus verte (Yale University, Journal of Economic Perspectives, 1989).
  • (en) Eric Schwitzgebel and Josh Dever, The Two Envelope Paradox? Chapitre The Solution: "comparing apples and oranges"
  • (en) Federico O'Reilly, Is there a two-envelope paradox? Chapitre 2 "The mistake is adding apples and oranges"
  • (en) David J. Chalmers, The Two-Envelope Paradox: A Complete Analysis?
  • (en) Keith Devlin, The Two Envelopes Paradox,
  • (en) [PDF] Albers, Trying to resolve the two-envelope problem, chapitre 2 de sa thèse Distributional Inference: The Limits of Reason,
  • (en) [PDF] John Broome, The two-envelope paradox,
  • (en) Franz Dietrich and Christian List, The Two-Envelope Paradox: An Axiomatic Approach,
  • (en) David McCarthy, The two envelope paradox and infinite expectations, The two envelope paradox and infinite expectations,


  • icône décorative Portail des probabilités et de la statistique