Les ressources ont été chargées... Je charge...

Bayes: le mystère du déchiffrement de la probabilité, la recherche de la sagesse mathématique derrière les décisions

Auteur:L'inventeur de la quantification - un petit rêve, Créé: 2023-11-26 16:48:39, Mis à jour: 2023-11-28 21:53:23

img

La statistique bayésienne est une discipline universitaire forte dans le domaine des mathématiques, avec de nombreuses applications dans de nombreux domaines, y compris la finance, la recherche médicale et l'informatique. Elle nous permet de combiner des croyances antérieures avec des preuves pour en tirer de nouvelles croyances postérieures, ce qui nous permet de prendre des décisions plus éclairées.

Dans cet article, nous allons présenter brièvement quelques-uns des principaux mathématiciens qui ont fondé ce domaine.

Avant Bayes Pour mieux comprendre la statistique bayésienne, il faut remonter au XVIIIe siècle et se référer au mathématicien De Moivre et à son ouvrage Le principe de l'opportunité[1].

Dans son article, De Moivre a résolu de nombreux problèmes liés à la probabilité et au jeu de son époque. Comme vous le savez peut-être, sa solution à l'un de ces problèmes a conduit à l'origine de la distribution normale, mais c'est une autre histoire.

Il y a une question très simple dans son article:

Le joueur lance une pièce équitable trois fois de suite et obtient trois chances positives.

En lisant les problèmes décrits dans le tableau des principes du hasard, vous remarquerez probablement que la plupart des problèmes commencent par une hypothèse et calculent la probabilité d'un événement donné. Par exemple, dans le problème ci-dessus, il y a une hypothèse selon laquelle une pièce est juste et donc une probabilité positive d'obtenir un tirage au sort est de 0.5.

Il y a une différence entre le fait que les gens ne sont pas toujours prêts à accepter les choses comme elles sont.

𝑃(𝑋|𝜃)

Mais si nous ne savions pas si cette pièce est juste?𝜃Je ne sais pas.

Il a été créé par Thomas Bayes et Richard Price.

Près de cinquante ans plus tard, en 1763, une thèse intitulée Le problème dans le principe de l'opportunité de résolution de l'argile[2] fut publiée dans le journal de la philosophie de l'argile de la Société Royale de Londres.

Dans les premières pages du document, il y a un texte écrit par le mathématicien Richard Price, qui résume le contenu d'un article écrit par son ami Thomas Bayes quelques années avant sa mort. Dans l'introduction, Price explique l'importance de certaines découvertes faites par Thomas Bayes, qui ne sont pas impliquées dans les découvertes de De Moivre sur le principe de l'opportunité de fractionner.

En fait, il se réfère à un problème spécifique:

L'occasion de trouver la probabilité d'un événement inconnu entre deux probabilités nommées.

En d'autres termes, après avoir observé un événement, nous trouvons un paramètre inconnu.θQuelle est la probabilité entre deux degrés de probabilité?. C'est en fait l'un des premiers problèmes de l'histoire liés à la déduction statistique et qui a donné le nom de probabilité inverse.

𝑃( 𝜃 | 𝑋)

C'est bien sûr la distribution postérieure que nous appelons aujourd'hui le théorème de Bayes.

Les causes non causées

Il y a eu des discussions avec des membres de la communauté religieuse sur le sujet.Il a écrit un livre intitulé "L'Humanité".etIl a écrit un article sur le sujet.Mais pour ce faire, nous avons besoin de mettre de côté temporairement une certaine connaissance de la statistique.

Nous sommes dans le 18ème siècle et la probabilité est en train de devenir un domaine de plus en plus intéressant pour les mathématiciens. Des mathématiciens comme D'Amour ou Bernoulli ont montré que certains événements se produisent avec un certain degré de hasard, mais sont toujours régis par des règles fixes. Par exemple, si vous jetez plusieurs dés, un sixième du temps, il s'arrête sur six.

Maintenant, imaginez que vous êtes un mathématicien et un croyant pieux vivant à cette époque. Vous pourriez être intéressé par la relation entre cette loi cachée et Dieu.

C'est en effet la question posée par Bayes et Price eux-mêmes. Ils souhaitent que la solution de ce problème soit directement applicable à la preuve que le monde qui nous entoure doit être le résultat d'une intelligence et d'une intelligence; ils fournissent donc une preuve de l'existence de Dieu par une cause finale[2] - c'est-à-dire une cause sans cause.

Je ne sais pas.

Étonnamment, environ deux ans plus tard, en 1774, apparemment sans avoir lu le livre de Thomas Bayes, le mathématicien français Laplace écrivit un livre intitulé La raison de l'événement par la probabilité de l'événement[3], un livre sur le problème de l'inverse de la probabilité.

Les principaux principes:

Si un événement peut être causé par n causes différentes, alors la probabilité de ces causes d'un événement donné est égale à la probabilité de l'événement de la cause donnée, et la probabilité de l'existence de chacune de ces causes est égale à la probabilité de la cause de l'événement donné, en plus de la somme des probabilités de l'événement de chacune de ces causes.

C'est ce que nous connaissons aujourd'hui sous le nom de théorème de Bayes:

img

Parmi eux:P(θ)La répartition est uniforme.

L'expérience de la pièce

Nous allons faire une expérience simple en utilisant Python et la bibliothèque PyMC pour ramener les statistiques de Bayes à l'heure actuelle.

Supposons qu'un ami vous donne une pièce de monnaie et vous demande si vous pensez que c'est une pièce équitable. Puisqu'il est pressé, il vous dit que vous ne pouvez lancer que 10 pièces.pEt nous voulons estimer la probabilité d'obtenir un résultat positif dans le tirage au sort.pLa valeur la plus probable de l'indicateur d'indice de charge est:

(Note: nous ne parlons pas de paramètres)pLe paramètre est fixe et nous voulons savoir dans quel intervalle il est le plus probable.

Pour avoir une vision différente de la question, nous allons la résoudre sous deux préjugés différents:

  • 1° Vous n'avez aucune information préalable sur l'équité des pièces et vous attribuez une probabilité égale àpDans ce cas, nous utiliserons ce qu'on appelle le préfixe sans information, car vous n'avez rien ajouté à vos croyances.

  • Deuxièmement, vous savez par expérience que même si une pièce peut être injuste, il est difficile de la rendre très injuste.pDans ce cas, nous utiliserons un préfixe d'information.

Dans les deux cas, notre conviction préalable serait la suivante:

img

Avec cette preuve, nous sommes très susceptibles de trouver où notre paramètre est.p

img

Et vous pouvez voir que dans le premier cas, nous avons fait une comparaison avec les paramètrespLa distribution antérieure est concentrée sur les estimations les plus similaires (MLE).p=0.2, ce qui est similaire à l'utilisation de la méthode de l'école de fréquence. Les paramètres inconnus vrais seront dans la plage de confiance de 95%, entre 0.04 et 0.48.

D'autre part, il y a une grande confiance dans les paramètres.pDans le cas où il devrait être entre 0.3 et 0.7, nous pouvons voir une distribution de post-expérience d'environ 0.4, bien supérieure à la valeur donnée par notre MLE. Dans ce cas, le véritable paramètre inconnu sera dans la plage de confiance de 95%, entre 0.23 et 0.57.

Donc, dans le premier cas, vous dites à votre ami que vous êtes sûr que la pièce est injuste. Mais dans l'autre cas, vous lui dites que vous ne pouvez pas être sûr que la pièce est juste.

Comme vous pouvez le voir, même avec les mêmes preuves (deux positifs sur dix), les résultats sont différents dans différentes croyances antérieures. C'est un avantage de la statistique bayésienne, semblable à la méthode scientifique, qui nous permet de mettre à jour nos croyances en combinant des croyances antérieures avec de nouvelles observations et preuves.

Résultats

Dans l'article d'aujourd'hui, nous allons voir les origines de la statistique bayésienne et ses principaux contributeurs.转载自quantdare.com


Plus de