Bayes-Statistik ist eine starke Universitätsdisziplin im Bereich der Mathematik, die in vielen Bereichen Anwendung findet, einschließlich Finanzen, medizinischer Forschung und Informationstechnologie. Sie ermöglicht es uns, vorherige Überzeugungen mit Beweisen zu kombinieren, um neue nachträgliche Überzeugungen zu erzeugen, die es uns ermöglichen, klügere Entscheidungen zu treffen.
In diesem Artikel werden wir einige der wichtigsten Mathematiker, die den Bereich gegründet haben, kurz vorstellen.
Vor Bayes Um Bayes' Statistik besser zu verstehen, müssen wir in den 18. Jahrhundert zurückgehen und auf den Mathematiker De Moivre und seinen Aufsatz über das Zufallsprinzip zurückgreifen.
In seinem Aufsatz löste De Moivre viele Probleme seiner Zeit, die mit Wahrscheinlichkeiten und Glücksspiel zusammenhängten. Wie Sie vielleicht wissen, führte seine Lösung eines dieser Probleme zur Entstehung der Normalverteilung, aber das ist eine andere Geschichte.
In seinem Papier gibt es eine sehr einfache Frage:
Sie werfen eine faire Münze dreimal in Folge und erhalten drei positive Wahrscheinlichkeiten.
Wenn Sie die Probleme lesen, die in der Chance-Prinzip-Liste beschrieben werden, werden Sie wahrscheinlich feststellen, dass die meisten von ihnen mit einer Annahme beginnen, aus der die Wahrscheinlichkeit eines gegebenen Ereignisses berechnet wird. Zum Beispiel gibt es in der obigen Frage eine Annahme, dass die Münze fair ist und daher die Wahrscheinlichkeit, eine positive in der Würfe zu erhalten, 0,5 ist.
Das ist heute in mathematischen Begriffen:
𝑃(𝑋|𝜃)
Aber was ist, wenn wir nicht wissen, ob die Münze fair ist?𝜃
Was ist das?
Fast fünfzig Jahre später, im Jahre 1763, veröffentlichte er eine Abhandlung über die Problematik der Problemlösungsmethode von Liu in der Philosophical Exchange of Liu der Royal Society of London.
Auf den ersten Seiten des Dokuments ist ein Text des Mathematikers Richard Price, der die Inhalte eines Papiers seines Freundes Thomas Bayes in den Jahren vor seinem Tod zusammenfasst. In der Einleitung erklärt Price die Bedeutung einiger Entdeckungen, die Thomas Bayes gemacht hat, die nicht in De Moivre's Theorem der Chancengleichheit enthalten sind.
Er hat sich sogar auf ein bestimmtes Problem bezogen:
Die Gelegenheit, die Wahrscheinlichkeit, dass ein unbekanntes Ereignis auftritt und fehlschlägt, zwischen zwei bezeichneten Wahrscheinlichkeitsgraden zu finden.
In anderen Worten, wenn wir ein Ereignis beobachten, dann finden wir die unbekannten Parameter.θ
Wie hoch ist die Wahrscheinlichkeit zwischen zwei Wahrscheinlichkeitsgraden. Das ist tatsächlich eine der ersten Fragen in der Geschichte, die mit der statistischen Inferenz zu tun haben und die den Namen "Inverse Probability" hervorgebracht hat.
𝑃( 𝜃 | 𝑋)
Das ist natürlich die nachläufige Verteilung, die wir heute Bayes' Theorem nennen.
Ich habe die beiden älteren Priester kennen gelernt.Thomas BayesundRichard Price ist ein junger Mann, der in den USA lebt.Das ist wirklich sehr interessant. Aber um das zu tun, müssen wir vorübergehend etwas über die Statistik wissen.
Wir befinden uns im 18. Jahrhundert und die Wahrscheinlichkeit wird ein Gebiet, das von Mathematikern zunehmend interessiert wird. Mathematiker wie De Moffat oder Bernoulli haben bereits gezeigt, dass einige Ereignisse mit einem gewissen Grad an Zufall stattfinden, aber immer noch von festen Regeln beherrscht werden.
Nun, stellen Sie sich vor, Sie wären ein Mathematiker und religiöser Gläubiger in dieser Zeit.
Das ist ja die Frage, die Bayes und Price selbst stellen. Sie möchten die Lösung dieses Problems unmittelbar anwenden, um zu beweisen, dass die Hex-Welt das Ergebnis von Intelligenz und Intelligenz sein muss; und somit einen Beweis für die Existenz Gottes mit einer endgültigen Ursache liefern.
Erstaunlicherweise, ungefähr zwei Jahre später, 1774, ohne offensichtlich ein Papier von Thomas Bayes gelesen zu haben, schrieb der französische Mathematiker Laplace ein Papier mit dem Titel "Die Ursachen von Ereignissen durch die Wahrscheinlichkeit von Ereignissen verwirklichen"[3], ein Papier über das Problem der inversen Wahrscheinlichkeit.
Die wichtigsten Grundsätze:
Wenn ein Ereignis durch n verschiedene Ursachen verursacht werden kann, dann ist das Verhältnis der Wahrscheinlichkeiten dieser Ursachen zu einem gegebenen Ereignis gleich der Wahrscheinlichkeit der Ereignisse der gegebenen Ursachen, wobei die Wahrscheinlichkeit der Existenz jeder dieser Ursachen gleich der Wahrscheinlichkeit der Ursachen der gegebenen Ereignisse ist, wenn man die Summe der Wahrscheinlichkeiten der Ereignisse jeder gegebenen Ursachen addiert.
Das ist die Bayes-Theorie, wie wir sie heute kennen:
Einige davonP(θ)
Das ist eine gleichmäßige Verteilung.
Wir werden Bayesian Statistics mit Hilfe von Python und der PyMC-Bibliothek auf den neuesten Stand bringen und ein einfaches Experiment durchführen.
Nehmen wir an, ein Freund gibt dir eine Münze und fragt dich, ob du denkst, dass es eine faire Münze ist.p
Wir wollen die Wahrscheinlichkeit, dass wir eine positive Zahl bekommen, bei der Münzwerfung, und wir wollen die Wahrscheinlichkeit schätzen, dass wir eine positive Zahl bekommen.p
Die höchsten Wahrscheinlichkeiten sind hier.
(Hinweis: Wir sprechen nicht von Parametern.)p
Wir wollen wissen, in welchem Bereich es am wahrscheinlichsten liegt.
Um eine andere Sicht auf das Problem zu haben, werden wir es unter zwei verschiedenen Vorurteilen lösen:
1. Sie haben keine vorherige Kenntnis von der Fairness der Münze, und Sie haben eine gleiche Wahrscheinlichkeit zugeteilt.p
In diesem Fall verwenden wir die sogenannte uninformative Vorgeschichte, da Sie in Ihren Überzeugungen keine Informationen hinzugefügt haben.
Zwei, du weißt aus Erfahrung, dass es schwierig ist, eine Münze sehr ungerecht zu machen, auch wenn sie ungerecht sein mag.p
Es ist wahrscheinlich nicht niedriger als 0.3 oder größer als 0.7. In diesem Fall werden wir eine Informationspräferenz verwenden.
Für beide Fälle wäre unsere vorherige Überzeugung:
Nach 10 Münzwerfern erhält man zwei positive Ergebnisse. Mit diesem Beweis können wir wahrscheinlich unsere Parameter finden.p
?
Und wir können sehen, dass wir in der ersten Situation die Parameterp
Die vorherige Verteilung konzentriert sich auf die maximal vergleichbare Schätzung (MLE).p=0.2
, was eine ähnliche Methode ist wie die Verwendung der Frequenzschule. Die wahren unbekannten Parameter liegen im 95%igen Vertrauensbereich zwischen 0.04 und 0.48.
Auf der anderen Seite, wenn man mit hohem Vertrauen an die Parameter denktp
In Fällen, die zwischen 0.3 und 0.7 liegen sollten, können wir eine Hintergrundverteilung von ungefähr 0.4 sehen, viel höher als die von unserem MLE angegebenen Werte. In diesem Fall wird der wahre unbekannte Parameter in der 95%-Glaubensbreite liegen, zwischen 0.23 und 0.57.
In der ersten Situation sagen Sie also Ihrem Freund, dass Sie sicher sind, dass die Münze unfair ist. In der anderen Situation sagen Sie ihm, dass Sie nicht sicher sind, ob die Münze fair ist.
Wie Sie sehen können, gibt es auch bei gleicher Evidenz (z. B. bei zwei Positiven von zehn Werten) unterschiedliche Ergebnisse unter verschiedenen Vorurteilen. Dies ist ein Vorteil der Bayes-Statistik, ähnlich der wissenschaftlichen Methode, die es uns erlaubt, unsere Überzeugungen zu aktualisieren, indem wir Vorurteile mit neuen Beobachtungen und Beweisen kombinieren.
In diesem Artikel sehen wir die Ursprünge der Bayes-Statistik und ihre wichtigsten Mitwirkenden. Seitdem gibt es viele andere bedeutende Mitwirkende in diesem Bereich (Jeffreys, Cox, Shannon, etc.).转载自quantdare.com。