В процессе загрузки ресурсов... загрузка...

Байес - секрет расшифровки вероятности и математический интеллект, лежащий в основе принятия решений

Автор:Изобретатели количественного измерения - мечты, Создано: 2023-11-26 16:48:39, Обновлено: 2023-11-28 21:53:23

img

Статистика Байеса - это сильная университетская дисциплина в области математики, которая имеет широкое применение во многих областях, включая финансовые, медицинские исследования и информационные технологии. Она позволяет нам объединять предыдущие убеждения с доказательствами, чтобы получить новые, более поздние убеждения, которые позволяют нам принимать более разумные решения.

В этой статье мы кратко расскажем о некоторых из главных математиков, основателей этой области.

До Бейеса Чтобы лучше понять статистику Бейеса, нам нужно вернуться в 18 веке и обратиться к математику Де Моивре и его труду "Принцип шансовой зависимости"[1].

В своей работе Де Мойвр решает многие вопросы, связанные с вероятностями и азартными играми его времени. Как вы, возможно, знаете, его решение одной из этих проблем привело к возникновению нормального распределения, но это другая история.

В своей работе он задает простейший вопрос:

Обезьяна использует справедливые монеты трижды подряд, чтобы получить три положительных вероятности.

Читая вопросы, описанные в графе принципов шансов, вы можете заметить, что большинство из них начинаются с предположения, с которого вычисляется вероятность данного события. Например, в приведенной выше проблеме есть предположение, что монета справедлива, и поэтому вероятность получения положительного результата в броске равна 0.5.

Это выражается в математических терминах:

𝑃(𝑋|𝜃)

Но что, если мы не знаем, справедлива ли эта монета?𝜃Что это?

Томас Бейес и Ричард Прайс

Почти пятьдесят лет спустя, в 1763 году, в книге The Principle of Solution of Problems, опубликованной в The Philosophical Exchange of the Royal Society of London, был опубликован труд под названием "The Principle of Solution of Problems in the Principle of Solution of Problems".[2]

На первых страницах документа есть текст, написанный математиком Ричардом Прайсом, который обобщает содержание работы, написанной его другом Томасом Байесом за несколько лет до его смерти. В предисловии Прайс объясняет важность некоторых открытий, сделанных Томасом Байесом, которые не были включены в теорию хитрости возможностей Де Мойвра.

На самом деле, он имеет в виду конкретную проблему:

Определение количества известных случаев возникновения и неудачи неизвестного события, возможность найти вероятность его возникновения между любыми двумя названными степенями вероятности.

Другими словами, после того, как мы наблюдаем событие, мы находим неизвестные параметры.θКакова вероятность между двумя степенями вероятности. Это фактически одна из первых проблем в истории, связанных со статистическим выводом, и привела к названию обратной вероятности.

𝑃( 𝜃 | 𝑋)

Это, конечно же, то, что сегодня мы называем теорией Байеса.

Причины без причины

Позже, в июне, он был арестован в Нью-Йорке.Томас БейесиРичард ПрайсНо чтобы сделать это, нам нужно временно отложить некоторые знания о статистике.

Мы находимся в 18 веке, и вероятность становится все более интересным для математиков. Математики, такие как Демовер или Бернули, уже показали, что некоторые события происходят с определенной степенью случайности, но все еще подчиняются фиксированным правилам.

Теперь представьте, что вы являетесь математиком и набожным верующим, живущим в это время. Возможно, вам будет интересно узнать об этом скрытом законе и его связи с Богом.

Это действительно вопрос, который задают сами Байес и Прайс. Они хотят, чтобы решение этой проблемы применялось непосредственно к доказательству того, что миры должны быть результатом ума и интеллекта; таким образом, чтобы доказать существование Бога с помощью конечной причины[2] - то есть безпричинной причины.

Лапрас

Удивительно, что примерно два года спустя, в 1774 году, очевидно, не читая труда Томаса Бейеса, французский математик Лапрас написал статью под названием "Причины возникновения событий, связанных с гипотезой о гипотезе вероятности событий"[3], которая посвящена проблеме обратной вероятности. На первой странице вы можете прочитать:

Основные принципы:

Если событие может быть вызвано n различными причинами, то соотношение между вероятностями этих причин для данного события равняется вероятности события данной причины, а вероятность существования каждой из этих причин равна вероятности причин для данного события, кроме суммы вероятности событий для каждой из этих причин.

Это то, что мы знаем сегодня - теорема Байеса:

img

В том числеP(θ)Это равномерное распределение.

Эксперимент с монетами

Мы приведем статистику Байеса в настоящее время с помощью Python и PyMC-либурии и проведем простой эксперимент.

Предположим, что друг дает вам монету и спрашивает, считаете ли вы, что это справедливая монета. Поскольку он спешит, он говорит вам, что вы можете бросить только 10 монет.pИ мы хотим оценить это, и мы хотим оценить это, и мы хотим оценить это, и мы хотим оценить это.pЭто наиболее вероятное значение.

(Примечание: мы не говорим о параметрах)pЭто не случайная переменная, а фиксированный параметр, и мы хотим знать, в каком диапазоне его наиболее вероятно найти.

Для того, чтобы иметь разные взгляды на этот вопрос, мы будем решать его с помощью двух различных предрассудков:

  • 1, если у вас нет предварительной информации о справедливости монеты, вы распределяете равную вероятность между двумя.pВ этом случае мы будем использовать так называемое безинформационное преимущество, поскольку вы не добавили никакой информации в свои убеждения.

  • Второе, вы знаете из опыта, что даже если монета может быть несправедливой, очень трудно сделать ее очень несправедливой, поэтому вы считаете, что параметрыpСкорее всего, не меньше 0.3 и не больше 0.7; в этом случае мы будем использовать информационный префикс.

Для обоих случаев наши предварительные убеждения будут следующими:

img

После 10 бросков вы получите два положительных результата. Имея это доказательство, мы, скорее всего, найдем наши параметры.p

img

И, как вы видите, в первом случае мы используем параметры.pПредыдущее распределение сосредоточено на максимально схожих оценках (MLE)p=0.2, что аналогично методу использования частотной школы. Истинные неизвестные будут находиться в пределах 95% доверия, между 0.04 и 0.48;

С другой стороны, с высокой степенью уверенности можно считать, что параметрыpПри условии, что она должна быть между 0.3 и 0.7, мы можем увидеть распределение последствий около 0.4, что значительно выше значения, данного нашей MLE. В этом случае истинный неизвестный параметр будет находиться в пределах 95% доверия, между 0.23 и 0.57.

Таким образом, в первом случае вы скажете своему другу, что уверены, что эта монета несправедлива; но в другом случае вы скажете ему, что не можете быть уверены, что эта монета справедлива.

Как вы видите, даже при наличии одинаковых доказательств (две положительные на 10 бросков) результаты будут отличаться при различных предварительных убеждениях. Это одно из преимуществ статистики Байеса, подобному научному методу, который позволяет нам обновлять наши убеждения, сочетая предварительные убеждения с новыми наблюдениями и доказательствами.

Окончание

В сегодняшней статье мы рассмотрим происхождение статистики Байеса и ее основных участников.转载自quantdare.com


Больше