베이지안 통계학은 수학 분야의 강력한 학문이며, 금융, 의학 연구, 정보 기술 등 많은 분야에서 광범위한 응용이 있습니다. 이는 이전의 신념을 증거와 결합하여 새로운 후속 신념을 도출하여 현명한 결정을 내릴 수있게합니다.
이 기사에서는 이 분야를 창시한 주요 수학자 몇 명을 간략하게 소개합니다.
베이어스 이전 베이지안 통계를 더 잘 이해하기 위해서는 18세기에 돌아가서 수학자 드 모이브레와 그의 논문 '기생충의 이론'을 참조해야 합니다.
그의 논문에서, De Moivre는 그의 시대에 확률과 도박과 관련된 많은 문제를 해결했습니다. 여러분도 알 수 있듯이, 이 문제들 중 하나에 대한 그의 해결책은 정상 분포의 기원에 이르렀지만, 그건 다른 이야기입니다.
그의 논문에서 가장 간단한 질문 중 하나는:
이것은 오늘날 수학적으로 표현될 수 있습니다.
수식
𝑃(𝑋|𝜃)
하지만 동전이 공평한지 모른다면요?𝜃
?
거의 50년 후인 1763년, 런던 왕립 학회의 철학 거래에서
이 문서의 첫 몇 페이지에는 수학자 리처드 프라이스가 그의 친구 토마스 베이즈가 사망하기 몇 년 전에 쓴 논문을 요약한 글이 있다. 프라이스는 그의 소개에서 데 모이브레의 "기생충의 이론"에 언급되지 않은 토마스 베이즈의 몇 가지 중요한 발견을 설명했다.
사실, 그는 한 가지 구체적인 문제를 언급했습니다.
다른 말로, 어떤 사건을 관찰한 후에 우리는θ
이것은 사실 역사상 통계적 추론과 관련된 첫 번째 문제 중 하나이며 역 확률이라는 용어를 낳았습니다.
수식
𝑃( 𝜃 | 𝑋)
이것은 오늘날 우리가 베이즈
이 두 장로 목사의 연구의 동기를 이해하면서토마스 베이즈그리고리처드 프라이스하지만 이것을 하기 위해서는, 우리는 일시적으로 통계학에 대한 지식을 따로 두어야 합니다.
우리는 18세기에 살고 있는데, 확률은 수학자들에겐 점점 더 흥미로운 분야가 되고 있다. 데 모이브레나 베르누리와 같은 수학자들도 이미 어떤 사건들이 어느 정도 무작위로 발생하지만 여전히 고정된 규칙에 의해 지배된다는 것을 보여주었다. 예를 들어, 만약 당신이 주사위를 여러 번 던지면, 6분의 1의 확률로 6에 떨어질 것이다. 그것은 마치 운명의 확률을 결정하는 숨겨진 규칙이 있는 것 같다.
이제 여러분이 이 시대에 살고 있는 수학자이자 헌신적인 신자라고 상상해보세요. 여러분은 이 숨겨진 법칙과 하느님과의 관계를 이해하는데 관심이 있을지도 모릅니다.
이것은 실제로 베이즈와 프라이스가 직접 묻는 질문이었습니다. 그들은 그들의 해결책이 "세계는 지혜와 지성의 결과여야 한다"는 것을 증명하는 데 직접 적용되기를 희망했습니다. 따라서 궁극적인 원인으로 신의 존재를 증명하는 것입니다. 즉 인과관계가 없는 원인입니다.
놀랍게도, 약 2년 후인 1774년, 토마스 베이즈의 논문을 읽지 않고 프랑스의 수학자 라플라스는 역 확률 문제에 관한 논문을 썼습니다. 첫 페이지에서, 당신은 주요 원리를 읽을 수 있습니다.
만약 n가지 다른 이유들로 인해 사건이 발생할 수 있다면, 그 사건의 확률은 그 사건의 확률과 같으며, 각각의 원인들의 존재 확률은 그 사건의 확률을 그 사건의 확률로 나누고 그 사건의 확률은 그 사건의 확률과 같을 것이다.
이것이 오늘날 우리가 베이즈
어디?P(θ)
균일하게 분포합니다.
우리는 파이썬과 PyMC 라이브러리를 사용하여 베이지안 통계를 현재로 가져와 간단한 실험을 수행합니다.
만약 친구가 동전을 주면, 동전이 공평하다고 생각하시는지 물어보라고 합시다. 그는 서두르기 때문에 동전을 10번만 던질 수 있다고 말합니다.p
이 문제에서, 동전을 던질 때 머리가 나올 확률입니다. 우리는 동전의 가장 가능성이 높은 값을 추정하고 싶습니다.p
.
(참고: 우리는 그 매개 변수를 말하지 않습니다p
이 매개 변수가 고정되어 있는 것이 아니라, 이 매개 변수의 가장 큰 확률이 어디인지 알고 싶습니다.)
이 문제에 대해 다른 견해를 가지기 위해서는, 우리는 두 가지 다른 이전의 믿음에 따라 그것을 해결할 것입니다.
p
이 경우, 우리는 당신이 당신의 신념에 어떤 정보도 추가하지 않았기 때문에, 비 정보적 선행이라고 불리는 것을 사용할 것입니다.p
0.3보다 작거나 0.7보다 크지는 않을 것입니다. 이 경우, 우리는 정보적 전자를 사용합니다.이 두 가지 시나리오에 대해, 우리의 이전의 믿음은 다음과 같습니다:
동전을 10번 던지면 두 번 p
?
보시다시피 첫 번째 경우, 파라미터의 이전 분포는p
최대 확률 추정치 (MLE) 에 집중됩니다.p=0.2
, 이는 주파수 학교에서 사용하는 것과 유사한 방법입니다. 진정한 알려지지 않은 매개 변수는 0.04에서 0.48 사이의 95% 신뢰도 간격 내에있을 것입니다.
반면에, 높은 신뢰도가 있는 경우, 그 매개 변수는p
0.3에서 0.7 사이가 되어야 합니다. 우리는 후측 분포가 0.4 정도라고 볼 수 있습니다. MLE에서 보는 것보다 훨씬 높습니다. 이 경우, 실제 미지의 매개 변수는 0.23에서 0.57 사이의 95% 신뢰도 간격 안에 있을 것입니다.
따라서 첫 번째 시나리오에서는 이 동전이 공평하지 않다는 것을 확실하게 친구에게 말하지만 다른 상황에서는 그것이 공평인지 아닌지 확실하지 않다고 말할 것입니다.
동일한 증거 (열 개 중 두 개의 머리) 에 직면했을 때에도 볼 수 있듯이, 다른 이전의 믿음 아래에서 결과는 크게 다를 수 있습니다. 전통적인 방법보다 베이지안 통계학의 한 가지 장점은 여기에 있습니다. 과학적 방법론과 마찬가지로 새로운 관찰과 증거와 결합하여 우리의 믿음을 업데이트 할 수 있습니다.
오늘 기사에서는 베이지안 통계학의 기원을 살펴보고 그 주요 기여자를 보았습니다. 그 후 이 통계 분야에 많은 다른 중요한 기여자가있었습니다 (제프리, 콕스,