avatar of 发明者量化-小小梦 发明者量化-小小梦
집중하다 사신
4
집중하다
1120
수행원

확률론적 거래 철학

만든 날짜: 2016-12-09 11:09:32, 업데이트 날짜: 2016-12-09 11:11:44
comments   0
hits   1434

확률론적 거래 철학

1987년은 인도의 전설적인 수학자 라만누얀 (Srinivasa Ramanujan, 1887-1920) 의 100주년이다. 그를 기리기 위해 일련의 행사가 있었다. 인도의 라우 씨 (C. Radhakrishna Rao, 1920년) 에서 태어난 현대의 유명한 통계학자 또한 세 번의 강연을 초청했다. 이후 인도 통계 연구소 (Indian Statistical Institute) 는 라우 씨의 강연 내용을 바탕으로 1989년에 그의 책인 통계와 진실 (Statistics and Truth) 을 출판했다. 이 책은 1997년에 제2판이 나왔다.

  • ### 첫 번째 판의 서문에서 라우스는 다음과 같이 언급합니다.

학생 시절에, 나는 수학을 전공했다. 주어진 전제에서 결과를 추론하는 논리. 나중에 나는 통계학을 전공했다. 경험에서 학습하는 합리적인 방법, 주어진 결과에서 검증 전제인 논리. 나는 수학과 통계학이 자연 지식을 향상시키고, 일상적인 일을 효과적으로 관리하기 위해 인간이 하는 모든 노력에서 중요하다는 것을 인식했다.

저는 이렇게 믿습니다.

  • 모든 지식은 결국 역사입니다.

  • 추상적인 의미에서, 모든 과학은 수학이다.

  • 이성의 세계에서는 모든 판단이 통계에 의한 것입니다.

    이 구절은 수학과 통계학의 중요성과 그 각각의 의미에 대해 설명합니다.

    오랜 기간 동안 고등학교 수학은 확률 과목을 포함하고 있으며, 그 중에서도 고전적인 확률 (즉, 확률을 확률과 동일하게 설명하는 확률) 가 상당 비중을 차지한다. 따라서 확률은 종종 배열 집합과 연결된다. 배열 집합은 비교적 복잡한 수학의 과제이다. 비록 학생들은 때때로 복잡한 과목에 빠져들기도 한다. 그러나 그것은 단지 기술적인 측면일 뿐 인지적인 측면에서는 대부분 크게 혼란스럽지 않다. 최근 몇 년 동안, 통계학의 중요성을 감안하여 고등학교 수학에는 통계학이 점차적으로 추가되었다. 이 중 95학년도부터 시행된 일반 고등학교 수학 교과목에서, 신규 신뢰 간격과 신뢰 기준은 교사에게 생계를 방해하지 않는다. 이 새로운 통계학 교재가 추가되면서, 확률 이론과 함께 확률의 특성을 파악할 수 있게 되었다.

    통계학의 역사를 뒤집어 보면, 신뢰구간은 또 다른 유명한 통계학자, 폴란드에서 태어나 1938년에 미국으로 이주한 네이먼 (JerzyNeyman, 1894-1981 ᅳ 그는 나의 스승조, 즉 나의 지도교수의 지도교수였다) 가 1934년 연설에서 처음 제안했다. 그의 연설이 끝난 후, 총회 의장인 아서 리온 보우리 (Arthur Lyon Bowley, 1869-1957) 는 연설에서 “나는 이 신뢰가 신앙의 장난이 아니라는 것을 확신하지 않는다”고 언급했다. 네이먼 신뢰구간의 개념이 제시되었을 때, 대부분의 통계학자들은, 현대 통계학의 창시자로 여겨지는 영국인 페셔 (Sir Ronald Aylmer Fisher, 1890-1962, 흔히 R.A. Fisher로 불린다) 를 포함해서 모두 받아들이기 어려웠다.

    세월이 흐르고 70여 년이 지나서 오늘날 통계학자들은, 물론 신뢰구간의 의미를 완전히 이해했다. 다만 대학에서, 확률과 통계, 통계학, 그리고 수학적 통계 등의 교과서에서 신뢰구간은 보통 후반의 주제에 속한다. 즉 대학생들이 관련 교과목에서 신뢰구간을 접하기 시작했을 때, 대략 충분한 확률 통계 기반이 있다. 그러나 오늘날 이 교과목은 수학가들의 호응을 얻었고, 95과정이 추가된 후 (98과정이 99학년으로 변경된 후) 이 교과목은 여전히 유지되고 있다. 그러나 충분한 예비 지식이 없기 때문에 고등학생들이 흡수하기가 쉽지 않고, 예상할 수 있다.

    왜 이런 좀 더 심오한 주제들이 고등학교 수학 교재에 진입하게 되었을까? 추측의 주요 이유는 그 중요성 때문이라고 한다. 언론에서 여러 조사 결과를 자주 발표하는 신뢰도와 신뢰도를 보면 알 수 있다.

    일부 통계 교과서에서 신뢰 영역은 한 장의 비중을 차지한다. 다른 파라미터, 다른 분포에 대해 다른 신뢰 영역이 있을 수 있고, 동일한 파라미터와 동일한 분포가 있더라도 다른 방법으로 다른 신뢰 영역을 얻을 수 있다. 때로는 조건이 부족하거나 계산의 복잡함 등의 이유로 후퇴하면 가까운 신뢰 영역을 얻을 수 있다. 물론 이 경우에는 조건이 필요하며, 몇 가지 이론을 이용하기도 한다. 신뢰 영역은 비교적 우수하다.

    은 정상 분포, 신뢰 범위 및 신뢰 수준에 대해 이렇게 설명합니다:

    고교 수준의 통계 추론은 단지 우연한 변수의 기대값을 추정하는 것 뿐이며, 그 배후에 있는 이론은 중앙극적 제한론이다. 중앙극적 제한론을 소개하기 위해서는 정상적인 분포를 도입해야 한다. 이 부분은 단지 일반적 소개로써, 활동적으로 학생들의 중앙극적 제한론에 대한 직관을 구축한다. 일정한 신뢰 수준에 대해, 신뢰 간격 공식을 주어, 학생이 무작위 숫자 표를 모의하거나 실험을 할 때, 긍정적인 확률이 p로 나타나는 구리판 n 번, 신뢰 간격 공식을 입력하여 신뢰 수준의 의미를 설명한다. 그리고 이를 통해, 대부분의 학생이 신뢰 간격이 p를 포함하는 것을 해독한다.

    이 해석 에는 몇 가지 문제가 있을 뿐 아니라, 명확하게 말할 수도 없다. 첫 문장에서 은 뒤에 있는 이론이 중앙극적 제한理이라는 것 처럼, 어디서 생겨났는지 알 수 없다. 이것은 통계학에 속하지 않은 견해이다. 교과과정의 해석 이 불분명하기 때문에, 진지하게 가르치고, 학생들에게 가르치고 싶은 고등학교 수학 교사들은, 그 원리를 파고 파고들어서, 각자의 해석을 한다. 어떤 사람들은 스스로 이 개념 을 명확하게 할 수 있다고 자처하는 글을 내놓기도 한다. 그것은 단지 해석일 뿐이고, 종종 정확하지 않다.

    왜 신뢰 간격의 개념은 종종 書이 말한 것과 같은 하향으로 떨어지는가? 근본을 찾아내거나, 많은 학습자가 확률의 의미를 제대로 이해하지 못하는가. 이것이 이 글을 쓰는 동기가 된다.

  • 확률의 의미

1개의 은 6개의 면이 있고, 1개의 아래에서, 짝수가 나올 확률은 무엇인가? 은 다르지 않은 것처럼 보이는데, 각 면이 모두 같은 확률로 1/6을 나타낸다고 가정한다. 짝수가면은 2,4,6,3개 있다. 따라서, 원하는 확률은 3/6이다. 이것이 바로 고전적인 확률이라고 불리는데, 기본 가정은 이 동일한 확률이다. 먼저 관찰된 현상에는 여러 가지 가능성이 있고, 그 중 몇 개가 우리의 관심이다. 후자를 빼기 전에, 즉, 원하는 확률이다.

2009년 7월 말 8월 초, 세계 골프의 왕 타이거 우즈는 미시건 주에서 열린 바이크 오픈에 참가했다. 1라운드를 마친 후, 선두 주자를 8점이나 뒤엎고 95위에 올랐다. 그의 경력에서 탈출할 수 없는 첫 번째 연속 2경기 (첫 경기는 영국 오픈 (영국 밖에서 흔히 영국 오픈이라고 불리우는) 이다) 는 조기에 탈락했다. 타이거는 결국 조를 잡지 못했고, 상위 3라운드를 마친 후, 우즈는 1위를 점했다.

당시 모든 의견이 엇갈렸고, 이 우승컵은 거의 그의 주머니에 들어있었다. 과거 기록에 따르면, 우즈가 54개의 구멍을 가지고 결승 라운드에 진출할 수 있었다면, 35승 1패의 기록이었다. 나중에 그가 이겼는지 짐작하지 않겠습니까? 스포츠 경기, 종종 과거 자료가 참고할 수 있는데, 이 때 같은 확률은 사용되지 않았다. 36번 중 35번의 성공, 의 상대적 빈도는 3536 (약 0.972) 이었다. 이 상대적 빈도를 사용하여 확률을 설명하는 것은 일반적인 방법이다. 반복적으로 관찰할 수 있는 현상을 적용한다.

어떤 남자는 한 소녀를 보고 놀라서, 이것이 그의 현생의 신부라고 생각한다. 평가 후 자신감이 가득 차서, 자긍심으로 추격할 확률은 8 퍼센트이다. 다른 사람들은 좋아 보이지 않지만, 그에게 8 퍼센트의 이 수치가 어떻게 나타났는지 묻는다. 그 남자는 연대기, 하나씩의 징후를 제시하며, 그 소녀가 그에게 호감을 가지고 있음을 보여준다. 이 0.8의 확률은 주관적 확률이라고 한다.

주관적 확률은 물론 이미 알고 있는 확률35에 대한 몇 가지 객관적 사실에 기초할 수도 있다. 다만 같은 자료를 마주해도, 다른 사람이, 다른 판단을 할 수 있기 때문에, 다른 주관적 확률을 준다.

여자들을 쫓는 예를 들어, 여자들 거의 없는데, 실험을 해보고, 반복적으로 쫓아보고, 그 중 몇 번이나 성공한 후, 그녀가 당신이 쫓아낼 확률을 결정하게 할 것이다. 이런 종류의 반복적으로 관찰할 수 없는 현상에 대해, 확률에 대해 이야기 할 때, 주관적 확률이 자주 사용된다. 매일 아침 밖으로 나가서, 우리는 하늘을 올려다보며, 오늘 비가 올 확률이 몇 퍼센트인지를 판단하는 데 익숙하지 않은가? 단지 종종 부모들이 생각하는 확률이 더 많을 것이고, 그 띠는, 아이들이 생각하는 비가 올 확률이 작을 것이다.

비록 주관적이긴 하지만, 그래도 합리적이어야 한다. 예를 들어, 시험에 합격과 합격하지 않은 것이 있다. 합격 확률이 0.9이라고 생각하면, 그건 괜찮아, 사람은 항상 조금 자신감을 가질 수 있지만, 동시에 0.8의 확률이 합격하지 못할 것을 두려워한다면, 그건 안된다. 다양한 가능성의 확률이 합쳐지면 1이다. 주관적이더라도, 독점적인 토론을 할 수 있지만, 그 자체로 말할 필요가 있다. 주관적이기 때문에, 각 사건의 확률을 임의적으로 결정할 수 있다고 말할 수 없다. 따라서, 확률에 대한 어떤 해석이든, 자연히 만족하거나, 몇 가지 공통된 규칙을 말해야 한다. 이것은 모두가 이해할 수 있어야 한다.

위의 세 가지 설명은 확률에 대한 일반적인 설명이며, 대부분 사람들이 사건의 발생 가능성을 평가하는 몇 가지 사고방식이다. 비록 다른 상황에 대한 것이지만, 종종 상호 작용할 수 있다. 모두가 살인자의 설화를 들었지! 조카와 같은 이름의 살인자가 있었고, 선의의 사람이 조카에게 조카가 살인자를 살해했다고 말했다. 어머니는 조카가 살인하지 않았다고 말했고, 계속 직물을 었다. 잠시 후, 또 다른 사람이 조카가 살인자를 살해했다고 말했다. 조카는 여전히 그녀의 직물을 계속 었다. 이렇게 좋은 아들이 어떻게 사람을 죽일 수 있습니까? 그러나 세 번째 사람이 조카가 살인자를 계속 직물을 었다고 말했을 때, 조카는 겁에 질려 벽을 뒤집어 버리고 도망했다. 조카는 어머니를 두려워하고 벽을 었다. 이 이야기는 전쟁의 전략이다.

물론, 당신은 유죄를 믿지 않을 수 있습니다. 투기의 결과가 어떻든 간에, 모든 사람들은 그것이 단지 일시적인 상황이라고 생각하며, 이것이 공정한 구리판이라고 굳게 믿고 있습니다. 이것은 불가능한 것은 아닙니다. 어머니가있을 수 있듯이, 더 많은 증인이 있더라도, 그녀가 직접 보지 않은 한, 그녀는 아들이 사람을 죽일 것이라고 믿지 않습니다. 우연한 현상을 알고, 사건은 확률이 긍정적이라면, 확률이 아무리 작더라도, 모든 것이 발생할 수 있습니다.

위의 세 가지의 확률에 대한 해석은 이미 존재하지만 실생활에서 많이 접할 수 있는 상황을 포함하고 있지만, 수학자는 여기서 멈추지 않는다. 그들은 추상화를 좋아하고, 일반화를 한다. 방정식처럼, 어떤 종류의 방정식의 해법을 표현하기 위해 공식을 찾는다. 단 하나의 특수한 해법을 찾는 데만 만족하지 않는다. 또 다시, 실제 숫자 시스템을 완전히 이해한 후, 합리화 된 방법으로, 실제 숫자 시스템을 정의한다. 즉, 숫자의 집합이 아니라 집합을 주어, 그 중 요소에 대한 두 가지 연산을 정의하고, 10 가지의 공리 (axiom, 규칙) 을 따르도록 한다. 이 두 가지 연산이 덧셈과 곱셈이 되는지 궁금하십니까? 왜 이 두 가지 연산이 없습니까?

공리적인 방법으로, 확률을 도입하는 것은 무엇인가? 먼저 하나의 집합, 즉 샘플 공간, 어떤 관측의 모든 가능한 결과의 집합으로 해야 한다. 실제로 이 관측이 있을 수 있다, 또는 단지 가상의 것이다. 샘플 공간의 일부 하위 집합은, 우리가 관심 있는 것, 즉 하나의 사건이다. 모든 사건도 하나의 집합을 이루고 있다. 마지막으로 확률 함수를 정한다, 즉, 각 사건에 대해, 0, 1 사이의 값을 주어, 그 사건의 확률이다. 샘플 공간, 사건의 집합, 그리고 확률 함수, 이 세 가지는 확률 공간 (probability space) 을 구성한다.

여기에는 샘플 공간에 대한 요구가 크지 않지만 빈 집합이 될 수 없습니다. 그리고 사건의 집합은 몇 가지 조건을 충족해야 합니다. 간단히 말해서, 당신이 관심있는 사건이 너무 적을 수 없습니다. 예를 들어, A의 사건에만 관심이있을 수는 없지만 A의 발생에는 관심이 없습니다. 따라서 사건의 집합은 충분히 커서 적어도 일부는 모두 포함되어야합니다. 이것은 결혼식 전의 객원 목록을 수립하는 것과 비슷합니다.

확률 공간의 구조 하에서, 어떤 방식으로 확률을 해석하든, 사람은 각각 표현할 수 있고, 자신이 생각하는 확률의 의미를 찾을 수 있다. 그러나 추상화 된 이후, 더 이상 구리판, , 그리고 포커 카드 등에 국한되지 않고, 더 일반적인 문제를 논의할 수 있으며, 충분한 이론이 파고들 수 있다.

수학의 다른 분야에 비해 확률론의 발전은 늦었다. 그러나 공리화 된 후, 확률론은 급속히 깊고 멀리 발전하여 수학의 중요한 분야가 되었다. 이것은 20세기 중요한 확률학자, 러시아의 안드레이 콜모고로프 (Andrey Nikolaevich Kolmogorov, 1903-1987) 가 1933년에 출판한 100 페이지도 안 되는 책자 에서 확률론의 기초가 마련되었다는 것에 기인한다. 그 책에서 그는 이렇게 말했다.

확률 이론은 수학 학문으로서 지오메트리와 대수학과 마찬가지로 공리론으로부터 개발될 수 있으며 개발되어야 한다.

  • ### 확률이 어땠을까요?

프랑스의 뉴턴이라 불리는 라플라스는 이렇게 말했다.

이 과학은, which originated in the consideration of games ofchance, should have become the most important object of human knowledge. Themost important questions of life are, for the most part, really only problemsof probability. (이 과학은, which originated in the consideration of games ofchance, should have become the most important object of human knowledge. 인생의 가장 중요한 질문은, 대부분의 경우, 정말로 확률의 문제일 뿐이다.)

확률은 무작위 현상을 대상으로 한다. 하지만 세상 모든 것이 무작위라는 것은 아니다. 우리가 말했듯이 필연성이 있다. 양쪽이 모두 사람의 머리의 구리판이라고 가정하고, 관찰하면 그 쪽을 얻을 것이다. 당신은 이것이 필연적인 현상이라는 것을 알고 있지만, 여전히 사람의 머리가 나타나는 확률은 1이고, 다른 상황의 발생 확률은 0이다. 즉, 이것을 퇴화된 의 무작위 현상이라고 본다.

일부 물리학자들은, 투하 된 구리판에 대해, 주어진 투하의 속도, 각도, 지상의 탄력, 구리판의 모양과 무게 등의 조건으로, 구리판이 착륙한 후, 그 쪽이 위로 올라갈 것을 계산할 수 있다고 생각합니다. 따라서 이것은 무작위적이지 않습니다.

일부 신학자들은, 모든 것이 실제로 신의 뜻에 따라 진행되고 있다고 생각할 수도 있지만, 우리는 알지 못합니다. 아마도 그렇게 될 것입니다. 제이슨 왕자 전투 악마 (Jason and the Argonauts) 를 보았습니까? 이것은 그리스 신화에 기반한 영화이며, 12 별자리의 암컷과 관련이 있습니다. 1963 년 제작. 나는 어린 시절에 보았지만, 여전히 인상적입니다. 영화에서 제이슨 왕자가 아이와 마주한 다양한 갑작스러운 재난과 번번이 영웅적인 폭력적인 만남이 있지만, 후세 헤라 (Hera) 와 천사가 제우스 (Zeus) 는 격돌하고, 각기 공격하고 도움을 주지만. 신의 뜻을 이해하지 못하면, 미래에 대해 무작위적으로 보는 것이 좋습니다.

과학기술의 발전과 함께, 사람들은 많은 현상의 둥근 연결을 점차적으로 이해한다. 예컨대, 여성이 임신하면, 아기의 성별이 결정되었다는 것을 알고 있다. 그러나 큰 배설을 하는 여성에 대해서는, 선량한 사람은 알지 못하기 때문에, 여전히 남자 또는 여자 아이를 낳을 확률을 추측할 수 있다. 시험 전날, 학생들은 열심히 준비했지만, 여전히 추측을 다했다. 각자는 확률이 높다고 생각하는 과제를 조사했다. 교사들이 알게 된 후, 웃었다. 수업에서 반복적으로 암시하는 것은, 이미 시험에 응한 과제들은 거의 모두 확인 할 수 있다는 것입니다. 왜 더 추측해야합니까? 사실은 과제가 제대로 인쇄되어 있고, 학생은 시험을 알지 못하고, 교사들의 암시와 암시를 일찍 보지 않았으므로, 여전히 큰 문을 추측 할 수 있습니다.

하지만 정답을 내놓은 선생님에게 그 과제가 나올 확률을 판단하는 것은 별 의미가 없다. 왜냐하면 그에게는, 모든 과제가 나올 확률은, 1이나 0일 뿐이고, 다른 값은 아니다. 마찬가지로, 뒤에 있는 과일을 보는 사람에게는, 과일이 양파나 사과일 확률은, 1이나 0일 뿐이다. 우연은 무작위와 다르다. 우리가 말했듯이, 확률의 그 세트는, 사람이 흔들릴 수 있을 만큼 탄력적이지만, 여전히 합리적이거나, 그렇지 않으면 다. 만약 당신이 그것이 사과라는 것을 알고 있다면, 그것은 양파라는 확률이 0.5이다. 또는 의사로부터 모든 정보를 습득하고 있는 산모를 알고 있다면, 또한, 생기는 것은 남녀의 모든 확률이 0.5, 그렇지 않다면 확률에 대해 이야기하고 있다.

  • ### 해석 가능성은

2단계에서는 확률공간 방식으로 확률을 소개한다. 샘플공간이 가상의 경우도 있기 때문에 사건도 가상의 것이다. 하지만 실제로 관찰이 있다고 가정하면, 예를 들어 4면으로 4면이 각각 1, 2, 3, 4의 점수를 표시하고 점수를 얻는다. 그러면 샘플공간은 1, 2, 3, 4의 집합이다. 사건의 집합은 가장 큰 것, 즉, 이 공간의 모든 자 집합으로 구성된 집합을 가져갈 수 있다. 배열 집합을 배운다면, 가장 큰 사건 집합에는 총 162개의 요소가 있다.

여러분이 확률공간의 개념을 받아들인다고 해도, 어쨌든 수학자들은 종종 어떤 자만한 정의를 주곤 합니다. 여러분은 여전히 궁금할지도 모릅니다. 점수 1이 나오는 확률 0.1은 정확히 무슨 뜻일까요? 10번 던질 때마다 점수 1이 나오는 확률은 1번일까요? 아니죠!

n번 던지고, 점수 1이 a번 나타난다고 가정하면, 상대적인 주파수 a/n와 0.1의 차이의 절대값은, 주어진 양수 ((어느만큼 작든 상관없이)) 의 확률보다 크며, n이 무한대까지 가까워질수록 0에 가까워질 것이다.

실용적인 당신은, 아마 그런 설명이 실용적이라고 생각하지 않을 것입니다. 먼저 질문 무엇이 무한대까지 가까워지는가? 은 계속 던지고, 멈추지 않고, 해가 뜨고, 해가 지고, 봄이 가을이 오고, 계속 던지고, 이 달릴 때 성공해도, 무한대도 아직 도달하지 못했습니다. 그 수학과 졸업생은, 당신이 무한대를 묻는 것을 들었을 때, 물고기가 물처럼, 이것은 그가 수학과의 4 년의 추운 창에서 배운 몇 가지 속임수 중 하나입니다. 당신은 무한대의 이 주제를 멈춰야하고, 이 달릴 때, 당신은 성공했다고 느끼나요? 확률을 어떻게 설명할 수 있으며, 무한대도 포함하고 있습니까? 그러나 당신은 약간의 화를 내며 나는 확률의 의미를 이해하지 못한다는 것을 알고, 확률의 개념을 어떻게 설명하는지를 듣고 있습니다.

확률값의 의미를 설명하려고 하면, 확률과 무한대에서 한 층씩 뒤바뀌게 될 것이다. 이것은 점이라고 하는 것을 정의하려고 하면, 결국은 마치 선단 안에 갇혀있는 것과 같은 학습의 어려움을 겪게 될 것이다. 마지막으로, 점은 정의되지 않은 명어이다. 그러나 어쨌든, 당신은 이해해야 한다. 앞서 말한 4면체에 대해, 단지 1번 던지는 것만으로, 점수 1이 확률 0.1을 나타낼 수 없다는 것을 의미한다. 확률은 단지 몇 번 던지는 결과를 보는 것이 아니다.

이전 수학과 졸업생의 설명에 따르면, 이 때 사용할 수 있다. 이것은 대수법 (law of large numbers) 의 한 가지 간단한 버전이다. 수학적으로 말하자면, 사건의 발생의 상대적인 빈도, 만남의 확률은 사건의 발생의 확률에 수렴한다. 무작위적인 세계에서, 여전히 몇 가지 법칙을 따라야 하며, 대수법은 그 중 매우 중요한 하나이다. 물론 우리는 이미 지적했듯이, 실제로는 사건을 무한히 관찰할 수 없다. 그렇다면, 사건의 발생의 상대적인 빈도는, 관측량이 충분히 많을 때, 사건의 발생의 확률에 근접해야 한다고 말할 수 있는가? 그렇지 않다.

사건은 확률이 양수일 때만 일어날 수 있다. 따라서, 관측수가 아무리 크더라도, 매우 편향된 (예: 관측 1,000,000번, 점수 1이 나타나는 횟수는 0, 또는 1,000,000번) 사건의 발생을 배제할 수 없다. 그러나, 이 때 통계학자는 뛰어 나와서, 점수 1이 나타나는 확률이 0.1인지 확인할 수 있다. 이것은 통계학에서 가설을 검사하는 범주에 속한다. 간단히 말해서, 어떤 가설에 따라, 그러한 결과를 관측할 수 있다고 하여, 비정상적이라고 할 수 있는가? 비정상적이라는 것은, 발생 확률이 매우 작고, 어떤 전제값보다 작다는 것을 의미한다.

비정상적인 경우, 초기 가설은 받아들일 수 없다. 부록으로, 구리판이 공정하다고 가정할 때, 100번 던지면, 적어도 80번은 긍정적으로 나타난다. 10번 던지면, 적어도 8번은 긍정적으로 나타난다. 전자는 그 발생 확률이 훨씬 작기 때문에 더 비정상적인 것이다. 따라서, 동일한 80% 이상의 긍정적인 면을 얻은 상태에서, 던진 수가 더 많을수록, 우리가 구리판이 불공정하다는 것을 더 확신하게 될 것이며, 그 긍정적인 면이 나타나는 확률은 적어도 0.8이다. 이것은 통계적으로, 동본수가 더 많을수록, 우리의 추론이 더 정확할 것이다.

무작위적인 세계에서, 무엇이 사실인지 정확히 알 수 없는 경우가 많습니다. 우리는 종종 어떤 것이 사실인지 증명할 수 없습니다. 하지만 하나의 가설입니다. 당신이 그 가설을 받아들이는 것을 볼 때 말입니다. 4면점수 1이 나오는 확률이 0.1이고, 그것이 사실인지 아닌지는, 여러 번 던지더라도, 그 진실성을 증명할 수 없습니다.

또한, 4면체에 대해 점수 1의 출현 확률을 추정할 수 있으며, 몇 가지 다른 추정법이 있으며, 다른 추정량을 얻을 수 있다. 수학에서, 다른 방법을 사용하면, 동일한 결과를 가져오야 한다. 특이점이라고 한다. 그러나 통계학에서는, 약간의 제한을 두지 않으면, 종종 일인적인 방법이 없다. 예측할 수 없는 미래에 대해, 우리는 종종 추정을 해야 하며, 통계학은 이 부분에서 좋은 역할을 할 수 있다.

  • ### 신뢰 영역

우리는 흔히 어떤 미지의 양을 추정한다. 미지의 양은 어떤 사건의 발생 확률, 어떤 분포의 변수 (예: 기대값과 변수수 등) 또는 어떤 물체의 수명 등이 될 수 있다. 이러한 미지의 양은, 일반적으로 변수라고 불린다. 때때로 한 영역으로 변수를 추정하고, 이 영역은 이 변수의 확률을 포함한다. 이것은 소위 영역 추정이며, 이 산출된 영역은 신뢰 범위라고 불린다.

데이터 (data) 는 통계학자들이 의사결정을 하는 주요한 근거이다. 데이터가 부족하면, 그들은 종종 움직이지 않는다. 간단하고 일반적인 상황을 살펴보자. 구리판의 긍정적 인 확률을 추정하려는 가정 p. 자연스레, 예를 들어, n 번, 그리고 n 번의 결과를 관찰하는 몇 번의 을 한다. 이 과정은 이라고 불린다.

여기서 두 가지 분포가 포함되기 때문에 계산이 더 복잡하다. 만약 n가 충분히 크다면 (n가 너무 작으면 안 된다) 우리는 보통 정규 분포를 이용하여 근사할 수 있다. 이것은 확률 이론의 또 다른 중요한 법칙인 중앙 극한 정의론 (Central limit theorem) 을 사용한다.

추정된 구리판의 양면이 나타나는 확률 p, 샘플링 전에, 신뢰 영역은 무작위 영역으로, 신뢰 수준이 95%로 설정되면, [[]] 또는 정확하게 말하면, 신뢰 영역이 근사적일 경우에 [[]]의 0.95의 확률이 신뢰 영역에 포함된다. 샘플링 후, 고정된 영역이 주어진다. 그러면 p가 해당 영역에 속하는 확률이 1이 아니라 0이 되고 p이 아니다. 왜 그런가? 많은 사람들이 이것에 대해 종종 혼란스러워한다.

다음의 예제를 먼저 설명하겠습니다. 어떤 백화점의 기념일, 고객이 일정 금액을 구매하면 1에서 10까지 1개의 색구를 뽑을 수 있습니다. 5번을 뽑으면, 오늘 회사에서 지출한 금액에 대해 30%의 대출권을 얻을 수 있습니다. 공을 뽑기 전에, 0.1의 확률이 대출권을 얻을 수 있다는 것을 알고 있습니다. 기회는 작지 않습니다. 한번 뽑으면, 3번을 보면, 대출권을 얻을 확률은 0이 됩니다.

이러한 예는 많이 있다. 을 때리기 전에, 앙타이의 확률은 0.341이며, 앙타이하지 않으면 안타는 0.341이 쓸모가 없다. 또 하나의 예시를 들어보자. 은행이 발행하는 복권에서 1부터 42까지의 각 수에서 6야드가 상금 번호로 열린다. 6야드를 내기 전에, 당신은 확률이 약 0.629이기 때문에 적어도 1야드를 내기는 쉽다는 것을 알고 있다. (참고1) ᄅ 등이 열린 후, 당신의 복권 중 적어도 1야드의 확률은 1이 될 것이다. (적어도 1야드가 내린다면) 또는 0 (만약 1야드가 모두 내리지 않은 경우).

또, 교과서에서 말하는 것처럼, 무작위 수표 모의도 양면이 나타날 수 있다. (교과서에서 양면이 적어, 의미도 안 된다) 확률이 p인 구리판의 n번, 신뢰 구간을 구하기 위해. 당신은, p는 기본적으로 미리 설정되어, 모의 결과 중 하나의 고정 구간, p가 그 사이에 떨어지는지, 한 눈에 알 수 있다, 어떻게 그 구간이 p의 확률이 0.95이라고 말할 수 있는가? 당신이 모의가 아니라 실제 구리판을 던진다면, p는 단지 알려지지 않았지만, 특정 값에 대해 알고 있다. (말해야 구리판을 내놓지 않는 단위) 투기 결과 이후의 고정 신뢰 구간은 무작위적이어서, 그것은 p만을 포함할 수도, 포함하지 않을 수도 있다.

그 95%는 무슨 소용이 있습니까? 0.95은 확률 값이며, 확률 값은 결코 한 번의 실험 결과를 보는 것이 아닙니다. 대략 이렇게 말할 수 있습니다. 반복적으로 실험을 하고, 많은 신뢰 영역을 얻으면, 그 중 p의 신뢰 영역이 포함될 것입니다. 전체 영역의 약 95%를 차지합니다. 따라서, 0.95의 의미는, 이전 섹션에서 우리가 확률에 대한 설명과 동일합니다.

  • ### 상황 해석

확률은 우리의 생활 습관과 관련이 있기 때문에, 확률을 잘 활용할 수 있다면, 무작위 세계에서, 더 정확한 의사결정을 하는데 도움이 될 것이다. 다만, 확률을 적용하는 것은 쉽지 않으며, 얻어지는 확률값은 종종 틀린 것으로 여겨진다. 그리고, 사람들은 서로 다른 확률값을 제시한다. 그 이유 중 하나는 무엇인가?

과거에는 수학 교과목에서 흔히 응용문제를 접할 수 있었다. 題目가 이해되고, 수학 공식이 쓰여지면 해산이다. 이때는 원래의 긴 서술을 버려야 한다. 하지만 확률에서, 단순해 보이는 상황들이 있어서, 해석이 다르기 때문에 남북한 결론을 이끌어 낼 수 있다. 아래 몇 가지 예를 들어 보겠습니다.

영화 결승점 21 (영어 별명은 21이다) 에서, 수학 교수는 교실에서 질문을 한다. 3개의 문이 있는데, 그 중 1개의 문 뒤에 자동차가 있고, 다른 2개의 문 뒤에 염소가 있다. 당신이 1개의 문을 선택한 후, 진행자는 2개의 문을 열고, 염소를 보게 된다.

Yes, because my chance of getting the carwill increase from 33.33% to66.67% by switching from door 1 to door 3.

교수님은 “Very good!“라고 답했고, 그의 의견에 동의해서 바꿔야 한다고 했습니다.

더 정확한 설명은, 만약 진행자가 자동차가 그 문 뒤에 있다는 것을 미리 알고 있다면, 그는 1개의 문 뒤에 염소의 문을 열게 될 것이다 (이것은 더 합리적인 방법이며, 그렇지 않으면 게임이 진행될 수 없다) 이 때 3개의 문을 선택하면, 영화에서 그 학생이 언급한 것처럼, 자동차를 얻는 확률은 1/3에서 2/3로 증가할 것이다. 그러나 만약 진행자가 자동차가 그 1개의 문 뒤에 있다는 것을 미리 알지 못한다면 (이것은 물론 드문 상황이다) 단지 2번과 3번의 문들 중 하나를 선택해서 열고, 바로 뒤에 염소라는 문이 있다면, 교체할 필요가 없으며, 교체할 이유 또는 그렇지 않은 경우, 자동차를 얻는 확률은 모두 1/2이다.

그러나 독자는 아마 알아차리지 못했을지 모르지만, 진행자가 자동차가 그 문 뒤에 있다는 것을 미리 알고 있는 상황에서, 우리는 실제로 암시적으로 가정하는 것입니다. 즉, 2번과 3번의 문 뒤에 모두 염소라면, 진행자는 무작위로 (즉, 각각 1/2의 확률로) 2번이나 3번의 문을 열 것입니다. 사실, 더 일반적인 가정이 있을 수 있습니다. 2번과 3번의 문 뒤에 모두 염소라면, 진행자가 각각 q=1?q의 확률로 2번이나 3번의 문을 열 것이라고 가정하면, 0≤q≤1을 선택하면, 3번의 문을 선택하면, 자동차의 확률은 1/(1+q) 을 얻게 됩니다.

또 다른 예를 들어 보겠습니다. 한 부부가 마을로 이사 왔는데, 두 명의 어린 아이가 있다는 것만 알려졌지만 성별은 알려지지 않았습니다. 어느 날 마을 관리자가 이 집의 어머니를 보았고, 집에서 어린 아이가 놀고 있었다고 합니다. 만약 아이가 여자라면, 이 집의 두 아이가 모두 여자일 확률이 있다고 했습니다. 많은 사람들은 이 문제를 어렵지 않다고 생각하지만, 1/3의 확률이 필요하다고 생각합니다. 사실 이 문제는 우리가 상상하는 것보다 훨씬 더 복잡합니다.

마지막으로 확률 교과서에서 자주 등장하는 또 다른 예를 보겠습니다. 평면에는 단위 원이 있고, 무작위로 한 줄을 그렸는데, 그 선이 이 원의 안접한 평변 삼각형의 가장자리 길이를 구하는 것이다. 기하학을 이용하면 단위 원의 안접한 평변 삼각형의 가장자리 길이를 구할 수 있다. 하지만 무작위로 한 줄을 그리는 방법은 무엇인가요? 1에서 n까지의 양수들 중에서 무작위로 1을 다는 것은, 그 의미가 더 명확하다는 것입니다. 각 숫자가 확률의 모든 것은 1/n이다.[0,1]에서 1을 선택하면[0,1]의 임의의 한 자리의 간격의 확률, 그 자리의 간격의 길이를 한다. 그러나 무작위적인 끈은, 어떻게 그리는가? 여기서는 무작위적인 끈이라는 용어에 대해, 여러 가지 해석이 가능하다. 의 해석이 다르다면, 끈을 그리는 방법이 달라질 것이고, 따라서 결과의 확률도 달라질 것이다.

위의 몇 가지 예는 확률 문제를 다룰 때, 상황을 명확히 정의해야 한다는 것을 알려준다. 용어로 말하자면, 확률 공간을 명확하게 제시해야 한다. 그렇지 않으면 각자의 의견이 나올 것이다. 때로는 확률 공간이 주어지지 않지만, 상황이 더 간단하기 때문에, 모두가 공통의 의견이 있으며, 이때 확률 공간이 무엇인지에 대해 특별히 강조하지 않은 것은 문제가 없다. 예를 들어, 공정한 주사위를 던지면, 4의 확률보다 많은 점수를 얻는다. 간단한 설명일 뿐이지만, 의심의 여지가 없다.

상황 해석 이외에, 확률의 일부 고유한 개념들, 예를 들어 조건적 확률, 독립성, 그리고 무작위 샘플링 등도 확률을 적용할 때 주의해야 한다.