확률에 대한 거래 철학

저자:발명가들의 수량화 - 작은 꿈, 2016-12-09 11:09:32, 2016-12-09 11:11:44에서 업데이트 되었습니다.

확률에 대한 거래 철학

1987년, 인도의 전설적인 수학자 라마누얀의 생년 (100주년) 을 기념하여, 그를 기념하기 위해 일련의 행사가 열렸다. 현대의 유명한 통계학자, 인도에서 태어난 라우 (C. Radhakrishna Rao, 1920년) 는 세 번의 강연을 하도록 초청되었다. 그 후, 인도 통계 연구소는 라우의 강연 논문을 바탕으로 1989년에 그를 위한 통계와 진실 (Statistics and Truth) 라는 책을 출판했다. 이 책은 1997년에 2판이 출간되었다.

  • 첫 번째 판의 서문에서 로우스는 다음과 같이 언급했습니다:

    학생 시절, 나는 주어진 전제에서 결과를 추론하는 수학의 논리를 전공했다. 나중에 나는 경험에서 배우는 합리적인 방법과 주어진 결과로부터 증명하는 논리를 공부한 통계학을 공부했다. 나는 수학과 통계학이 자연 지식을 향상시키고 일상생활을 효과적으로 관리하기 위해 인간이 노력하는 모든 일에 중요하다는 것을 깨달았다.

    저는 믿습니다.

    • 모든 지식은 궁극적 분석에서 역사입니다.
    • 추상적 의미에서 모든 과학은 수학이다.
    • 이성적인 세계에서 모든 판단은 통계입니다.

    이 구절은 수학과 통계학의 중요성과 그 각각의 의미에 대해 전반적으로 설명합니다.

    오랜 기간 동안 고등 수학은 모두 확률에 관한 과목을 다루었으며, 고전적인 확률 (즉, 동일한 확률을 가지고 확률을 설명하는 것) 은 많은 비율을 차지했다. 따라서 확률은 종종 배열의 조합과 연관되어 있었다. 배열의 조합은 더 복잡한 수학의 조합이었다. 그러나 학생들은 때때로 복잡한 과목들에 의해 혼란을 겪었지만, 그것은 단지 기술적인 측면이었으며, 인지적인 측면에서는 거의 혼란스럽지 않았다. 최근 몇 년 동안, 통계학의 중요성을 감안하여 고등 수학에는 점차적으로 통계학 과목이 추가되었다. 이 중 95년에 시행된 일반 고등 교육과정에서, 새로운 증가하는 신뢰 영역은 신뢰와 다른 물을 쉽게 제공하지만, 약간의 어려움을 초래했다. 이 새로운 통계학 과목에 추가된 통계학 논리는 무작위 개념, 데이터 샘플링을 필요로 하기 때문에 통계학에서 확률의 필수적인 특성이 전혀 존재하지 않았다.

    통계의 역사, 신뢰구역, 다른 유명한 통계학자, 폴란드에서 태어나 1938년에 미국으로 이주한 네이먼 (Jerzy Neyman, 1894-1981; 그는 제 스승, 즉 내가 지도하는 교수의 지도 교수) 의 1934년 연설에서 처음 제시되었다. 그의 연설이 끝난 후, 총회 의장인 아서 리온 보우리 (Arthur Lyon Bowley, 1869-1957) 는 연설에서 "이 확신은 신뢰구역이 아닌지 확실하지 않다"고 언급했다. 네이먼의 신뢰구역의 개념이 처음 제시되었을 때, 대부분의 통계학자, 현대 통계학의 창시자로 여겨지는 영국의 페이셔 (Sir Ronald Aylmer Fisher, 1890-1962, R.A. Fisher) 를 포함한 대부분의 통계학자들은 이 개념을 받아들이기 힘들었다.

    세월이 흐른 후, 70여 년이 지난 후, 오늘날 통계학자들은 물론 신뢰 간격의 의미를 완전히 이해하게 되었다. 그러나 대학에서는 확률과 통계, 통계학, 수학적 통계 등의 교과서에서 신뢰 간격은 보통 후반부에 속하는 주제이다. 즉 대학생들이 관련 과목에서 신뢰 간격에 접촉하기 시작했을 때, 대체로 충분한 확률 통계 기반이 있다. 오늘날 이 과목은 수학자들의 호응을 얻었지만, 95과정과 함께 98과정과 함께 99과정으로 변경된 후 매년 시행된 후에도 여전히 이 과목을 유지한다. 그러나 충분한 준비가 부족하기 때문에 고등학생들이 쉽게 흡수할 수 있는 것이 아니라 기대된다.

    왜 이 주제에 대해 좀 더 깊이 있는 내용이 있지만, 고등학교 수학 교과서에 제대로 들어오는 걸까요? 추측의 주된 이유는 그 중요성 때문일 것입니다. 이는 언론에서 자주 발표되는 다양한 조사 결과에 대한 신뢰 범위와 신뢰 수준을 보면 알 수 있습니다.

    어떤 통계 교과서에서는 신뢰분야가 한 장의 부분을 차지한다. 서로 다른 매개 변수, 서로 다른 분포에 대해 서로 다른 신뢰분야가 있을 수 있다. 같은 매개 변수와 같은 분포를 가진 경우에도 서로 다른 방법으로 다른 신뢰분야를 얻을 수 있다. 때로는 조건이 부족하거나 계산의 복잡성 등으로 인해 다른 조건으로 접근해서 비슷한 신뢰분야를 얻을 수 있다. 물론 이 경우에는 몇 가지 조건과 몇 가지 정리를 이용해야 한다. 신뢰분야도 비교적 우수하다.

    의 일반적인 분포, 신뢰 범위 및 신뢰 수준을 해석하는 은 이렇게 말합니다.

    고교 수준의 통계적 추론은 무작위 변수들의 기대값을 추정하는 것만을 하고, 그 뒤에 있는 이론은 중극적 한정법이다. 중극적 한정법에 대해 소개하기 위해서는 정규분포를 소개해야 한다. 이 부분은 학생들의 중극적 한정법에 대한 직관을 활동적으로 구축하기 위한 일반적 소개에 지나지 않는다. 고정된 신뢰수준에 대한 신뢰구역 공식을 제시하고, 학생에게 무작위 수표 모형이나 실험을 통해 양의 확률이 p인 금판을 n번 던지도록 하고, 신뢰구역 공식을 입력하여 신뢰구역의 의미를 설명하고, 이를 통해 대부분의 학생들이 얻은 신뢰구역을 왜 p로 포괄하는지 설명한다.

    이 문장 해석에는 여러 가지 문제뿐만 아니라 명확하게 말할 수 없습니다. 예를 들어 첫 번째 문장 해석 뒤에 이론은 중앙 극히 제한적 인 논리입니다. 이것은 통계학에서 나오는 것이 아닙니다. 교과 프로그램에서 해석이 명확하지 않기 때문에, 학생들이 이해하기를 원하는 고등학교 수학 교사들은 그 원칙을 깊이 연구하고 해석해야합니다. 어떤 사람들은 이러한 개념 해석을 명확히 할 수 있다고 주장하는 기사를 제시합니다. 단지 해석하기 때문에 종종 여전히 실력이 떨어집니다.

    왜 신뢰 범위의 개념은 종종 과 같은 후계로 떨어지는가? 근본을 추구하고, 많은 학습자가 확률의 의미를 제대로 이해하지 못하는가. 이것이 이 기사를 작성하는 동기입니다.

  • 확률의 의미

    한 덩어리에 6개의 면이 있고, 한 덩어리 아래에는 왜 짝수 확률이 나오는가? 짝수에는 별 차이가 없는 것처럼 보이지만, 각 면의 확률이 같다고 가정하면, 즉 1/6이다. 짝수에는 2, 4, 그리고 6 등 3개의 면이 있다. 따라서 요구되는 확률은 3/6이다. 이것이 고전적 확률이라고 불리는데, 기본적 가정은 짝수 같은 확률이다. 먼저 관찰한 현상은 몇가지가 있을 수 있으며, 그 중 몇가지가 우리에게 관심 있는 것이다. 후자를 제외하면, 즉 원하는 확률이다.

    2009년 7월 말부터 8월 초까지 세계 골프의 최고 권위자인 타이거 우즈 (Tiger Woods) 는 미국 미시간주에서 열린 버크 오픈 (Buick Open) 에 출전하였다. 1라운드를 마친 후, 선두에 8점까지 뒤쳐져 95위에 올랐다. 그의 경력을 피할 수 없을 가능성이 제기되었고, 첫 2경기 연속 (이전 대회는 영국 오픈 (The Open Championship, 영국 외에서는 흔히 British Open로 불린다) 에서 조기 탈락되었다. 그러나 타이거는 결국 소진을 할 수 없었고, 마지막 3라운드를 마친 후, 우즈는 1위에 올랐다.

    这时大家看法丕变,一致认为这座冠军盃,几乎可说是他的囊中物了。因过去的纪录显示,伍兹如能带着54洞领先进入决赛圈,战绩是35胜1败。你要不要猜后来他赢了没有?运动比赛,往往有过去资料可参考,此时相同的可能性便不宜用了。36次中成功35次,“相对频率”为35/36(约0.972)。这种以相对频率来解释概率,是常有的作法。适用能重复观测的现象。会不会有爆出冷门的时候?当然有。只是对一特定事件,用过去多次同样情况下,该事件发生的相对频率,来估计下一次事件发生的概率,乃是在没有更多资讯下,常被认为一属于客观的办法。

    한 남자가 한 소녀를 보고 놀랐고, 이것이 그의 신부라고 생각했습니다. 평가 후 자신감이 가득하고, 자기 자신을 추구하고있는 확률은 80%입니다. 다른 사람들은 모두 좋지 않았습니다. 8 퍼센트라는 숫자를 어떻게 생각해냈는지 물었다. 그 남자가 달력을 보여주었고, 한 표를 하나씩 보여주며 소녀가 그에게 매우 좋아한다는 것을 보여주었습니다. 이 0.8 확률은 주관적 확률이라고합니다.

    주관적 확률은 물론 35의 확률을 인식하는 것에 근거하여 객관적인 사실에 근거할 수도 있다. 그러나 같은 자료를 접하고 다른 사람들이 다른 판단을 할 수 있기 때문에 다른 주관적 확률을 제시할 수 있다. 예를 들어, 핵 발전소 사고, 혜성 충돌 등과 같은 현상은 반복적으로 관찰할 수 없다.

    예를 들어, 소녀를 쫓는 경우, 거의 모든 소녀는 실험을하고 반복적으로 쫓아내고, 몇 번이나 성공한 것을 세어, 그녀가 당신이 쫓아낼 확률을 결정합니다. 이러한 종류의 반복 할 수 없는 관측 현상에 대해서는 확률에 대해 주관적 확률이 종종 사용됩니다. 매일 아침 밖으로 나가면, 우리는 하늘을 쳐다보고 오늘 비가 내릴 확률이 무엇인지 판단하는 데 익숙하지 않습니다. 단지 종종 부모가 생각하는 확률이 더 많을 때, 이 줄무늬는, 어린이가 생각하는 확률은 더 작을 것입니다.

    주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인 주관적인

    위의 세 가지는 확률에 대한 일반적인 설명이며, 대부분의 경우 사람들이 사건의 발생 가능성을 평가하는 여러 가지 생각입니다. 비록 다른 상황에 대해 사용되지만 종종 상호 작용합니다. 모든 사람들은 삼촌과 같은 이름을 가진 살인자의 사례를 들어 본 적이 있습니다. 좋은 마음이있는 사람들은 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게 삼촌에게

    물론, 당신은 불순종할 수 있고, 의 결과가 무엇이든 간에, 모든 사람들은 그것이 단지 일시적인 상황이라고 생각하며, 그것이 공정한 구리판이라고 굳게 믿습니다. 이것은 불가능한 것이 아닙니다. 마치 어머니가있을 것처럼, 심지어 더 많은 인명 증명이있을지라도, 그녀가 직접 보지 않는 한, 그녀는 아들을 죽일 것이라고 믿지 않을 것입니다. 우연한 현상을 알아야합니다. 사건은 확률이 긍정적 인 경우에만 가능하며, 확률의 값이 아무리 작더라도 모든 것이 일어날 수 있습니다. 결국 구리판의 긍정적 인 가능성이 무엇인지, 오직 신이 알고 있습니다. 그러나 확률과 통계는 우리가 결정을 내리는 데 도움이 될 수 있습니다.

위의 세 가지의 확률 설명은 실제 생활에서 많이 볼 수 있는 상황을 포함하고 있지만, 수학자들은 물론 여기서 멈추지 않는다. 그들은 추상화하고 일반화하는 것을 좋아합니다. 방정식처럼, 방정식을 해결하는 것보다는 어떤 종류의 방정식의 해법을 나타내는 공식을 찾습니다. 또한, 실수계를 완전히 이해하면 실수계를 공법화하는 방식으로 정의합니다. 즉, 숫자의 집합이라고 말하는 집합을 주어, 그 요소에 대해 제곱을 정의하고, 10가지의 공식을 제시합니다. 당신은 이 제곱이 하나의 요소, 곱하기 하나의 요소가 될 수 있는지 궁금해합니까? 왜 이 제곱과 제곱이 없다고 생각합니까? 원래의 이름, 매우 중요한 수학 문제입니다.

확률을 도입하기 위한 공리화 된 방법이란 무엇인가? 먼저 샘플 공간이라고 불리는 집합이 있어야 한다. 어떤 관찰의 모든 가능한 결과들의 집합이다. 어떤 관측이 실제로 존재할 수 있는가, 아니면 가상의 것일 수 있는가. 샘플 공간의 일부 하위 집합은 우리가 관심 있는 것인데, 이들은 하나의 사건이다. 모든 사건도 집합을 구성한다. 마지막으로 확률 함수를 정의한다. 즉, 각각의 사건에 대해, 0,1 사이의 값을 부여하여, 그 사건의 확률, 즉 이 공간의 사건의 집합, 그리고 확률 함수, 세 가지가 확률 공간을 구성한다.

이것은 샘플 공간에 대한 요구가 크지 않지만 빈 집합이 될 수 없습니다. 그리고 이벤트 집합은 몇 가지 조건을 충족시켜야합니다. 간단히 말해서, 당신이 관심있는 이벤트가 너무 많지 않을 수 있습니다. 예를 들어, 단지 어떤 이벤트 A에 관심이 있고 A에 관심이 없습니다. 따라서 이벤트 집합은 충분히 크고 적어도 모든 것이 포함되어야합니다. 이것은 결혼식 전에 손님 목록을 만드는 것과 비슷합니다. 몇 명의 사람들을 초대 할 수 있습니다. 양쪽의 부모뿐만 아니라. 그리고 한 번 더 많은 사람이 한 번 더하면, 그와 같은 가까운 사람들이 함께 초대됩니다. 따라서 모든 1 명 더 많은 사람이 단지 한 명을 증가시키지 않고 몇 명을 증가시킬 것입니다. 또한 확률 함수는 확률의 이름인 경우, 물론 확률에 대한 과거의 인식에 따라 몇 가지 기본 조건을 충족해야합니다.

확률 공간의 구조에서는 확률을 어떤 방식으로 해석하든, 그 사람이 자신의 표현을 통해 자신의 확률의 의미를 찾을 수 있다. 그러나 추상화 된 후, 금판, 주머니, 포커 카드 등에 국한되지 않고, 더 일반적인 문제를 논의할 수 있고, 충분한 이론이 발굴될 수 있다.

확률론은 다른 수학 분야에 비해 늦게 발전했다. 그러나 공리화 된 후 확률론은 급속도로 깊게 발전하여 수학의 중요한 분야로 자리 잡았다. 이는 20세기 중요한 확률학자였던 러시아의 코모고로프 (Andrey Nikolaevich Kolmogorov, 1903-1987) 이 1933년에 발표한 100 페이지 미만의 소책인 Foundationsof the Theory of Probability에서 확률론의 기초를 놓았기 때문이었다. 그 책에서 그는 다음과 같이 말했다:

확률 이론은 수학 학문으로서, 기하학이나 대수학과 마찬가지로 공정에서 발전할 수 있고, 발전되어야 한다.

  • ### 어디가 확률의 하늘인가?

프랑스의 뉴턴이라고 불리는 라플라스 (Pierre-Simon, Marquis de Laplace, 1749-1827) 는 다음과 같이 말했다.

도박에서 기기운동을 고려하는 과학에서 유래한 이 과학은 인간의 지식의 가장 중요한 객체가 되어야 할 것이다. 인생의 가장 중요한 질문들은 대부분 확률의 문제들일 뿐이다.

확률은 무작위 현상에 대한 것이다. 그러나 모든 것이 무작위일 수는 없다. 우리는 또한 필연성을 가지고 있다고 말했다. 한쪽 또는 두쪽을 던지는 것이 모두 사람의 머리의 구리판이라고 가정하고, 관찰자가 그 쪽을 얻을 것이라고 가정한다. 당신은 이것이 필연적인 현상임을 알고 있지만, 여전히 사람의 머리가 나타날 확률이 1이고 다른 상황의 확률은 0이라고 말할 수 있다. 즉, 이것은 퇴행된 의 무작위 현상으로 간주한다.

어떤 물리학자들은, 투사된 구리판에 대해, 투사되는 속도, 각도, 바닥의 탄력성, 구리판의 모양과 무게 등의 조건에 의해 계산될 수 있는 구리판이 착륙한 후, 그 면이 위로 향할 것이라고, 따라서 이것은 무작위적인 것이 아니다.

어떤 신학자들은 모든 것이 실제로 하나님의 뜻에 따라 진행되고 있다고 생각할 수도 있지만 우리는 알 수 없습니다. 확실하지 않습니다. 당신은 제이슨 왕자와 아르고나우트 (Jason and the Argonauts) 를 본 적이 있습니까? 이것은 그리스 신화에 기반을 둔 영화입니다. 이 영화는 12 개의 별자리에서 암수자리에 관한 내용입니다. 1963년에 출시되었습니다. 나는 어렸을 때 보았지만 여전히 인상적입니다.

과학기술의 발전에 따라 많은 현상을 점차 이해하게 되었다. 예를 들어, 우리는 여성이 임신한 후에는 아기의 성별이 결정된다고 알고 있다. 그러나 큰 배가 있는 여성에게는, 좋은 일이 있기 때문에 알 수 없기 때문에, 여전히 딸을 낳을 확률을 추측할 수 있다. 시험 전날, 학생들은 진지하게 준비했지만, 여전히 머릿속을 추측하고, 각자는 높은 확률을 가지고 있다고 생각합니다. 교사가 알게되면, 웃음을 느낍니다. 교실에서 반복적으로 암시되어 있습니다.

그러나 이미 제안된 과제의 교사에게는 그 과제가 나올 확률을 판단하는 것이 아무런 의미가 없습니다. 왜냐하면 그에게는 모든 과제가 나올 확률이 1이나 0일 뿐이고 다른 값은 없습니다. 마찬가지로, 뒤에 있는 과일을 보는 사람에게는 과일이 오징어 또는 사과일 확률이 1이나 0일 뿐이라고 말할 것입니다. 무작위와 무작위와는 다릅니다. 우리는 확률의 논리가 충분히 유연하고 흔들릴 수 있도록 충분히 합리적이어야만 해야 한다고 말했습니다. 그렇지 않으면 올립니다.

  • ### 확률을 설명합니다

2부에서는 확률 공간을 통해 확률을 소개한다. 표본 공간은 가상이 될 수 있기 때문에, 이 때 사건도 가상이다. 그러나 실제로 관찰이 있다고 가정하자면, 4면의 표지점 1,2,3,4을 4면으로 던지고 그 점들을 관찰한다. 그러면 표본 공간은 1,2,3,4의 집합이다. 사건의 집합은 가장 큰 것, 즉 표본 공간의 모든 소집을 포함하는 집합을 얻을 수 있다. 만약 당신이 배열 조합을 배웠다면, 이 최대 사건 집합의 총 16개의 요소가 있다는 것을 알 수 있다.

확률 공간의 개념을 받아들였을지라도, 수학자들이 자주 자기만의 정의를 내놓는 것처럼, 당신은 여전히 궁금할 수 있습니다. 소위 점수 1의 0.1의 확률은 정확히 무엇을 의미합니까? 10번 던질 때마다 점수 1이 한 번 나오는 걸까요? 아니! 확률 이론을 공부한 수학 대학원생이 친절하게 다음과 같이 설명합니다.

假设投掷n次,点数1出现a次,则相对频率a/n与0.1之差的绝对值,会大于一给定的正数(不管它多小)之概率,将随着n的趋近至无限大,而趋近至0。

현실주의자라면 이런 설명이 실용적이라고 생각하지 않을 수도 있습니다. 먼저 질문하면 무한대로 가까워지는 것이 무엇인가요? 은 계속 던지고, 멈추지 않고, 해가 뜨고, 해가 지고, 봄이 오고, 가을이 오고, 계속 던지고, 이 성공해도 무한대로 도달하지 못했지만, 던져야 합니다. 그 수학 학부 졸업생은, 당신이 무한대로, 물고기가 물처럼 큰 것을 묻는 것을 들었을 때, 그것은 수학 학부에서 4 년의 냉동 창에서 배운 몇 가지 독특한 기법 중 하나입니다. 당신은 무한대로 이야기하는 것을 멈출 수 밖에 없습니다.

확률값의 의미를 설명하고자 하는 것은 확률과 무한대, 층을 거꾸로 돌리는 것이다. 이것은 어떤 점을 정의하려고 하는 것과 같으며, 결과는 온라인 집단에 빠지는 것과 같으며, 학습의 힘이다. 마지막으로, 포인트는 정의없는 명사이다. 그러나 어쨌든, 당신은 이해해야 한다. 위의 4가지 측면에 대해, 단지 한 번 던지는 것은 1점이 0.1의 확률을 나타낼 수 없다는 것을 의미하고, 0.1이 소수인 것을 의미한다. 확률은 단지 몇 번 던지는 결과를 보는 것이 아니다. 확률의 큰 표본 (n가 크다) 에서, 힘은 나타난다. 확률값의 의미는, 수용 가능한 논리적인 설명으로 설명할 수 없기 때문에.

이전 수학 학부 졸업생의 설명은 이 때 유용하게 쓰일 수 있다. 이것은 큰 숫자의 법칙의 간단한 버전이다. 수학적으로 의미로는, 사건의 발생의 상대적 빈도, 만남의 확률은 사건의 발생의 확률로 수렴한다. 알다시피, 무작위 세계에서는 여전히 따르기 위한 법칙이 있고, 숫자의 법칙은 그 중 매우 중요한 법칙이다. 물론 우리는 실제로 사건의 관찰이 무한히 많을 수 없다는 것을 지적했다.

확률이 양수인 경우에만 사건은 일어날 수 있다. 따라서, 관측 수가 크더라도, 매우 편향적인 (예를 들어, 1,000,000번 관측을 통해 점 1의 발생 빈도는 0 또는 1,000,000번) 사건의 발생을 배제할 수 없다. 그러나, 이 때 통계학자가 뛰어들어서, 점 1의 발생 확률이 0.1인지 확인하는 검사를 할 수 있다. 이것은 통계학에서 검증 가설을 검증하는 (testing hypothesis) 범주에 속한다. 간단히 말해서, 어떤 가설에 따라 이런 결과를 관찰할 수 있는지, 아니면 비정상적인지 여부를 계산한다. 비정상적인 것은 일어날 확률이 매우 작고 어떤 예측보다 작은 것을 의미한다.

비정상적인 경우, 초기 가정은 받아들여지지 않는다. 참고로, 구리판이 공정하다고 가정할 때, 100번 던지면 적어도 80번의 긍정이 나타나고, 10번 던지면 적어도 8번의 긍정이 나타나고, 전자는 더 비정상적인데, 그 발생 확률이 후자에 비해 훨씬 작다. 따라서, 같은 80% 이상의 긍정적 수를 얻으면 더 많은 던지는 것이 이 구리판이 불공평하다는 것을 더 믿게 할 것이고, 그것을 받아들이는 것이 긍정적 인 확률을 적어도 0.8으로 만들 것이다. 이것은 우리가 통계적으로 표본이 더 많으면 추론이 더 정확해질 것을 보여줍니다.

무작위 세계에서는, 정확히 어떤 것이 진실인지, 일반적으로 알려지지 않습니다. 우리는 종종 의 사실을 증명할 수 없습니다. 그러나 하나의 가설이 있습니다. 당신이 그 가설을 받아들이는 것을 고려하십시오. 4 얼굴 점수 1의 발생 확률은 0.1이거나 여러 번 던진다고도 진실임을 증명할 수 없습니다. 데이터에 따르면 을 받아 들일 수 있거나 을 받아 들일 수 없는 확률은 0.1입니다. 여기에 수용 또는 거부 결정을 결정하는 장치가 있습니다.

또한, 4면 1의 발생 확률도 추정할 수 있으며, 다른 추정 방법들이 있으며, 다른 추정치를 얻을 수 있다. 수학에서, 다른 방법을 사용하면 동일한 결과를 가져야 한다. 소위 유리한 고리이다. 그러나 통계에서는, 어떤 제한을 하지 않는 한, 항상 일관된 방법이 없다. 예측할 수 없는 미래에 대해 우리는 종종 추정을 해야 하며, 통계학은 이 부분에 있어서 좋은 역할을 할 수 있다.

  • ### 신뢰의 간격

우리는 흔히 어떤 미지의 양에 대한 추정치를 한다. 미지의 양은 어떤 사건의 발생 확률, 어떤 분포의 매개 변수 (예: 기대값과 변수 등) 또는 어떤 물체의 수명 등이 될 수 있다. 이러한 미지의 양은 매개 변수라고 통칭된다. 때로는 한 범위에 매개 변수를 추정하고 그 범위에 해당 매개 변수의 확률을 부여한다. 이것은 범위에 따른 추정치라고 불리는 것으로, 그 범위를 신뢰 범위라고 한다. 그리고 범위를 포함하는 매개 변수 확률은 이 범위에 해당 매개 변수의 확률을 신뢰 수준이라고 한다.

데이터 (data) 는 통계학자들이 의사결정을 내리는 주요 근거이다. 데이터가 부족할 경우, 그들은 종종 모든 것을 방치한다. 단순하고 일반적인 상황을 보도록 한다. 용판의 양면 발생 확률 p를 추정하려는 가정이다. 자연스럽게, 몇 번, 예를 들어 n 번, 표출하고 n 번의 결과를 관찰한다. 이 과정은 표본이라고 불린다. 이 경우, 각 표출의 결과는 중요하지 않다. 전체 양수가 a로 표기되어 있다. a를 알고 있으면 모든 정보를 가지고 있다.

이 부분에서는 이분포를 포함하고 있기 때문에 계산이 복잡하기 때문에, n이 충분히 크면 (n이 너무 작지 않으면) 우리는 보통의 분포를 통해 접근할 수 있다. 이것은 확률 이론의 또 다른 중요한 법칙인 중앙 한계 정리 (Central limit theorem) 를 사용한다.

양면의 확률 p를 추정하는 구리판의 경우, 샘플링 전, 신뢰 범위는 95%로 설정된 95%의 신뢰 수준에서 0.95의 확률 (또는 정확히 말하면, 신뢰 범위가 단지 대략적인 경우) 를 갖는 무작위 범위입니다. 신뢰 범위는 p를 포함합니다.

먼저 다음 예제를 설명하자. 상점회사의 기념일을 기념하여 고객이 일정 금액을 구매한다고 가정하면 1에서 10까지 1개의 복권을 뽑을 수 있습니다. 5을 뽑으면 오늘 회사에서 지출하면 30%의 할인권을 얻을 수 있습니다. 복권을 뽑기 전에 할인권을 얻을 확률이 0.1에 달한다는 것을 알고 있습니다. 기회가 작지 않습니다. 당첨되면 3를 보시면 할인권을 얻을 확률은 물론 0입니다.

이러한 예는 많다. 손 휘파람을 치기 전에, 의 확률은 0.341이라고 말할 수 있으며, 이 끝나면 이 끝나지 않고, 0.341이 사용되지 않았습니다. 또 하나의 예를 들어보겠습니다. 은행이 발행하는 복권 복권으로 가정하자면, 1에서 42까지의 각 번호에서 6야드가 상금 번호로 열립니다. 당신은 6야드를 베팅했으며, 승부전에 앞서 당신은 확률이 약 0.629이기 때문에 적어도 1야드의 확률이 쉽다는 것을 알고 있습니다.

또한 교과서에서 말하는 것처럼 무작위 수표 모형이 양면으로 나타날 수도 있습니다. (교과서에서 양면이 두 글자를 덜한 것은 이해가 되지 않습니다.) 확률은 p의 구리판 n번으로 신뢰 범위를 구하는 것입니다. p는 기본적으로 미리 설정되어 있으며, 모형 결과 중 하나는 고정된 범위에 있습니다. p가 그 안에 떨어지지 않았는지 한번 보시면 알 수 있습니다. 어떻게 이 범위를 포함하는 p의 확률이 0.95라고 말할 수 있습니까?

그 95%는 무슨 소용이 있을까요? 0.95은 확률 값이고 확률 값은 결코 한 번만 보는 실험의 결과물이 아닙니다. 대략 이렇게 말할 수 있습니다. 반복된 실험을 하면 많은 신뢰 범위를 얻으면 p의 신뢰 범위를 포함하고 전체 범위의 약 95%를 차지합니다. 따라서, 0.95의 의미는 이전 섹션에서 우리가 확률에 대해 설명한 것과 같습니다. 그러나 주목해야 할 것은 같은 p에 대해 전체 40명이라면 40개의 95%의 신뢰 범위를 얻을 수 없다는 것입니다.

  • ### 상황 해석

확률은 우리의 생활습관과 관련이 있기 때문에 확률을 잘 활용하면 무작위 세계에서 더 정확한 의사결정을 하는데 도움이 될 것입니다. 그러나 확률은 종종 적용하기가 쉽지 않으며 확률 값은 종종 잘못된 것으로 간주됩니다. 또한 서로 다른 확률 값을 제시하는 것은 다양합니다. 이유는 무엇입니까?

과거에는 수학 수업에서 응용 문제라고 불리는 것을 접할 수 있었다. 문제, 이해, 수학 수식을 작성 한 후, 수학을 풀었다. 이 때 원래의 긴 서술을 버릴 수 있었다. 그러나 확률에서, 간단한 것처럼 보이는 어떤 상황, 다른 해석으로 인해 남의 결론으로 이어질 수 있었다. 아래에서 몇 가지 예를 들어보자.

영화 결승 21점 (영어 단어가 21) 에서 수학 교수가 수업에 질문을 던진다. 세 개의 문이 있는데, 한 문 뒤에 자동차가 있고, 다른 두 문 뒤에 염소가 있다. 첫 번째 문을 선택하면 진행자가 두 번째 문을 열고 염소를 보게 된다.

네, 왜냐하면 제 차를 얻을 확률이 33.33%에서 66.67%로 증가하기 때문입니다.

이 교수는 "Very good!"라고 대답했고, 그의 의견에 동의하고, 즉 변경해야 한다고 말했습니다.

비교적 올바른 표현은, 만약 주최자가 자동차가 그 문 뒤에 있다는 것을 미리 알고 있다면, 그는 1개의 문을 열고 그 다음에는 염소의 문이다 (이것이 더 합리적인 방법이고, 그렇지 않으면 게임은 진행될 수 없다) 이 때 3개의 문을 선택하면, 영화의 학생이 말한 것처럼, 자동차를 얻는 확률은 1/3에서 2/3로 증가한다. 그러나 주최자가 자동차가 그 1개의 문을 지나고 있다는 것을 미리 알지 못한다면 (이것은 물론 드문 경우이지만, 단지 무작위로 2번과 3번의 문을 선택해서, 개 하나를 열고, 그리고 바로 그 문 뒤에 염소가 있고, 그래서 교체할 필요가 없다, 변경하거나 변경하지 않고, 자동차를 얻는 확률은 모두 1/2이다.)

그러나 독자께서 알아차렸는지도 모르겠지만, 주최자가 차가 그 문 뒤에 있다는 것을 미리 알고 있는 경우에, 우리는 실제로는 하나의 가정도 함축하고 있다. 즉, 2번과 3번의 문 뒤에 모두 염소가 있다면, 주최자는 무작위로 (즉, 각각 1/2의 확률로) 2번이나 3번의 문을 열고 있다. 사실, 더 일반적인 가정이 있을 수 있다. 2번과 3번의 문 뒤에 모두 염소가 있다면, 주최자가 각각 q1과?q의 확률로 2번이나 3번의 문을 열고, 그 중 0≤q≤1을 바꾸고 있다.

또 다른 예를 들어보자. 한 부부가 단지 두 명의 어린이를 가지고 있다는 것을 알면서 한 지역사회로 이사했는데, 성별은 알 수 없었다. 어느 날 지역사회 관리자가 이 집의 을 보고 집에서 한 명의 어린이를 가지고 놀고 있었다. 이 아이가 소녀라면 이 두 아이가 모두 소녀의 확률이라고 말했다. 많은 사람들이 이 문제를 어렵지 않다고 생각했고, 1/3의 확률이라고 생각했다. 사실 이 문제는 우리가 생각하는 것보다 훨씬 복잡했다.

마지막으로 확률론 교과서에서 자주 나타나는 다른 예제를 살펴보자. 평면에는 단위 원이 있고, 무작위로 사슬을 그리는 경우, 사슬의 길이가 이 원의 내면과 같은 변의 삼각형의 길이가 더 큰 확률이다. 기하학, 원의 내면과 같은 변의 삼각형의 길이를 이용하면 사슬을 무작위로 그리는 방법을 알아낼 수 있다. 그러나 어떻게 무작위로 사슬을 그리는가? 1에서 n까지의 n 정수 중에서 무작위로 1을 뽑는 것이 더 명확한 의미이다. 즉, 모든 숫자가 뽑히는 확률은 1/n이다. 자분간[0,1]에서 무작위로 1을 뽑는 것, 즉, 이 숫자가 [0,1]의 어느 하나에 떨어지는 확률이 그 자분간의 길이에 따라 다르다는 의미이기도 하다. 그러나 무작위로 사슬을 그리는 것은 어떻게 되는가?

위의 몇 가지 예시들은 우리에게 확률 문제를 처리할 때 상황을 명확하게 정의해야 한다고 말해준다. 용어로는 확률 공간을 명확하게 제시해야 한다. 그렇지 않으면 모든 말들이 이어질 것이다. 때로는 확률 공간을 제시하지 않았지만, 상황은 단순하다. 모든 사람들이 공통된 의견을 가지고 있는데, 왜 확률 공간을 특별히 강조하지 않는지는 문제가 없다. 예를 들어, 은 공정한 주머니를 던지고 4보다 큰 확률을 구하는 것이다. 단순한 설명이지만, 의심의 여지가 없다.

상황 해석 이외에도 조건적 확률, 독립성, 무작위 샘플링과 같은 확률의 독특한 개념들은 확률을 적용할 때 신중하게 고려해야 한다.


더 많은 내용