En 1987, le légendaire mathématicien indien Ramanujan (Srinivasa Ramanujan, 1887-1920) a fêté son centenaire. Une série d’événements ont été organisés en son honneur. Le célèbre statisticien contemporain, né en Inde, C. Radhakrishna Rao (1920), a également été invité pour trois conférences.
En tant qu’étudiant, j’ai étudié les mathématiques en tant que logique de déduction des résultats d’une hypothèse donnée. Plus tard, j’ai étudié la statistique en tant que méthode rationnelle d’apprentissage de l’expérience et la logique de vérification des hypothèses d’un résultat donné. J’ai reconnu l’importance des mathématiques et des statistiques dans tous les efforts de l’humanité pour améliorer la connaissance de la nature et gérer efficacement les affaires quotidiennes.
Je suis convaincu:
Dans l’analyse finale, tout savoir est de l’histoire.
Dans le sens abstrait, toutes les sciences sont mathématiques.
Dans le monde de la raison, tous les jugements sont statistiques.
Ce passage décrit en détail l’importance des mathématiques et de la statistique, ainsi que leurs implications respectives.
Depuis longtemps, les mathématiques du secondaire sont couvertes par des matières de probabilité, dans lesquelles la probabilité classique (c’est-à-dire l’interprétation de la probabilité avec la même probabilité que la probabilité) représente une proportion non négligeable. La probabilité est donc souvent liée à un ensemble de sélection.
La notion d’intervalle de confiance a été proposée pour la première fois en 1934 par Jerzy Neyman (1894-1981), un autre célèbre statisticien né en Pologne, qui n’a émigré aux États-Unis qu’en 1938. À la fin de son discours, le président de l’Assemblée, Arthur Lyon Bowley (1869-1957), a déclaré dans son discours: “Je ne suis pas sûr que cette confiance ne soit pas un jeu de foi”. La plupart des statisticiens, y compris le Britannique Sir Ronald Aylmer Fisher (1890-1962), considéré comme le fondateur de la statistique moderne, avaient du mal à accepter cette notion.
Les statisticiens d’aujourd’hui, après plus de soixante-dix ans, ont bien sûr parfaitement compris la signification de la zone de confiance. Seulement dans les universités, que ce soit dans les manuels de probabilité et de statistique, de statistique ou de mathématiques, la zone de confiance appartient généralement à la seconde moitié du sujet. C’est-à-dire que les étudiants universitaires ont une base statistique de probabilité suffisante lorsqu’ils commencent à entrer en contact avec la zone de confiance dans les cours correspondants.
Pourquoi ce sujet, un peu trop profond, a-t-il été intégré dans les manuels de mathématiques des lycées ? La raison principale est son importance.
Dans certains manuels de statistiques, les intervalles de confiance représentent une partie d’un chapitre. Il existe différents intervalles de confiance pour différents paramètres, différentes distributions; même avec les mêmes paramètres et la même distribution, il existe différentes méthodes pour obtenir des intervalles de confiance différents. Parfois, en raison de conditions insuffisantes ou de la complexité des calculs, il suffit de revenir en arrière pour obtenir des intervalles de confiance proches. Bien sûr, cela nécessite des conditions et utilise certains théorèmes.
Les références à la répartition normale, aux intervalles de confiance et aux niveaux de confiance sont les suivantes:
Cette section est uniquement destinée à l’introduction générale, afin de construire activement l’intuition de l’élève sur la théorie de la distribution normale. Pour un niveau de confiance fixe, donnez une formule d’intervalle de confiance, puis demandez à l’élève de modéliser ou d’expérimenter une table de nombres aléatoires sur une planche de cuivre avec une probabilité positive de p n fois, en utilisant la formule d’intervalle de confiance pour expliquer ce que signifie le niveau de confiance; et expliquez ainsi pourquoi la plupart des élèves obtiennent que l’intervalle de confiance couvre p.
L’interprétation de ce passage est difficile à comprendre. La théorie qui le sous-tend, telle que la première phrase, est la théorie de l’équilibre de la limite du pôle central. On ne sait pas d’où elle vient.
Pourquoi le concept de l’intervalle de confiance est-il souvent réduit à un point de non-retour, comme le dit Liu Xiaobo ? Pour en arriver à la conclusion, de nombreux étudiants n’ont pas compris correctement ce que signifie la probabilité. C’est la motivation de cet article.
La probabilité d’obtenir un nombre pair sous un cercle de six faces est égale à 1⁄6. La probabilité d’obtenir un cercle de six faces est égale à 1⁄6. La probabilité d’obtenir un cercle de six faces est égale à 1⁄6. La probabilité d’obtenir un cercle de six faces est égale à 1⁄6.
À la fin du mois de juillet et au début du mois d’août 2009, Tiger Woods, le champion du monde de golf, a participé au Buick Open de Buick, dans le Michigan aux États-Unis. Il a terminé le premier tour derrière le leader de 8 points et s’est classé au 95e rang.
Les opinions divergent, et il est presque certain que le titre est dans sa poche. D’après les archives, si Woods arrive en tête des 54 trous, il a 35 victoires et 1 défaite. Vous voulez deviner s’il gagne plus tard ?
Un homme regarde une jeune fille et, surpris, pense que c’est sa fiancée pour la vie. Après avoir évalué avec confiance, il a une chance de 8 pour cent de la suivre. Les autres ne voient pas bien, lui demandent comment ce chiffre de 8 pour cent est apparu. Le monsieur cite le calendrier, un signe après l’autre, montrant que la jeune fille a une bonne impression de lui.
Bien sûr, la probabilité subjective peut aussi être basée sur la connaissance de certains faits objectifs. Seulement, même face aux mêmes informations, différentes personnes peuvent avoir des jugements différents, donnant ainsi des probabilités subjectives différentes.
Par exemple, il n’y a pas beaucoup de filles qui vous demandent de faire des expériences, de les poursuivre plusieurs fois, et de compter le nombre de fois où elles réussissent, pour déterminer la probabilité qu’elles soient poursuivies par vous. Pour ce genre de phénomènes qui ne peuvent pas être observés à plusieurs reprises, la probabilité subjective est souvent utilisée pour parler de probabilité.
Bien que cela puisse être subjectif, cela reste raisonnable. Par exemple, l’examen a une probabilité de réussite ou d’échec. Si vous pensez que la probabilité de réussite est de 0,9, ce n’est pas un problème, vous devez toujours être un peu confiant, mais si vous craignez qu’il y ait une probabilité de 0,8 d’échec, ce n’est pas le cas.
Les trois interprétations ci-dessus sont des interprétations courantes de la probabilité, c’est-à-dire que les gens évaluent la probabilité d’un événement. Bien que cela s’applique à des situations différentes, il est souvent possible d’interagir entre elles. Nous avons tous entendu le récit d’un homme qui a participé au meurtre d’un autre homme.
Bien sûr, vous pouvez croire que ce n’est qu’une situation passagère, quel que soit le résultat de la projection, et être fermement convaincu qu’il s’agit d’une planche de cuivre juste. Ce n’est pas impossible, tout comme il y aurait une mère, même si plus de témoins l’ont vu, elle ne croirait pas que son fils tuerait quelqu’un tant qu’elle ne l’aurait pas vu de ses propres yeux.
Les mathématiciens ne s’arrêtent pas là, bien que les trois interprétations de la probabilité que nous venons d’évoquer couvrent de nombreuses situations rencontrées dans la vie réelle. Ils aiment l’abstraction et la généralisation. Comme les équations, ils recherchent des formules pour exprimer la solution d’un type d’équation plutôt que de se contenter de trouver une solution particulière.
Qu’est-ce qu’une approche rationalisée pour introduire la probabilité ? Il faut d’abord un ensemble, appelé l’espace échantillon, qui est l’ensemble de tous les résultats possibles d’une observation donnée. Il peut y avoir une observation réelle, ou seulement virtuelle. Certains sous-ensembles de l’espace échantillon, qui nous intéressent, sont des événements individuels.
Il n’y a pas beaucoup d’exigences en ce qui concerne l’espace d’échantillonnage, mais il ne peut pas s’agir d’un ensemble vide. La collection d’événements doit satisfaire à certaines conditions. En termes simples, les événements qui vous intéressent ne peuvent pas être trop peu nombreux. Par exemple, vous ne pouvez pas seulement être intéressé par un événement A, mais ne pas être intéressé par A. Par conséquent, la collection d’événements doit être suffisamment grande pour qu’au moins certains d’entre eux soient inclus.
Sous l’architecture de l’espace de probabilité, quelle que soit la façon dont les gens interprètent la probabilité, ils peuvent l’exprimer individuellement et trouver le sens de la probabilité qu’ils veulent. Mais en raison de l’abstraction, ils ne sont plus limités à la planche de cuivre, au crayon et aux cartes de poker, ils peuvent discuter de problèmes plus généraux et il y a suffisamment de théories à explorer.
La théorie de la probabilité a été développée plus tard que les autres domaines des mathématiques. Mais après avoir été formalisée, la théorie de la probabilité a rapidement connu un développement profond et considérable et est devenue un domaine important des mathématiques. Cela est dû à l’important probabiliste du XXe siècle, le russe Andrei Nikolaevich Kolmogorov (1903-1987), qui a publié en 1933 un petit livre de moins de 100 pages intitulé Fondationssof the Theory of Probability.
La théorie de la probabilité en tant que discipline mathématique peut et devrait être développée à partir d’axiomes exactement de la même manière que la géométrie et l’algèbre.
Pierre-Simon, Marquis de Laplace (1749-1827), connu sous le nom de Newton français, a déclaré:
Cette science, qui a son origine dans la considération des jeux de hasard, aurait dû devenir l’objet le plus important de la connaissance humaine. Les questions les plus importantes de la vie sont, pour la plupart, vraiment seulement des problèmes de probabilité.
La probabilité s’applique aux phénomènes aléatoires. Mais tout n’est pas aléatoire dans le monde, nous avons dit qu’il y a une nécessité. Supposons que vous lanciez une ou deux faces d’une plaque de cuivre de la tête d’une personne, et que vous observez pour obtenir la face. Vous savez que c’est un phénomène inévitable, mais vous pouvez quand même dire que la probabilité d’une tête d’une personne est de 1, et la probabilité d’autres situations est de 0.
Certains physiciens pensent sans doute qu’il est possible de calculer la direction de l’angle de projection d’une plaque de cuivre en fonction de la vitesse, de l’angle, de l’élasticité du sol, de la forme et du poids de la plaque de cuivre, etc. Cela n’est donc pas aléatoire. Quant à l’ouverture de la loterie, si les conditions initiales peuvent être mesurées, la boule sera également calculée, donc ce n’est pas aléatoire.
Certains théologiens pensent peut-être que tout se passe selon la volonté de Dieu, mais nous ne le savons pas. Peut-être que c’est vrai. Avez-vous vu Jason et les Argonautes ?
Avec l’avancement de la technologie, les gens comprennent peu à peu les liens qui unissent de nombreux phénomènes. Par exemple, nous savons que lorsque la femme est enceinte, le sexe du bébé est déterminé. Mais une femme qui fait un gros ventre, les bienfaiteurs peuvent toujours deviner la probabilité de la naissance d’un garçon ou d’une fille sans le savoir. La veille de l’examen, les élèves, bien qu’ils se soient préparés sérieusement, ont épuisé leur cerveau à deviner, chacun d’entre eux a considéré que la probabilité était très élevée.
Mais pour le professeur qui a posé le problème, il n’a pas beaucoup de sens de juger de la probabilité que ce problème soit résolu. Pour lui, la probabilité que chaque problème soit résolu est de 1 ou 0, pas d’autres valeurs. De même, pour ceux qui voient le fruit derrière, la probabilité que le fruit soit une pomme ou une pomme ne sera que de 1 ou 0.
Dans la section 2, nous introduisons la probabilité comme un espace de probabilité. Puisque l’espace de l’échantillon peut être virtuel, alors l’événement est virtuel. Mais supposons qu’il y ait effectivement une observation, par exemple, projeter un quadrilatère sur 4 faces, marquant les points 1, 2, 3, 4 et observant le nombre de points. L’espace de l’échantillon est un ensemble de 1, 2, 3, 4 . L’ensemble des événements peut être pris comme étant le plus grand, c’est-à-dire l’ensemble constitué par tous les sous-ensembles de cet espace.
Même si vous avez accepté la notion d’espace de probabilité, et que les mathématiciens donnent souvent des définitions satisfaisantes, vous pourriez être curieux de savoir ce que signifie la probabilité de 0.1 d’un point 1 ? Est-ce que le point 1 apparaît une fois par 10 tours ?
En supposant que le nombre de points 1 apparaisse n fois et a fois, la probabilité que la fréquence relative a/n soit plus grande que la différence entre 0,1 et la valeur absolue est plus grande que la probabilité qu’un nombre positif donné soit plus petit que n, qui se rapproche de 0 au fur et à mesure que n se rapproche de l’infini.
Vous qui êtes pragmatique, vous ne trouverez probablement pas une telle explication pratique. Vous commencez par poser la question de ce qu’est la probabilité de s’approcher de l’infini. Vous continuez à lancer, sans arrêt, le lever et le coucher du soleil, le printemps et l’automne, continuez à lancer, même si vous réussissez à poursuivre le soleil, l’infini n’est toujours pas atteint, vous devez encore lancer. Le diplômé en mathématiques, en entendant que vous demandez l’infini, est comme un poisson qui reçoit de l’eau, c’est l’un des rares trucs qu’il a appris pendant ses quatre années de cours de mathématiques. Vous devez arrêter le sujet de l’infini, parce que vous poursuivez le soleil.
Mais en tout cas, vous devez comprendre que pour les 4 facettes précédentes, un seul jet d’un point est une impossibilité d’afficher le nombre de points 1 avec une probabilité de 0.1, ce qui signifie 0.1. La probabilité n’est pas seulement le résultat d’un petit nombre de jet d’un point 1. La probabilité est présente dans un grand nombre d’échantillons (n très grand). La signification de la valeur de probabilité, puisqu’elle ne peut pas être expliquée par une logique acceptable.
Selon l’explication de l’ancien diplômé en mathématiques, une version simplifiée de l’une des lois des grands nombres pourrait alors être utilisée. Mathématiquement, cela signifie que la fréquence relative des événements, la probabilité de rencontre converge à la probabilité de l’événement. Dans un monde aléatoire, il y a encore des lois à suivre, et la loi des grands nombres en est une très importante.
Un événement peut se produire aussi longtemps que la probabilité est positive. Par conséquent, même si le nombre d’observations est plus grand, il n’est pas possible d’exclure un événement très biaisé (par exemple, observation 1 000 000 fois, le nombre d’apparition de 1 est 0, ou 1 000 000 fois). Cependant, à ce moment-là, le statisticien peut se lancer et vérifier si la probabilité d’apparition de 1 est vraiment de 0,1, ce qui appartient à la catégorie des hypothèses de test en statistique.
Par ailleurs, lorsque l’on suppose qu’une planche de cuivre est équitable, on lance 100 fois, avec au moins 80 positifs, contre 10 lancements, avec au moins 8 positifs, ce qui est plus inhabituel car la probabilité qu’elle se produise est beaucoup plus faible que celle de la dernière. Donc, en obtenant également plus de 80% de positifs, plus le nombre de lancements sera grand, plus nous croirons que la planche de cuivre est injuste, et la probabilité qu’elle se produise est au moins de 0,8. Cela signifie que, statistiquement, plus le nombre de copies est grand, plus notre conclusion sera précise.
Dans un monde aléatoire, on ne sait pas toujours ce qui est vrai. Nous ne pouvons souvent pas prouver que quelque chose est vrai. C’est juste une hypothèse, à condition que vous acceptiez cette hypothèse. La probabilité de voir apparaître le nombre 1 sur 4 faces est de 0,1 et, même si vous le lancez plusieurs fois, vous ne pouvez pas prouver sa fausseté.
En outre, la probabilité d’apparition d’un point 1 sur un quadrilatère peut être estimée de différentes manières, ce qui permet d’obtenir des estimations différentes. En mathématiques, l’utilisation de différentes méthodes doit conduire au même résultat. Ce que l’on appelle une homogénéité. Mais en statistique, il n’y a souvent pas de méthode unique, sauf si des restrictions sont imposées.
Nous estimons souvent une quantité inconnue. Cette quantité inconnue peut être la probabilité qu’un événement se produise, les paramètres d’une distribution (comme les valeurs attendues et le nombre de variables, etc.) ou la durée de vie d’un objet. Ces quantités inconnues peuvent être appelées paramètres.
Les données sont la base de décision principale des statisticiens. En l’absence de données, ils ne prennent pas le temps d’examiner une situation simple et courante. En supposant que vous voulez estimer la probabilité d’une plaque de cuivre positive p. Naturellement, vous lancez plusieurs fois, par exemple n fois, et observez le résultat de n fois.
Le calcul est plus compliqué car il s’agit d’une distribution binaire. Si n est suffisamment grand (et n est trop petit, il n’est pas possible), on peut souvent l’approcher à l’aide d’une distribution normale. Cela nécessite l’utilisation d’une autre loi importante de la théorie des probabilités, le théorème de la limite centrale.
La probabilité p d’un côté positif de la plaque de cuivre estimée, avant l’échantillonnage, est un intervalle de confiance aléatoire. Si le niveau de confiance est fixé à 95%, il y a une probabilité de 0,95. La probabilité que la plaque de confiance contienne p. Après l’échantillonnage, une plaque est fixée.
Nous allons commencer par l’exemple suivant. Supposons qu’un magasin célèbre son anniversaire et que les clients achètent une certaine somme, ils peuvent tirer une boule de couleur des numéros 1 à 10. Si le numéro 5 est tiré, les dépenses de l’entreprise aujourd’hui peuvent obtenir un coupon de crédit de 30%. Avant de tirer la balle, vous savez qu’il y a une probabilité de 0,1 de recevoir un coupon de crédit, la chance n’est pas faible.
Il y a beaucoup d’exemples de ce genre. Vous avez fait un pari de 6 cartes, et vous savez qu’il est facile de gagner au moins une des cartes, car la probabilité est d’environ 0.629 (voir annexe 1). Après le tirage, la probabilité d’au moins une des cartes de votre loterie sera de 1 (si au moins une des cartes est en jeu) ou de 0 (si aucune des cartes n’est en jeu).
Vous voyez, p est fondamentalement prédéterminé, simuler un résultat d’une zone fixe, y a-t-il p entre eux, à première vue, comment peut-on dire que cette zone couvre la probabilité de p est de 0,95? Même si vous n’êtes pas une simulation, mais un réel jet d’une plaque de cuivre, p est juste inconnu, mais pour une certaine valeur, p est inconnue. L’espace de confiance fixe après le jet, il est aléatoire, il ne couvre que p, ou ne couvre pas p. On peut imaginer que le même jet de cuivre, chaque personne de 95% a une zone de confiance différente, comment peut-on déclarer que la probabilité de couverture de p est de 950.
Pour quelle raison ces 95% ? 0.95 est une valeur de probabilité, et la valeur de probabilité n’est jamais un résultat d’expérience unique. On peut dire que si l’expérience est répétée et que l’on obtient de nombreuses zones de confiance, le nombre d’espaces de confiance de p y est inclus, soit environ 95% du nombre total d’espaces.
La probabilité étant liée à nos habitudes de vie, une bonne utilisation de la probabilité nous aidera à prendre des décisions plus précises dans un monde aléatoire. Cependant, il est souvent difficile d’appliquer la probabilité, la valeur de probabilité obtenue est souvent considérée comme fausse.
Dans le passé, dans les cours de mathématiques, on rencontrait des questions dites d’application. Après avoir compris le sujet et écrit les formules mathématiques, c’est la solution mathématique.
Dans le film 21, le professeur de mathématiques pose une question en classe: il y a trois portes, une porte derrière laquelle il y a une voiture, et deux portes derrière lesquelles il y a une chèvre. Après avoir choisi la première porte, le présentateur ouvre la deuxième porte et voit une chèvre.
Yes, because my chance of getting the carwill increase from 33.33% to66.67% by switching from door 1 to door 3.
Le professeur a répondu: “Very good! ” et a accepté son opinion, c’est-à-dire qu’il fallait changer.
Si l’animateur savait à l’avance qu’une voiture était derrière cette porte, il ouvrirait la première porte, puis la porte de la chèvre (ce qui est plus raisonnable, sinon le jeu ne peut pas être joué). Si l’animateur choisit la troisième porte, la probabilité d’obtenir une voiture, comme le dit l’élève du film, augmentera de 1⁄3 à 2⁄3.
Mais le lecteur n’a peut-être pas remarqué que, dans le cas où l’animateur sait à l’avance que la voiture est derrière cette porte, nous faisons en fait une hypothèse implicite. Si les portes 2 et 3 sont toutes des chèvres, l’animateur ouvre la 2e ou la 3e porte au hasard (c’est-à-dire avec une probabilité de 1⁄2 chacune). En fait, il peut y avoir une hypothèse plus générale.
Un autre exemple. Un couple vient d’emménager dans un quartier où tout le monde sait qu’ils ont deux enfants, sans connaître leur sexe. Un jour, un administrateur du quartier voit le père de famille avec un enfant en train de jouer dans la maison. Si l’enfant est une fille, il demande la probabilité que les deux enfants soient des filles.
Enfin, un autre exemple qui apparaît souvent dans les manuels de probabilité: il y a un cercle unitaire sur un plan, et on dessine au hasard une corde, et on cherche la probabilité que la corde soit plus grande que la longueur du bord d’un triangle à côtés égaux. On peut trouver la longueur du bord d’un triangle à côtés égaux à l’intérieur de la circonférence unitaire en utilisant la géométrie.[Si nous choisissons un nombre au hasard de 0,1, cela signifie que ce nombre va tomber sur[La probabilité de n’importe quel intervalle de 0,1] est la longueur de cet intervalle. Mais la chaîne de tirage au hasard, comment est-elle dessinée ?
Les exemples ci-dessus nous montrent qu’il faut bien définir la situation lorsqu’on traite des questions de probabilité. En termes de terminologie, c’est-à-dire que l’espace de probabilité doit être clairement donné, sinon cela entraînera des discussions. Parfois, bien que l’espace de probabilité ne soit pas donné, la situation est plus simple, tout le monde a une opinion commune, sans mettre particulièrement l’accent sur ce qu’est l’espace de probabilité, il n’y a pas de problème.
En dehors de l’interprétation contextuelle, certains concepts propres à la probabilité, tels que la probabilité conditionnelle, l’indépendance et l’échantillonnage aléatoire, doivent également être pris en compte lors de l’application de la probabilité.