Sumber dimuat naik... memuat...

Bayes - Rahsia Penguraian Kebarangkalian, Mencari Kebijaksanaan Matematik di Balik Keputusan

Penulis:Pencipta Kuantiti - Impian Kecil, Dicipta: 2023-11-26 16:48:39, Dikemas kini: 2023-11-28 21:53:23

img

Statistik Bayesian adalah satu bidang akademik yang kuat dalam bidang matematik dan mempunyai aplikasi yang luas dalam banyak bidang, termasuk kewangan, penyelidikan perubatan dan teknologi maklumat. Ia membolehkan kita menggabungkan kepercayaan sebelumnya dengan bukti untuk membuat kepercayaan baru yang membolehkan kita membuat keputusan yang lebih bijak.

Dalam artikel ini, kita akan memaparkan secara ringkas beberapa ahli matematik utama yang menubuhkan bidang ini.

Sebelum Bayes Untuk memahami statistik Bayesian dengan lebih baik, kita perlu kembali ke abad ke-18 dan merujuk kepada ahli matematik De Moivre dan makalahnya, Principle of Odds.[1]

Dalam karyanya, De Moivre menyelesaikan banyak masalah yang berkaitan dengan kebarangkalian dan perjudian pada zamannya. Seperti yang anda mungkin tahu, penyelesaiannya terhadap salah satu masalah itu membawa kepada asal-usul pembahagian normal, tetapi itu cerita lain.

Dalam kertas tulisannya terdapat satu soalan yang paling mudah:

Orang yang menggunakan duit syiling yang adil dilemparkan tiga kali berturut-turut dan mendapat tiga peluang positif.

Membaca masalah yang diterangkan dalam prinsip peluang permainan, anda mungkin perhatikan bahawa kebanyakan masalah bermula dengan satu andaian, dan kemudian mengira kebarangkalian peristiwa tertentu. Sebagai contoh, dalam masalah di atas, terdapat satu andaian bahawa syiling itu adil, oleh itu peluang untuk mendapatkan positif dalam lompatan adalah 0.5.

Ini dinyatakan dalam istilah matematik hari ini sebagai:

𝑃(𝑋|𝜃)

Tetapi bagaimana jika kita tidak tahu sama ada duit syiling itu adil?𝜃Adakah?

Thomas Bayes dan Richard Price

Hampir lima puluh tahun kemudian, pada tahun 1763, sebuah makalah mengenai isu-isu dalam Prinsip Penyelesaian Penumbra[2] diterbitkan dalam The Philosophical Exchange of Penumbra, Royal Society of London.

Dalam beberapa halaman pertama dokumen itu, terdapat teks yang ditulis oleh ahli matematik Richard Price, yang meringkaskan isi kertas kerja yang ditulis oleh rakannya Thomas Bayes beberapa tahun sebelum kematiannya. Dalam pengantarannya, Price menerangkan kepentingan beberapa penemuan yang dibuat oleh Thomas Bayes, yang tidak terlibat dalam buku de Moivre mengenai prinsip peluang yang tidak dapat diandalkan.

Malah, beliau merujuk kepada satu isu tertentu:

Mempunyai peluang untuk mencari peluang antara dua kemungkinan yang dinamakan.

Dalam erti kata lain, selepas melihat sesuatu, kita akan menemui parameter yang tidak diketahui.θApakah kebarangkalian antara dua tahap kebarangkalian. Ini sebenarnya merupakan salah satu masalah pertama dalam sejarah yang berkaitan dengan kesimpulan statistik, dan membawa nama kebarangkalian terbalik. Dalam istilah matematik:

𝑃( 𝜃 | 𝑋)

Ini tentu saja adalah sebaran posteriori yang kita sebut hari ini sebagai teorema Bayes.

Penyebab Tanpa Penyebab

Saya tidak tahu apa yang akan berlaku jika saya tidak mengamalkan cara ini.Thomas BayesdanRichard PriceTetapi untuk melakukan ini, kita perlu meletakkan sedikit pengetahuan mengenai statistik sementara.

Kita berada di abad ke-18 dan kebarangkalian menjadi bidang yang semakin menarik minat ahli matematik. Ahli matematik seperti De Moffat atau Bernoulli telah menunjukkan bahawa beberapa peristiwa berlaku dengan tahap rawak tetapi masih dikawal oleh peraturan tetap. Sebagai contoh, jika anda menggulung dadu beberapa kali, satu perenam masa ia akan berhenti pada enam.

Sekarang, bayangkan anda seorang ahli matematik dan seorang penganut agama yang hidup pada zaman ini. Anda mungkin berminat untuk mengetahui hubungan antara hukum tersembunyi dan Tuhan.

Ini memang merupakan soalan yang ditanya oleh Bayes dan Price sendiri. Mereka berharap penyelesaian kepada masalah ini boleh digunakan secara langsung untuk membuktikan bahawa alam semesta maya mestilah hasil dari kecerdasan dan kecerdasan; oleh itu, memberikan bukti bagi kewujudan Tuhan dengan sebab akhir maya[2] - iaitu, sebab tanpa sebab.

Lapras

Menariknya, kira-kira dua tahun kemudian, pada tahun 1774, tanpa membaca kertas kerja Thomas Bayes, ahli matematik Perancis Laplace menulis kertas kerja yang bertajuk The Causes of Related Events by the Probability of Events,[3] yang merupakan kertas kerja mengenai masalah kebarangkalian terbalik. Pada halaman pertama, anda boleh membaca

Prinsip utama:

Jika suatu peristiwa boleh disebabkan oleh n sebab yang berbeza, maka peratusan antara kemungkinan sebab-sebab peristiwa tersebut adalah sama dengan kemungkinan kejadian yang disebabkan oleh sebab-sebab tersebut, dan kemungkinan adanya setiap sebab-sebab tersebut adalah sama dengan kemungkinan penyebab kejadian tersebut, selain daripada jumlah jumlah kemungkinan kejadian setiap sebab tersebut.

Ini adalah teorema Bayes yang kita tahu hari ini:

img

Di antaranyaP(θ)Ia adalah pembahagian seragam.

Percubaan Koin

Kami akan membawa statistik Bayesian kepada masa kini dengan menggunakan Python dan perpustakaan PyMC dan melakukan eksperimen mudah.

Katakan seorang kawan memberi anda syiling dan bertanya apakah anda fikir itu adalah syiling yang adil. Oleh kerana dia terburu-buru, dia memberitahu anda bahawa anda hanya boleh membuang syiling 10 kali. Seperti yang anda lihat, terdapat satu parameter yang tidak diketahui dalam masalah ini.pIni adalah peluang untuk mendapatkan nombor positif dalam undian wang syiling.pNilai yang paling mungkin.

(Perhatikan: kita tidak bercakap tentang parameter)pIa adalah satu pembolehubah rawak, tetapi parameter ini tetap, dan kita ingin tahu di antara mana nilai yang paling mungkin.

Untuk mendapatkan pandangan yang berbeza mengenai isu ini, kita akan mengatasinya dengan dua kepercayaan yang berbeza:

  • 1. anda tidak mempunyai maklumat tentang keadilan syiling, anda akan memberi peluang yang sama kepadapDalam kes ini, kami akan menggunakan apa yang dipanggil prefix tanpa maklumat kerana anda tidak menambah apa-apa maklumat dalam kepercayaan anda.

  • 2. anda tahu dari pengalaman bahawa walaupun duit syiling mungkin tidak adil, ia adalah sukar untuk membuat ia sangat tidak adil, jadi anda menganggap parameterpKemungkinan besar tidak lebih rendah daripada 0.3 atau lebih tinggi daripada 0.7; dalam kes ini, kita akan menggunakan satu prasyarat maklumat;

Dalam kedua-dua kes ini, kepercayaan kami adalah sebagai berikut:

img

Selepas 10 kali dilemparkan, anda mendapat 2 kali hasil positif. Dengan bukti ini, kita mungkin akan mencari parameter kita di mana.p

img

Jadi, seperti yang anda lihat, dalam kes pertama, kita akan menggunakan parameter.pPembahagian pendahuluan tertumpu pada anggaran yang paling serupa (MLE)p=0.2Ini adalah kaedah yang serupa dengan menggunakan kaedah sekolah frekuensi. Parameter yang tidak diketahui benar akan berada dalam rentang kepercayaan 95%, antara 0.04 dan 0.48.

Di sisi lain, terdapat keyakinan yang tinggi bahawa parameterpDalam kes yang sepatutnya antara 0.3 dan 0.7, kita dapat melihat pembahagian latar belakang sekitar 0.4, jauh lebih tinggi daripada nilai yang diberikan oleh MLE kami. Dalam kes ini, parameter yang tidak diketahui benar akan berada dalam rentas kepercayaan 95%, antara 0.23 dan 0.57.

Oleh itu, dalam kes pertama, anda akan memberitahu rakan anda bahawa anda yakin bahawa syiling itu tidak adil. Tetapi dalam kes yang lain, anda akan memberitahu dia bahawa anda tidak pasti sama ada syiling itu adil.

Seperti yang anda lihat, walaupun terdapat bukti yang sama (dua positif dalam 10 lompatan), hasilnya akan berbeza di bawah kepercayaan yang berbeza. Ini adalah kelebihan statistik Bayesian, yang serupa dengan kaedah saintifik, yang membolehkan kita memperbaharui kepercayaan kita dengan menggabungkan kepercayaan yang sama dengan pemerhatian dan bukti baru.

END

Dalam artikel hari ini, kita melihat asal-usul statistik Bayesian dan penyumbang utamanya. Sejak itu, terdapat banyak penyumbang penting yang lain dalam bidang statistik (Jeffreys, Cox, Shannon, dan lain-lain).转载自quantdare.com


Lebih lanjut