Statistik Bayesian adalah disiplin yang kuat di bidang matematika, dengan aplikasi luas di banyak bidang termasuk keuangan, penelitian medis, dan teknologi informasi.
Dalam artikel ini, kita akan secara singkat memperkenalkan beberapa matematikawan utama yang mendirikan bidang ini.
Sebelum Bayes
Untuk lebih memahami statistik Bayesian, kita perlu kembali ke abad ke-18 dan merujuk pada matematikawan De Moivre dan makalahnya
Dalam makalahnya, De Moivre memecahkan banyak masalah yang berkaitan dengan probabilitas dan perjudian pada zamannya.
Salah satu pertanyaan paling sederhana dalam makalahnya adalah:
Membaca melalui masalah yang dijelaskan dalam
Ini akan dinyatakan hari ini dalam istilah matematika sebagai:
Rumus
𝑃(𝑋|𝜃)
Namun, bagaimana jika kita tidak tahu apakah koin itu adil?𝜃
?
Hampir lima puluh tahun kemudian, pada tahun 1763, sebuah makalah berjudul
Dalam beberapa halaman pertama dokumen ini, ada sebuah karya yang ditulis oleh matematikawan Richard Price yang meringkas makalah yang ditulis oleh temannya Thomas Bayes beberapa tahun sebelum kematiannya.
Bahkan, ia merujuk pada satu masalah khusus:
Dengan kata lain, setelah mengamati sebuah peristiwa kita menentukan apa yang kemungkinan bahwa parameter yang tidak diketahuiθ
ini sebenarnya salah satu masalah pertama yang berkaitan dengan kesimpulan statistik dalam sejarah dan itu menimbulkan istilah kebarangkalian terbalik dalam istilah matematika:
Rumus
𝑃( 𝜃 | 𝑋)
Ini tentu saja apa yang kita sebut distribusi posterior dari Bayes
Memahami motivasi di balik penelitian kedua pendeta tua ini,Thomas BayesdanRichard PriceTapi untuk melakukan ini, kita perlu untuk sementara mengesampingkan beberapa pengetahuan tentang statistik.
Kita berada di abad ke-18 ketika probabilitas menjadi bidang yang semakin menarik bagi matematikawan. Matematikawan seperti de Moivre atau Bernoulli telah menunjukkan bahwa beberapa peristiwa terjadi dengan tingkat keacakan tertentu tetapi masih diatur oleh aturan tetap. Misalnya, jika Anda melempar dadu beberapa kali, seperenam dari waktu itu akan mendarat di enam. Seolah-olah ada aturan tersembunyi yang menentukan peluang nasib.
Sekarang bayangkan jika Anda seorang matematikawan dan orang percaya yang taat hidup pada periode ini. Anda mungkin tertarik untuk memahami hubungan antara aturan tersembunyi ini dan Tuhan.
Ini memang pertanyaan yang diajukan oleh Bayes dan Price sendiri. Mereka berharap bahwa solusi mereka akan langsung berlaku untuk membuktikan bahwa dunia harus merupakan hasil dari kebijaksanaan dan kecerdasan; oleh karena itu memberikan bukti keberadaan Tuhan sebagai penyebab utama - yaitu penyebab tanpa kausalitas.
Anehnya, sekitar dua tahun kemudian pada tahun 1774, tanpa membaca makalah Thomas Bayes, matematikawan Prancis Laplace menulis makalah berjudul
Ini adalah apa yang kita ketahui hari ini sebagai teorema Bayes:
Di mana?P(θ)
adalah distribusi yang seragam.
Kami akan membawa statistik Bayesian ke masa kini dengan menggunakan Python dan PyMC perpustakaan, dan melakukan eksperimen sederhana.
Misalkan seorang teman memberi Anda koin dan bertanya apakah Anda pikir itu adalah koin yang adil. Karena dia terburu-buru, dia memberi tahu Anda bahwa Anda hanya dapat melempar koin 10 kali. Seperti yang Anda lihat, ada parameter yang tidak diketahuip
dalam masalah ini, yang merupakan probabilitas mendapatkan kepala dalam melempar koin, dan kita ingin memperkirakan nilai yang paling mungkin darip
.
(Catatan: Kami tidak mengatakan bahwa parameterp
adalah variabel acak tetapi lebih bahwa parameter ini tetap; kita ingin tahu di mana itu paling mungkin antara.)
Untuk memiliki pandangan yang berbeda tentang masalah ini, kita akan menyelesaikannya di bawah dua keyakinan sebelumnya yang berbeda:
p
Dalam hal ini, kita akan menggunakan apa yang disebut non-informatif sebelumnya karena Anda belum menambahkan informasi untuk keyakinan Anda.p
tidak mungkin kurang dari 0,3 atau lebih dari 0,7. dalam hal ini, kita akan menggunakan informasi sebelumnya.Untuk kedua skenario ini, keyakinan kami sebelumnya adalah sebagai berikut:
Dengan bukti ini, di mana kita mungkin menemukan parameterp
?
Seperti yang Anda lihat, dalam kasus pertama, distribusi parameter sebelumnyap
terkonsentrasi pada perkiraan kemungkinan maksimum (MLE)p=0.2
, yang merupakan metode yang mirip dengan yang digunakan oleh sekolah frekuensi. parameter yang tidak diketahui benar akan berada dalam interval konfidensi 95%, antara 0,04 dan 0,48.
Di sisi lain, dalam kasus-kasus di mana ada kepercayaan tinggi bahwa parameterp
Dalam hal ini, parameter yang tidak diketahui benar akan berada dalam interval konfidensi 95% antara 0,23 dan 0,57.
Oleh karena itu, dalam skenario kasus pertama, Anda akan mengatakan kepada teman Anda dengan pasti bahwa koin ini tidak adil tetapi dalam situasi lain Anda akan mengatakan tidak pasti apakah itu adil atau tidak.
Seperti yang dapat Anda lihat bahkan ketika menghadapi bukti yang identik (dua kepala dari sepuluh lemparan), di bawah keyakinan sebelumnya yang berbeda hasil dapat sangat bervariasi; satu keuntungan dari statistik Bayesian atas metode tradisional terletak di sini: seperti metodologi ilmiah memungkinkan kita untuk memperbarui keyakinan kita dengan menggabungkan mereka dengan pengamatan dan bukti baru.
Dalam artikel hari ini, kita melihat asal-usul statistik Bayesian dan kontributor utamanya.quantdare.com.