Memahami Bayesian secara Sederhana

Sumber Gambar: id.wikipedia.org

Banyak orang telah berhasil menyederhanakan konsep-konsep rumit menjadi sesuatu yang sederhana dan mudah dipahami banyak orang. Tetapi tidak sedikit juga yang gagal, terutama mereka yang berusaha menyederhanakan konsep-konsep di bidang ilmu eksak/matematik.

Saya tidak tahu, dengan tulisan ini nanti, saya akan masuk kategori yang mana. Tapi paling tidak saya mencobanya terlebih dahulu..Siapa tahu, setelah membaca tulisan ini, kalian memang benar-benar memperoleh penjelasan yang lebih mudah dan sederhana.
Aamiin..he..he..he…

Kali ini yang akan kita bahas mengenai Bayesian Statistics. Salah satu bahasan yang paling penting dalam ilmu statistik. Bahkan katanya, ilmu statistics sebenarnya hanya terdiri dari 2 aliran. Yaitu aliran Frequentis dan aliran Bayesian.
Bismillah..kita langsung mulai ya…

Ketika kita ingin menduga suatu parameter populasi, biasanya (aliran Frequentis) kita akan mengambil sampel acak yang berukuran n kemudian dari informasi yang terkandung dalam sampel itu kita subtitusikan ke suatu fungsi penduga. Misalnya saja p=x/n untuk menduga parameter proporsi dan xbar=sigma x dibagi n untuk menduga parameter rata-rata populasi. Dengan demikian, kita menduga parameter populasi semata-mata hanya dengan informasi yang diperoleh dari sampel saja.

Nah, bagaimana jika ternyata kita memiliki informasi awal tentang parameter yang ingin kita duga itu?

Informasi ini tentu saja menyangkut lokasi dari parameter yang berupa distribusi atau sebaran dari parameter tersebut. Jadi disini kita memiliki informasi tambahan di luar sampel yang bisa digunakan untuk membantu kita menduga nilai parameter populasi. Di dalam buku-buku statistics, informasi ini biasa diistilahkan dengan istilah prior information atau prior distribution.

Agar kita mampu mengakomodir informasi awal mengenai parameter yang kita punya tadi dalam upaya proses pendugaan kita, maka sekarang kita harus mencari alat yang bisa menggabungkan informasi awal tentang parameter (prior information) itu dengan informasi yang diperoleh dari sampel untuk menghasilkan sebuah informasi akhir yang bisa kita gunakan untuk membantu menduga parameter populasi secara lebih tepat. Alat itu di dunia statistics dikenal dengan istilah Teorema Bayes. Sedangkan informasi akhir yang dihasilkan dari penggabungan dua informasi di atas dikenal dengan istilah posterior information atau posterior distribution.

Setelah kita memperoleh posterior distribution, maka selanjutnya proses pendugaan parameter didasarkan pada ciri/kharakteristik dari posterior distribution ini. Misalnya saja, nilaitengah posterior distribution dapat digunakan sebagai nilai dugaan titik dari parameter yang ingin kita duga.

Agar lebih jelas, saya sertakan sedikit contoh kasusnya ya. Contoh kasus ini saya ambil dari buku Pengantar Statistik edisi ke 3, karya Ronald E Walpole:

Misalkan diasumsikan bahwa distribusi awal bagi proporsi (p) barang cacat yang dihasilkan oleh suatu mesin adalah:

dugalah proporsi barang cacat yang dihasilkan oleh mesin ini bila dalam sampel acak 2 barang yang terdapat 1 barang cacat.

Dari contoh kasus diatas, distribusi awal yang disajikan pada tabel diatas itulah yang disebut distribusi prior sedangkan kalimat : “dalam sampel acak 2 barang yang terdapat 1 barang cacat” itulah yang disebut sebagai informasi sampel. Kedua informasi ini nanti kita akan gabungkan menjadi distribusi posterior menggunakan Teorema Bayes.

Pertama-tama kita simbolkan:
A : banyaknya barang yang cacat dalam sampel adalah 1
B1 : proporsi barang cacat adalah p = 0.1
B2 : proporsi barang cacat adalah p = 0.2

Bila p=0.1 maka peluang bahwa dalam suatu sampel acak 2 barang terdapat 1 yang cacat akan mengikuti distribusi binomial yaitu:
b(1;2,0.1)= 2C1 (0.1) (0.9) = 0.18
dan bila p=0.2 maka:
b(1;2,0.2)= 2C1 (0.2) (0.8) = 0.32

Sekarang kita gabungkan nilai peluang 0.18 dan 0.32 ini dengan peluang awal sebelum mendapat informasi dari sampel sebagai berikut:

P(B1|A) = P(B1)P(A|B1)/(P(B1)P(A|B1)+P(B2)P(A|B2))= (0.6)(0.18)/{(0.6)(0.18)+(0.4)(0.32)}=0.46
P(B2|A) = 1-P(B1|A)=1-0.46= 0.54

sehingga kita peroleh distribusi posterior proporsi barang cacat (p) bila diketahui informasi sampel berupa banyaknya barang cacat dalam sampel acak sebesar 1 sebagai berikut:

Dengan demikian untuk menduga parameter proporsi barang yang cacat dalam populasi kita dapat menghitung nilaitengah dari distribusi posterior diatas, yaitu:

p^ =(0.1)(0.46)+(0.2)(0.54)=0.154

Itulah contoh kasus sederhana dari proses pendugaan parameter populasi menggunakan metode Bayes.
Dalam prakteknya, distribusi posterior yang terbentuk biasanya memiliki struktur yang rumit dimana untuk menentukan nilaitengahnya kita membutuhkan bantuan metode simulasi seperti Markov Chain Monte Carlo, Gibs Sampling, dan lain-lain. Semoga kita bisa membahasnya di lain waktu..

Demikianlah penjelasan sederhana saya mengenai Bayesian Statistics. Barangkali tidak begitu sederhana, tapi mudah-mudahan, jika dibandingkan penjelasan yang ada di jurnal dan buku-buku statistics, penjelasan yang saya tulis ini jauh lebih sederhana ya…

Akhirnya, terimakasih dan semoga bermanfaat buat teman-teman semua..

3 pemikiran pada “Memahami Bayesian secara Sederhana

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout /  Ubah )

Foto Google

You are commenting using your Google account. Logout /  Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout /  Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout /  Ubah )

Connecting to %s