Apa Itu Naive Bayes?
Gaya Belajar Siswa
Naive Bayes adalah metode yang cocok untuk klasifikasi biner dan multiclass. Metode yang juga dikenal sebagai Naive Bayes Classifier ini menerapkan teknik supervised klasifikasi objek di masa depan dengan menetapkan label kelas ke instance/catatan menggunakan probabilitas bersyarat. Probabilitas bersyarat adalah ukuran peluang suatu peristiwa yang terjadi berdasarkan peristiwa lain yang telah (dengan asumsi, praduga, pernyataan, atau terbukti) terjadi.
model machine learning yang diterapkan pada program tersebut menggunakan teorema Bayes yang dirumuskan sebagai berikut:
Dalam istilah yang lebih sederhana, Teorem Bayes adalah rumus matematika sederhana untuk menemukan probabilitas ketika kita mengetahui probabilitas tertentu lainnya.
Tipe Naive Bayes Classifier
Metode Naive Bayes digolongkan menjadi beberapa tipe berdasarkan fungsinya. Berikut ini penjelasannya.
Multinomial Naive Bayes
Salah satu tipe metode Naive Bayes adalah Multinomial yang sebagian besar digunakan untuk mengklasifikasi kategori dokumen. Sebuah dokumen dapat dikategorikan bertema olahraga, politik, teknologi, atau lain-lain berdasarkan frekuensi kata-kata yang muncul dalam dokumen.
Bernoulli Naive Bayes
Tipe ini mirip dengan tipe Multinomial, namun klasifikasinya lebih berfokus pada hasil ya/tidak. Prediktor yang di-input adalah variabel boolean. Misalnya, prediksi atas sebuah kata muncul dalam teks atau tidak.
Gaussian Naive Bayes
Distribusi Gaussian adalah asumsi pendistribusian nilai kontinu yang terkait dengan setiap fitur berisi nilai numerik. Ketika diplot, akan muncul kurva berbentuk lonceng yang simetris tentang rata-rata nilai fitur.
Kesimpulan
Berdasarkan uraian di atas, dapat ditarik kesimpulan bahwa Naive Bayes adalah metode klasifikasi data berdasarkan faktor-faktor probabilitas.