Supervised Learning
Gaya Belajar Siswa
Supervised learning adalah proses pembelajaran dengan memberikan data yang telah ditandai kepada model. Model tersebut kemudian dipelajari dan dioptimalkan untuk dapat memprediksi output yang diinginkan untuk data yang belum diketahui.
Ada dua jenis supervised learning, yaitu klasifikasi dan regresi.
Klasifikasi merupakan proses pembagian data ke dalam beberapa kelas berdasarkan karakteristik yang dimilikinya. Contoh aplikasi klasifikasi adalah sistem yang dapat mengklasifikasikan email masuk ke dalam spam atau tidak spam.
Regresi merupakan proses prediksi nilai output yang merupakan nilai numerik. Contoh aplikasi regresi adalah sistem yang dapat memprediksi harga rumah berdasarkan faktor-faktor seperti lokasi, ukuran, dan fasilitas yang dimiliki.
Dalam supervised learning, model harus diberi data latih (training data) yang terdiri dari input dan output yang sesuai. Model kemudian dipelajari dan dioptimalkan dengan menggunakan algoritma optimisasi yang sesuai. Setelah pelatihan selesai, model tersebut dapat digunakan untuk memprediksi output dari data yang belum diketahui (test data).
Algoritma yang terdapat dalam supervised learning
Linear Regression adalah salah satu metode supervised yang masuk dalam golongan regression, sesuai namanya. Contoh paling terkenal dari regresi linier adalah memperkirakan harga rumah berdasarkan fitur yang terdapat pada rumah seperti luas rumah, jumlah kamar tidur, lokasi dan sebagainya. Ini adalah model paling sederhana yang perlu diketahui guna memahami metode machine learning lain yang lebih kompleks. Regresi linier cocok dipakai ketika terdapat hubungan linear pada data. Namun untuk implementasi pada kebanyakan kasus, ia kurang direkomendasikan.
Logistic Regression adalah salah satu algoritma yang sering digunakan dalam supervised learning untuk memecahkan masalah klasifikasi. Algoritma ini menggunakan teori probabilitas untuk memprediksi kemungkinan terjadinya suatu event. Pada dasarnya, logistic regression memprediksi probabilitas terjadinya suatu event berdasarkan input yang diberikan. Jika probabilitas terjadinya event tersebut lebih dari 50%, maka event tersebut akan diklasifikasikan sebagai kelas 1. Sebaliknya, jika probabilitas terjadinya event kurang dari 50%, maka event tersebut akan diklasifikasikan sebagai kelas 0.
Classification adalah teknik untuk menentukan kelas atau kategori berdasarkan atribut yang diberikan. Klasifikasi yang menghasilkan dua kategori disebut klasifikasi biner, sedangkan klasifikasi yang menghasilkan 3 kategori atau lebih disebut multiclass classification atau klasifikasi banyak kelas.
Decision Trees adalah salah satu algoritma supervised learning yang dapat dipakai untuk masalah klasifikasi dan regresi. Decision tree merupakan algoritma yang powerful alias mampu dipakai dalam masalah yang kompleks. Decision tree juga merupakan komponen pembangun utama algoritma Random Forest, yang merupakan salah satu algoritma paling powerful saat ini.
Support Vector Machines adalah salah satu algoritma yang sering digunakan dalam supervised learning untuk memecahkan masalah klasifikasi dan regresi. Algoritma ini menggunakan teori matematika yang kompleks untuk memisahkan data ke dalam kelas yang berbeda. Pada dasarnya, SVM akan mencari garis atau hyperplane yang paling baik untuk memisahkan data ke dalam kelas yang berbeda. Garis atau hyperplane tersebut disebut dengan “decision boundary”. Data yang berada di satu sisi decision boundary akan diklasifikasikan ke dalam satu kelas, sedangkan data yang berada di sisi lainnya akan diklasifikasikan ke dalam kelas yang lain.
Neural Networks adalah salah satu algoritma yang sering digunakan dalam machine learning untuk memecahkan masalah klasifikasi, regresi, dan pengenalan pola. Algoritma ini meniru cara kerja otak manusia dalam memproses informasi dan membuat keputusan. Neural network terdiri dari lapisan-lapisan node atau “neuron” yang terhubung satu sama lain. Setiap neuron akan menerima input dari neuron-neuron di lapisan sebelumnya, kemudian menghitung output berdasarkan weight yang diberikan, dan mengirimkan output tersebut ke neuron-neuron di lapisan berikutnya.
Naive Bayes adalah algoritma klasifikasi berbasis teorema Bayes dengan asumsi independensi antar fitur. Meskipun asumsi ini jarang benar dalam kenyataan, algoritma ini sering bekerja dengan baik dalam praktik.