Classfier accuracy Measurables Adalah
11:32 PM
Edit
Classifier Accuracy Measures menurut (Han & Kamber, Data Mining : Concept and Techniques Second Edition, 2006) adalah metode klasifikasi yang dilakukan berdasarkan tingkat akurasi model dalam melakukan prediksi. Hal ini dilakukan karena keakuratan dalam mengolah data merupakan salah satu hal yang penting.
Metode yang digunakan untuk menguji tingkat akurasi model klasifikasi ini adalah metode holdout. Dalam metode ini, data asli dipartisi menjadi dua himpunan yang saling terpisah yang dinamakan training set dan test set. Model klasifikasi kemudian dibangun berdasarkan training set dan hasilnya kemudian dievaluasi dengan menggunakan testing set. Akurasi dari masing-masing metode klasifikasi dapat diestimasi berdasarkan akurasi yang diperoleh dari test set. Proporsi antara training set dan test set tidak mengikat tetapi agar variansi dalam model tidak terlalu besar maka dapat ditentukan bahwa proporsi training set lebih besar daripada test set-nya. Biasanya 2/3 dari data dijadikan training set dan 1/3 lagi dijadikan testing set.
Ukuran dari tingkat akurasi sebuah classifier dapat ditentukan dengan menggunakan perhitungan-perhitungan Classifier Accuracy Measurables, yaitu sebagai berikut:
t_pos adalah jumlah true positive yaitu jumlah data yang berhasil di prediksi oleh classifier dengan benar (misalkan jumlah data kelas “yes” dari sampel yang secara benar dapat di prediksi sebagaimana mestinya oleh model klasifikasi), pos adalah jumlah sampel data positives (“yes”), t_neg adalah jumlah true negativesyaitu adalah kebalikan dari true positive (misalkan jumlah data kelas “no” dari sampel yang benar dapat diprediksi sebagaimana mestinya oleh model klasifikasi), neg adalah jumlah total sampel negatives (“no” ), dan f_pos adalah false positives yaitu jumlah data yang salah di prediksi oleh classifier (“no” diprediksi sebagai “yes”).
Sensivity adalah ukuran tingkatan derajat classifier dapat mengenal positives samples (“yes”) berdasarkan jumlah true positives yang dapat diprediksi secara benar jika yang diberikan adalah sampel positives.
Specificity adalah ukuran tingkatan derajat classifier dapat mengenal negatives samples (“no”) berdasarkan true negatives yang dapat diprediksi secara benar jika yang diberikan adalah sampel negatives.
Precision adalah besarnya presentase classifier dalam menebak dengan tepat kelas true positives (“yes”) dengan melihat perbandingan true positive yang dapat diprediksi dengan penjumlahan true positive dan false positive.
Accuracy adalah derajat ukuran yang merupakan fungsi dari Sensivity dan Specificity model klasifikasi dalam melakukan prediksi.
Metode yang digunakan untuk menguji tingkat akurasi model klasifikasi ini adalah metode holdout. Dalam metode ini, data asli dipartisi menjadi dua himpunan yang saling terpisah yang dinamakan training set dan test set. Model klasifikasi kemudian dibangun berdasarkan training set dan hasilnya kemudian dievaluasi dengan menggunakan testing set. Akurasi dari masing-masing metode klasifikasi dapat diestimasi berdasarkan akurasi yang diperoleh dari test set. Proporsi antara training set dan test set tidak mengikat tetapi agar variansi dalam model tidak terlalu besar maka dapat ditentukan bahwa proporsi training set lebih besar daripada test set-nya. Biasanya 2/3 dari data dijadikan training set dan 1/3 lagi dijadikan testing set.
Ukuran dari tingkat akurasi sebuah classifier dapat ditentukan dengan menggunakan perhitungan-perhitungan Classifier Accuracy Measurables, yaitu sebagai berikut:
Classfier accuracy Measurables |
t_pos adalah jumlah true positive yaitu jumlah data yang berhasil di prediksi oleh classifier dengan benar (misalkan jumlah data kelas “yes” dari sampel yang secara benar dapat di prediksi sebagaimana mestinya oleh model klasifikasi), pos adalah jumlah sampel data positives (“yes”), t_neg adalah jumlah true negativesyaitu adalah kebalikan dari true positive (misalkan jumlah data kelas “no” dari sampel yang benar dapat diprediksi sebagaimana mestinya oleh model klasifikasi), neg adalah jumlah total sampel negatives (“no” ), dan f_pos adalah false positives yaitu jumlah data yang salah di prediksi oleh classifier (“no” diprediksi sebagai “yes”).
Sensivity adalah ukuran tingkatan derajat classifier dapat mengenal positives samples (“yes”) berdasarkan jumlah true positives yang dapat diprediksi secara benar jika yang diberikan adalah sampel positives.
Specificity adalah ukuran tingkatan derajat classifier dapat mengenal negatives samples (“no”) berdasarkan true negatives yang dapat diprediksi secara benar jika yang diberikan adalah sampel negatives.
Precision adalah besarnya presentase classifier dalam menebak dengan tepat kelas true positives (“yes”) dengan melihat perbandingan true positive yang dapat diprediksi dengan penjumlahan true positive dan false positive.
Accuracy adalah derajat ukuran yang merupakan fungsi dari Sensivity dan Specificity model klasifikasi dalam melakukan prediksi.