Pengklasifikasian Dokumen Berbahasa Arab Menggunakan K-Nearest Neighbor
Abstract
Pengklasifikasian dokumen didasarkan atas kesamaan fitur atau kesamaan isi dokumen. Klasifikasi dilakukan dengan cara memasukan dokumen-dokumen kedalam kategori-kategori yang sudah ditentukan sebelumnya. K-Nearest Neighbor (KNN) adalah sebuah metode untuk melakukan klasifikasi terhadap objek berdasarkan data pembelajaran yang jaraknya paling dekat dengan objek tersebut. Algoritma ini bertujuan untuk mengklasifikasi objek baru berdasarkan atribut dan training sampel. Uji coba dilakukan pada dokumen teks berbahasa Arab diambil dari koleksi dokumen surat kabar Arab Al-Jazirah. Algoritma kNN dipilih karena lebih sederhana, efektif, dan dapat diaplikasikan pada jumlah training yang sedikit. Hasil uji coba membuktikan bahwa penggunaan algoritma kNN dapat melakukan�?� klasifikasi dokumen berbahasa Arab dengan nilai lokal optimal F-Measure terbaik sebesar 0.85 dan tingkat akurasi 96%.
Keywords
Full Text:
PDFDOI: https://doi.org/10.55601/jsm.v18i1.413
Refbacks
- There are currently no refbacks.