Pengklasifikasian Dokumen Berbahasa Arab Menggunakan K-Nearest Neighbor

Fahrul Agus, Heliza Rahmania Hatta, Mahyudin Mahyudin

Abstract


Pengklasifikasian dokumen didasarkan atas kesamaan fitur atau kesamaan isi dokumen. Klasifikasi dilakukan dengan cara memasukan dokumen-dokumen kedalam kategori-kategori yang sudah ditentukan sebelumnya. K-Nearest Neighbor (KNN) adalah sebuah metode untuk melakukan klasifikasi terhadap objek berdasarkan data pembelajaran yang jaraknya paling dekat dengan objek tersebut. Algoritma ini bertujuan untuk mengklasifikasi objek baru berdasarkan atribut dan training sampel. Uji coba dilakukan pada dokumen teks berbahasa Arab diambil dari koleksi dokumen surat kabar Arab Al-Jazirah. Algoritma kNN dipilih karena lebih sederhana, efektif, dan dapat diaplikasikan pada jumlah training yang sedikit. Hasil uji coba membuktikan bahwa penggunaan algoritma kNN dapat melakukan?  klasifikasi dokumen berbahasa Arab dengan nilai lokal optimal F-Measure terbaik sebesar 0.85 dan tingkat akurasi 96%.


Keywords


k-Nearest Neighbor, Klasifikasi dokumen berbahasa Arab

Full Text:

PDF


DOI: https://doi.org/10.55601/jsm.v18i1.413

Refbacks

  • There are currently no refbacks.