Seleksi Fitur Pada Dokumen Abstrak Teks Bahasa Indonesia Menggunakan Metode Information Gain
Abstract
Klasifikasi dapat diterapkan di semua bidang kehidupan termasuk dalam teks. Algoritma klasifikasi menggunakan semua fitur yang terdapat pada data untuk membangun sebuah model, padahal tidak semua fitur tersebut sesuai terhadap hasil klasifikasi. Seleksi fitur adalah teknik untuk memilih fitur penting dan relevan terhadap data dan mengurangi fitur yang tidak relevan. Seleksi fitur bertujuan untuk memilih fitur terbaik dari suatu kumpulan data fitur. Tujuan dari penelitian ini adalah menerapkan metode Information Gain dalam sistem seleksi fitur untuk dokumen teks berbahasa Indonesia. Metode Information Gain adalah metode yang menggunakan teknik scoring untuk pembobotan sebuah fitur dengan menggunakan maksimal entropy. Fitur yang dipilih adalah fitur dengan nilai Information Gain yang lebih besar atau sama dengan nilai threshold tertentu. Nilai threshold yang digunakan yaitu 0,02; 0,05 dan 0,07. Data yang digunakan adalah sekumpulan dokumen abstrak skripsi. Dari pengujian menggunakan 21 data, sistem dapat mereduksi fitur sebanyak 89% menggunakan threshold 0,07. Penelitian ini menghasilkan aplikasi yang dapat mengurangi dimensi fitur dan memilih fitur terbaik di dalam dokumen teks bahasa Indonesia.
Keywords
Seleksi Fitur; Fitur; Information Gain; Entropy
Full Text:
PDFDOI: https://doi.org/10.55601/jsm.v17i2.379
Refbacks
- There are currently no refbacks.