نبذة مختصرة : Penelitian ini berfokus pada analisis sentimen terhadap artikel pemberitaan mengenai pemilihan umum terutama presiden dan wakil presiden dengan membandingkan performa algoritma klasifikasi, khususnya Decision Tree dan K-Nearest Neighbors (KNN), serta mengevaluasi efektivitas teknik SMOTE (Synthetic Minority Over-sampling Technique) dalam mengatasi masalah ketidakseimbangan data atau dataset menunjukan bahwa jumlah data yang memiliki sentimen positif lebih banyak dari pada sentimen berupa negatif. Tujuan utama dari penelitian ini adalah untuk menentukan algoritma yang lebih unggul dalam klasifikasi sentimen dan melihat bagaimana SMOTE dapat meningkatkan kinerja model tersebut. Dataset di scraping dan dilakukan untuk normalisasi teks, penghapusan stop words, dan ekstraksi fitur. SMOTE diterapkan untuk menyeimbangkan kelas dalam dataset, sehingga mengatasi ketidakseimbangan yang sering terjadi pada data sentimen. Algoritma digunakan Decision Tree dan KNN. Hasil penelitian menunjukkan bahwa Decision Tree secara konsisten memberikan performa yang lebih baik dibandingkan KNN dalam hal akurasi sebesar 85%, presisi 44%, recall 47%, dan skor F1 45%. Penerapan SMOTE terbukti meningkatkan kinerja kedua algoritma, namun pengaruhnya lebih signifikan pada Decision Tree. Dengan demikian, penelitian ini menyimpulkan bahwa Decision Tree, dikombinasikan dengan SMOTE, merupakan pendekatan yang lebih efektif dan andal untuk analisis sentimen artikel pemilihan umum dibandingkan dengan KNN. Hasil ini memberikan kontribusi penting dalam pengembangan metode analisis sentimen yang dapat diterapkan untuk memahami dinamika opini publik dalam konteks politik. ; This research focuses on sentiment analysis of news articles about general elections, especially the president and vice president by comparing the performance of classification algorithms, especially Decision Tree and K-Nearest Neighbors (KNN), and evaluating the effectiveness of the SMOTE (Synthetic Minority Over-sampling Technique) technique in overcoming the problem of data ...
No Comments.