DETAIL KOLEKSI

Pengaruh undersampling dan oversampling dalam perbandingan analisis sentimen ulasan pengunjung objek wisata Waterbom Bali pada media sosial tripadvisor menggunakan klasifikasi random forest dan Naïve Bayes


Oleh : Hilmi Abdul Gani

Info Katalog

Penerbit : FTI - Usakti

Kota Terbit : Jakarta

Tahun Terbit : 2024

Pembimbing 1 : Binti Solihah

Pembimbing 2 : Syandra Sari

Kata Kunci : Analisis Sentimen, Waterbom Bali, Undersampling, Oversampling, Random Forest, Naïve Bayes, Word2vec

Status Posting : Unpublished

Status : Lengkap

D Dalam era kemajuan teknologi, internet memegang peran utama sebagai sumber informasi global, khususnya dalam pencarian informasi seputar tempat wisata. Tripadvisor, sebagai platform terkemuka, memungkinkan pengguna memberikan dan melihat ulasan serta komentar pengunjung terkait destinasi perjalanan, seperti Waterbom Bali. Penelitian ini bertujuan untuk menganalisis sentimen ulasan pengunjung menggunakan metode Random Forest dan Naïve Bayes. Data diambil dari scrapping ulasan Waterbom Bali, dengan total 5750 data. Meskipun terdapat ketidakseimbangan data, teknik class imbalance digunakan. Sentimen analisis dibandingkan dengan implementasi metode ekstraksi fitur Word2Vec. Hasil eksperimen menunjukkan perbedaan signifikan antara kedua metode. Pada Random Forest setelah undersampling, akurasi mencapai 24%, sementara oversampling meningkatkan akurasi menjadi 98%. Untuk Multinomial Naïve Bayes setelah undersampling, akurasi mencapai 36%, sedangkan oversampling memberikan akurasi sebesar 97%.

I In the era of technological advancement, the internet plays a pivotal role as the primary source of global information, particularly in searching for details about tourist destinations. Tripadvisor, as a leading platform, enables users to provide and explore reviews and comments from fellow travelers, including those about destinations like Waterbom Bali. This research aims to analyze visitor sentiment through the implementation of the Random Forest and Naïve Bayes methods. Data was collected through the scrapping of Waterbom Bali reviews, yielding a total of 5750 entries. Despite data imbalances, class imbalance techniques were employed. Sentiment analysis was conducted by comparing the effectiveness of the Random Forest and Naïve Bayes methods using the Word2Vec feature extraction technique. Experimental results revealed significant differences between the two methods. For Random Forest, after undersampling, the accuracy reached 24%, while oversampling improved accuracy to 98%. Regarding Multinomial Naïve Bayes, after undersampling, accuracy reached 36%, and oversampling resulted in an accuracy of 97%.

Bagaimana Anda menilai Koleksi ini ?