Analisis sentimen tentang vaksin sinovac di twitter menggunakan naïve bayes dan k-nearest neighbors
P Penelitian ini melakukan Sentimen Analisis tentang Vaksin Sinovac dengan mengambil data di media sosial Twitter. Sebab pemerintah Indonesia mewajibkan masyarakat untuk melakukan vaksinasi Covid-19 yang menimbulkan pro-kontra. Sebelumnya peneliti melakukan pengambilan data “Jenis Vaksin†untuk mengetahui vaksin apa yang ramai dibicarakan. Hasilnya kata “Sinovac†yang paling banyak dibicarakan. Setelah itu melakukan pengambilan data dengan kata kunci “Vaksin Sinovac†sebanyak 2427 data dari tanggal 30 September sampai 6 Oktober 2021. Selanjutnya dilakukan Preprocessing, data menjadi 1484. Ketika dilakukan Pelabelan secara manual, menghasilkan 728 nilai Netral, 388 data Positif dan 368 data bernilai Negatif. Jika sudah menghasilkan nilai klasifikasi, maka akan dilakukan pembagian data dengan 90% data latih dan 10% data uji. Hasilnya data latih berjumlah 1336 dan data uji berjumlah 148 data. Hasil yang didapatkan untuk Naïve Bayes menggunakan BOW menghasilkan nilai akurasi sebesar 70,95% dan untuk Naïve Bayes menggunakan TF-IDF menghasilkan nilai akurasi sebesar 66,89%. Sedangkan untuk KNN dengan menggunakan BOW menghasilkan nilai akurasi sebesar 63,51% dan KNN menggunakan TF-IDF menghasilkan sebesar 66,89%.
T This research conducts Sentiment Analysis on the Sinovac Vaccine by taking data on Twitter social media. Because the Indonesian government obliges the public to vaccinate against Covid-19 which causes pros and cons. Previously, researchers conducted data collection on "Jenis Vaksin" to find out what vaccines were being talked about. As a result, the word “Sinovac†was the most talked about. After that, data were collected using the keyword "Vaksin Sinovac" as much as 2427 data from September 30 to October 6, 2021. Then preprocessing was carried out, and the data became 1484. When a manual labeling was performed, it produced 728 Neutral values, 388 Positive data, and 368 Negative data. If the classification value has been generated, The data will be divided into 90% training data and 10% test data. The result is 1336 training data and 148 test data. The results for Nave Bayes using BOW produce an accuracy value of 70,95% and for Naive Bayes using TF-IDF make an accuracy value of 66,89%. Meanwhile, KNN using BOW make an accuracy value of 63,51%, and KNN using TF-IDF makes 66,89%.