Analisis sentimen mengenai undang - undang tpks pada media sosial twitter menggunakan metode support vector machine dan k-nearest neighbor
T Twitter adalah media sosial yang banyak digunakan oleh masyarakat Indonesia maupun Dunia. Twitter juga dimanfaatkan untuk berbagi kabar dan opini pribadi, memasarkan produk, sampai mengkritik suatu kebijakan atau peraturan. Opini yang diposting sebagai tweet di Twitter juga dapat digunakan sebagai tolak ukur apakah kebijakan yang dikeluarkan banyak yang mendukungnya atau sebaliknya. Untuk memperoleh tolak ukur tersebut maka digunakanlah analisis sentimen untuk memisahkan opini positif dengan opini negatif. Dari pengambilan data untuk diproses maka digunakanlah scraping dari website Twitter untuk mendapatkannya. Setelah itu dilakukan proses awal sebelum data diolah yaitu Preprocessing untuk menghilangkan bagian yang tidak berguna dalam pengolahan data. Dan setelah itu dilakukannya pelabelan otomatis menggunakan Vader dan hasilnya dibandingkan dengan pelabelan manual untuk mengecek keakuratan. Lalu dilakukan teknik Support Vector Machine dan K-Nearest Neighbour dan divalidasi oleh K-Fold Cross Validation serta di test menggunakan data manual untuk mengklasifikasikan opini postif dan negatif. Lalu dilakukan visualisasi dan menghasilkan 15.632 data yang terbagi menjadi data positive sebesar 66 % (10.385 data), negative sebesar 21 % (3.274 data) dan netral sebesar 13 % (1.973 data). Dari hasil ini dapat disimpulkan tersebut menunjukkan kepuasan atau dukungan masyarakat terhadap kebijakan yang dikeluarkan tersebut.
T Twitter is a social media that is widely used by the people of Indonesia and the world. Twitter is also used to share news and personal opinions, market products, to criticize a policy or regulation. Opinions posted as tweets on Twitter can also be used as a benchmark for whether the policies issued are widely supported or otherwise. To obtain these benchmarks, sentiment analysis is used to separate positive opinions from negative opinions. From data retrieval for processing, scraping from the Twitter website is used to get it. After that, the initial process is carried out before the data is processed, namely Preprocessing to eliminate parts that are not useful in data processing. And after that, automatic labeling is done using Vader and the results are compared with manual labeling to check accuracy. Then the Support Vector Machine and K-Nearest Neighbor techniques were carried out and validated by K-Fold Cross Validation and tested using manual data to classify positive and negative opinions. Then visualization was carried out and produced 15.632 data which was divided into positive data of 66% (10.385 data), negative of 21% (3.274 data) and neutral of 13% (1.973 data). From these results, it can be concluded that it shows satisfaction or community support for the issued policy.