Implementasi pre-trained model dalam peringkasan teks berita Bahasa Indonesia
P erkembangan teknologi informasi mengakibatkan kemajuan informasi berita yang pesat, membuat banyak orang menjadi sulit dalam mendapatkan intisari dari berita. Peringkasan teks otomatis dapat menjadi solusi dalam masalah ini. Peringkasan teks merupakan cara meringkas teks yang dilakukan secara otomatis dengan menggunakan kecerdasan buatan oleh komputer. Dalam penelitian ini, digunakan metode abstraktif yang dapat meringkas berita berdasarkan kata-kata inti yang terdapat pada dokumen asli. Model peringkasan dibangun dengan menggunakan pre-trained model IndoBART. Proses pelatihan model dan hyperparameter tuning dilakukan dengan menggunakan data IndoSUM. Dengan menggunakan metrik evaluasi ROUGE, model terbaik didapatkan dengan nilai Rouge1 40.469700, Rouge2 36.430000, RougeL 39.536500 dan RougeLsum 39.542500. Model terbaik diimplementasikan ke dalam bentuk aplikasi web dengan masukkan berupa tautan agar mempermudah dalam penggunaanya.
T he development of information technology results in the rapid advancement of news information, making it difficult for many people to get the gist of the news. Automatic text summarization can be a solution to this problem. Text summarization is a way of summarizing text that is done automatically using artificial intelligence by computers. In this research, an abstractive method is used that can summarize news based on the core words contained in the original document. The summarization model is built using the pre-trained IndoBART model. The model training process and hyperparameter tuning were performed using IndoSUM data. Using the ROUGE evaluation metric, the best model was obtained with Rouge1 40.469700, Rouge2 36.430000, RougeL 39.536500 and RougeLsum 39.542500. The best model is implemented into a web application with input in the form of a link to make it easier to use.