M., AKBAR HUSEIN SRG (2023) APLIKASI PERINGKAS TEKS (AUTOMATIC TEXT SUMMARIZATION) DENGAN METODE TF - IDF DAN IMPLEMENTASI WEB SCRAPING. S1 thesis, Universitas Malikussaleh.
Text
TA M. Akbar Husein Srg (190170065) hard rev-1.pdf Download (20kB) |
|
Text
TA M. Akbar Husein Srg (190170065) hard rev-6.pdf Download (5kB) |
|
Text
TA M. Akbar Husein Srg (190170065) hard rev-12-14.pdf Download (81kB) |
|
Text
TA M. Akbar Husein Srg (190170065) hard rev-55-56.pdf Download (140kB) |
|
Text
TA M. Akbar Husein Srg (190170065) hard rev.pdf Restricted to Registered users only Download (2MB) |
Abstract
ABSTRAK Dalam penelitian ini bertujuan membangun aplikasi Automatic Text Summarization berbasis website dengan menggunakan teknik web scraping pada berita dari news.detik.com. Metode ekstraktif dengan algoritma TF-IDF digunakan untuk merangkum teks secara efisien, dengan fokus pada pembobotan kalimat dan seleksi berdasarkan nilai tertinggi. Hasilnya diukur menggunakan metode evaluasi Recall-Oriented Understudy for gisting Evaluation (ROUGE) dengan empat varian: ROUGE-1, ROUGE-2, ROUGE-3, dan ROUGE-L. Dalam tahapan penelitian, ekstraksi teks melalui web scraping diikuti oleh text preprocessing, text processing, dan penyusunan kalimat terpilih berdasarkan urutan aslinya. Rata-rata hasil evaluasi ROUGE terhadap studi kasus berita yang diberikan dan di evaluasi dengan sepuluh referensi human gold standart menunjukkan kinerja yang baik pada informasi unigram (ROUGE-1), dengan nilai recall 40,1%, precision 50,6%, dan F�Score 42,9%. Namun, kinerja menurun pada informasi bigram (ROUGE-2) dengan nilai recall 21,8%, precision 32,1%, trigram (ROUGE-3) dengan nilai recall 16,6%, precesion 27,5%, f-score 20,2%. ROUGE-L menunjukkan keseimbangan antara recall dan precision, dengan nilai recall 30,8%, precision 40,8%, dan F-Score 33,6%, menunjukkan kemampuan sistem dalam menangkap informasi keseluruhan. Di sisi lain. Kesimpulannya, meskipun sistem efektif dalam menangkap informasi unigram, kinerjanya menurun pada bigram dan n-gram yang lebih panjang. Kata Kunci : Peringkas teks, pembobotan kata, website berita, tf-idf
Item Type: | Thesis (S1) |
---|---|
Subjects: | T Technology > T Technology (General) |
Divisions: | Fakultas Teknik > 55201 - Jurusan Teknik Informatika |
Depositing User: | Khairiati Khairiati |
Date Deposited: | 22 Nov 2024 07:45 |
Last Modified: | 22 Nov 2024 07:45 |
URI: | https://rama.unimal.ac.id/id/eprint/7739 |
Actions (login required)
View Item |