Srg, M. Akbar Husein (2024) APLIKASI PERINGKAS TEKS (AUTOMATIC TEXT SUMMARIZATION) DENGAN METODE TF - IDF DAN IMPLEMENTASI WEB SCRAPING. S1 thesis, Universitas Malikussaleh.
Text
M_Akbar_Husein_Srg_190170065_Cover.pdf Download (20kB) |
|
Text
M_Akbar_Husein_Srg_190170065_Abstrak.pdf Download (11kB) |
|
Text
M_Akbar_Husein_Srg_190170065_Bab_I.pdf Download (87kB) |
|
Text
M_Akbar_Husein_Srg_190170065_Daftar_Pustaka.pdf Download (140kB) |
|
Text
M_Akbar_Husein_Srg_190170065_Aplikasi_Peringkas_Teks_(Automatic_Text_Summarization)_Dengan_Metode_TF-IDF_Dan_Implementasi_Web_Scraping.pdf Restricted to Registered users only Download (2MB) |
Abstract
Dalam penelitian ini bertujuan membangun aplikasi Automatic Text Summarization berbasis website dengan menggunakan teknik web scraping pada berita dari news.detik.com. Metode ekstraktif dengan algoritma TF-IDF digunakan untuk merangkum teks secara efisien, dengan fokus pada pembobotan kalimat dan seleksi berdasarkan nilai tertinggi. Hasilnya diukur menggunakan metode evaluasi Recall-Oriented Understudy for gisting Evaluation (ROUGE) dengan empat varian: ROUGE-1, ROUGE-2, ROUGE-3, dan ROUGE-L. Dalam tahapan penelitian, ekstraksi teks melalui web scraping diikuti oleh text preprocessing, text processing, dan penyusunan kalimat terpilih berdasarkan urutan aslinya. Rata-rata hasil evaluasi ROUGE terhadap studi kasus berita yang diberikan dan di evaluasi dengan sepuluh referensi human gold standart menunjukkan kinerja yang baik pada informasi unigram (ROUGE-1), dengan nilai recall 40,1%, precision 50,6%, dan FScore 42,9%. Namun, kinerja menurun pada informasi bigram (ROUGE-2) dengan nilai recall 21,8%, precision 32,1%, trigram (ROUGE-3) dengan nilai recall 16,6%, precesion 27,5%, f-score 20,2%. ROUGE-L menunjukkan keseimbangan antara recall dan precision, dengan nilai recall 30,8%, precision 40,8%, dan F-Score 33,6%, menunjukkan kemampuan sistem dalam menangkap informasi keseluruhan. Di sisi lain. Kesimpulannya, meskipun sistem efektif dalam menangkap informasi unigram, kinerjanya menurun pada bigram dan n-gram yang lebih panjang. Kata Kunci : Peringkas teks, pembobotan kata, website berita, tf-idf
Item Type: | Thesis (S1) |
---|---|
Subjects: | Q Science > Q Science (General) Q Science > QA Mathematics > QA76 Computer software |
Divisions: | Fakultas Teknik > 55201 - Jurusan Teknik Informatika |
Depositing User: | Akbar Husein Srg |
Date Deposited: | 14 Mar 2024 03:12 |
Last Modified: | 14 Mar 2024 03:12 |
URI: | https://rama.unimal.ac.id/id/eprint/1511 |
Actions (login required)
View Item |