Srg, M. Akbar Husein (2024) APLIKASI PERINGKAS TEKS (AUTOMATIC TEXT SUMMARIZATION) DENGAN METODE TF - IDF DAN IMPLEMENTASI WEB SCRAPING. S1 thesis, Universitas Malikussaleh.

[img] Text
M_Akbar_Husein_Srg_190170065_Cover.pdf

Download (20kB)
[img] Text
M_Akbar_Husein_Srg_190170065_Abstrak.pdf

Download (11kB)
[img] Text
M_Akbar_Husein_Srg_190170065_Bab_I.pdf

Download (87kB)
[img] Text
M_Akbar_Husein_Srg_190170065_Daftar_Pustaka.pdf

Download (140kB)
[img] Text
M_Akbar_Husein_Srg_190170065_Aplikasi_Peringkas_Teks_(Automatic_Text_Summarization)_Dengan_Metode_TF-IDF_Dan_Implementasi_Web_Scraping.pdf
Restricted to Registered users only

Download (2MB)

Abstract

Dalam penelitian ini bertujuan membangun aplikasi Automatic Text Summarization berbasis website dengan menggunakan teknik web scraping pada berita dari news.detik.com. Metode ekstraktif dengan algoritma TF-IDF digunakan untuk merangkum teks secara efisien, dengan fokus pada pembobotan kalimat dan seleksi berdasarkan nilai tertinggi. Hasilnya diukur menggunakan metode evaluasi Recall-Oriented Understudy for gisting Evaluation (ROUGE) dengan empat varian: ROUGE-1, ROUGE-2, ROUGE-3, dan ROUGE-L. Dalam tahapan penelitian, ekstraksi teks melalui web scraping diikuti oleh text preprocessing, text processing, dan penyusunan kalimat terpilih berdasarkan urutan aslinya. Rata-rata hasil evaluasi ROUGE terhadap studi kasus berita yang diberikan dan di evaluasi dengan sepuluh referensi human gold standart menunjukkan kinerja yang baik pada informasi unigram (ROUGE-1), dengan nilai recall 40,1%, precision 50,6%, dan FScore 42,9%. Namun, kinerja menurun pada informasi bigram (ROUGE-2) dengan nilai recall 21,8%, precision 32,1%, trigram (ROUGE-3) dengan nilai recall 16,6%, precesion 27,5%, f-score 20,2%. ROUGE-L menunjukkan keseimbangan antara recall dan precision, dengan nilai recall 30,8%, precision 40,8%, dan F-Score 33,6%, menunjukkan kemampuan sistem dalam menangkap informasi keseluruhan. Di sisi lain. Kesimpulannya, meskipun sistem efektif dalam menangkap informasi unigram, kinerjanya menurun pada bigram dan n-gram yang lebih panjang. Kata Kunci : Peringkas teks, pembobotan kata, website berita, tf-idf

Item Type: Thesis (S1)
Subjects: Q Science > Q Science (General)
Q Science > QA Mathematics > QA76 Computer software
Divisions: Fakultas Teknik > 55201 - Jurusan Teknik Informatika
Depositing User: Akbar Husein Srg
Date Deposited: 14 Mar 2024 03:12
Last Modified: 14 Mar 2024 03:12
URI: https://rama.unimal.ac.id/id/eprint/1511

Actions (login required)

View Item View Item

Latest Collections

Top Downloaded Items

Top Authors

This repository has been indexed by