M., AKBAR HUSEIN SRG (2023) APLIKASI PERINGKAS TEKS (AUTOMATIC TEXT SUMMARIZATION) DENGAN METODE TF - IDF DAN IMPLEMENTASI WEB SCRAPING. S1 thesis, Universitas Malikussaleh.

[img] Text
TA M. Akbar Husein Srg (190170065) hard rev-1.pdf

Download (20kB)
[img] Text
TA M. Akbar Husein Srg (190170065) hard rev-6.pdf

Download (5kB)
[img] Text
TA M. Akbar Husein Srg (190170065) hard rev-12-14.pdf

Download (81kB)
[img] Text
TA M. Akbar Husein Srg (190170065) hard rev-55-56.pdf

Download (140kB)
[img] Text
TA M. Akbar Husein Srg (190170065) hard rev.pdf
Restricted to Registered users only

Download (2MB)

Abstract

ABSTRAK Dalam penelitian ini bertujuan membangun aplikasi Automatic Text Summarization berbasis website dengan menggunakan teknik web scraping pada berita dari news.detik.com. Metode ekstraktif dengan algoritma TF-IDF digunakan untuk merangkum teks secara efisien, dengan fokus pada pembobotan kalimat dan seleksi berdasarkan nilai tertinggi. Hasilnya diukur menggunakan metode evaluasi Recall-Oriented Understudy for gisting Evaluation (ROUGE) dengan empat varian: ROUGE-1, ROUGE-2, ROUGE-3, dan ROUGE-L. Dalam tahapan penelitian, ekstraksi teks melalui web scraping diikuti oleh text preprocessing, text processing, dan penyusunan kalimat terpilih berdasarkan urutan aslinya. Rata-rata hasil evaluasi ROUGE terhadap studi kasus berita yang diberikan dan di evaluasi dengan sepuluh referensi human gold standart menunjukkan kinerja yang baik pada informasi unigram (ROUGE-1), dengan nilai recall 40,1%, precision 50,6%, dan F�Score 42,9%. Namun, kinerja menurun pada informasi bigram (ROUGE-2) dengan nilai recall 21,8%, precision 32,1%, trigram (ROUGE-3) dengan nilai recall 16,6%, precesion 27,5%, f-score 20,2%. ROUGE-L menunjukkan keseimbangan antara recall dan precision, dengan nilai recall 30,8%, precision 40,8%, dan F-Score 33,6%, menunjukkan kemampuan sistem dalam menangkap informasi keseluruhan. Di sisi lain. Kesimpulannya, meskipun sistem efektif dalam menangkap informasi unigram, kinerjanya menurun pada bigram dan n-gram yang lebih panjang. Kata Kunci : Peringkas teks, pembobotan kata, website berita, tf-idf

Item Type: Thesis (S1)
Subjects: T Technology > T Technology (General)
Divisions: Fakultas Teknik > 55201 - Jurusan Teknik Informatika
Depositing User: Khairiati Khairiati
Date Deposited: 22 Nov 2024 07:45
Last Modified: 22 Nov 2024 07:45
URI: https://rama.unimal.ac.id/id/eprint/7739

Actions (login required)

View Item View Item

Latest Collections

Top Downloaded Items

Top Authors

This repository has been indexed by