Implementasi Focused Crawling dengan Topic-Specific, Multinomial Naive Bayes, dan Breadth First Search guna Pengumpulan Data Media Monitoring Geopark Ciletuh

Pranolo, Clara Velita (2021) Implementasi Focused Crawling dengan Topic-Specific, Multinomial Naive Bayes, dan Breadth First Search guna Pengumpulan Data Media Monitoring Geopark Ciletuh. Tugas Akhir (S1) - thesis, UNIVERSITAS BAKRIE.

[thumbnail of Cover]
Preview
Text (Cover)
00. Cover.pdf - Submitted Version

Download (745kB) | Preview
[thumbnail of BAB I - III] Text (BAB I - III)
01. BAB I-III.pdf - Submitted Version
Restricted to Registered users only

Download (1MB) | Request a copy
[thumbnail of BAB IV] Text (BAB IV)
02. BAB IV.pdf - Submitted Version
Restricted to Registered users only

Download (887kB) | Request a copy
[thumbnail of BAB V] Text (BAB V)
03. BAB V.pdf - Submitted Version
Restricted to Registered users only

Download (89kB) | Request a copy
[thumbnail of Daftar Pustaka]
Preview
Text (Daftar Pustaka)
04. Daftar Pustaka.pdf - Submitted Version

Download (113kB) | Preview
[thumbnail of Lampiran] Text (Lampiran)
05. Lampiran.pdf - Submitted Version
Restricted to Registered users only

Download (429kB) | Request a copy

Abstract

Sebagai bagian dari UNESCO Global Geopark (UGG), wisata Geopark Ciletuh memiliki praktisi Public Relations (PR) yang mempunyai tujuan dalam hal membangun, mengembangkan, dan mempertahankan reputasi serta citra dari kawasan wisata Geopark Ciletuh. Untuk mencapai tujuan tersebut, prak�tisi PR melakukan media monitoring dengan mencari dan memilih berita dari berbagai sumber media online, lalu mengumpulkannya kedalam kliping berita untuk diidentifikasi dan dianalisis. Dalam media monitoring, proses ini disebut data back-end. Penelitian ini mengusulkan focused crawling untuk diimplemen�tasikan pada data back-end media monitoring Geopark Ciletuh supaya proses pengumpulan data lebih cepat. Focused crawling diimplementasikan dengan menggunakan tiga metode yaitu metode crawler dengan Algoritma Breadth First Search (BFS) untuk mendapatkan URL berita yang lebih banyak, metode distiller dengan Topic-Specific Weight Table dan Page Relevance untuk fitur parameter dataset, serta metode klasifikasi dengan Multinomial Naive Bayes untuk menentukan berita yang relevan. Hasil penelitian dengan algoritma BFS dapat melakukan crawling sebanyak 470 URL untuk Detik dan 290 URL untuk Kompas. Sedangkan dalam menentukan berita yang relevan akurasi yang dida�patkan model Multinomial Naive Bayes dengan Page Relevance yaitu 83.46% untuk dataset Detik, 89% untuk dataset Kompas dan diatas 88.16% untuk kedua gabungan dataset Detik dan Kompas.

Item Type: Thesis (Tugas Akhir (S1) - )
Uncontrolled Keywords: Web Crawling, Focused Crawling, Breadth First Search, Topic-Specific Weight Table, Page Relevance, Multinomial NaIve Bayes
Subjects: Computer Science > Informatics
Communication Science > Public Relations
Thesis > Thesis (S1)
Divisions: Fakultas Teknik dan Ilmu Komputer > Program Studi Informatika
Depositing User: Clara Velita Pranolo
Date Deposited: 20 Aug 2021 04:15
Last Modified: 20 Aug 2021 04:15
URI: https://repository.bakrie.ac.id/id/eprint/4884

Actions (login required)

View Item View Item