Implementasi Algoritma Random Forest dan Multinomial Naive Bayes dengan Menggunakan Seleksi Fitur Information Gain untuk Klasifikasi Berita Media Monitoring Kawasan Geopark Ciletuh

Bahari, Rafi Ramadhan (2021) Implementasi Algoritma Random Forest dan Multinomial Naive Bayes dengan Menggunakan Seleksi Fitur Information Gain untuk Klasifikasi Berita Media Monitoring Kawasan Geopark Ciletuh. Tugas Akhir (S1) - thesis, UNIVERSITAS BAKRIE.

[img]
Preview
Text (Cover)
00.Cover.pdf - Submitted Version

Download (576kB) | Preview
[img] Text (BAB I-III)
01.BAB I-III.pdf - Submitted Version
Restricted to Registered users only

Download (988kB) | Request a copy
[img] Text (BAB IV)
02.BAB IV.pdf - Submitted Version
Restricted to Registered users only

Download (1MB) | Request a copy
[img] Text (BAB V)
03.BAB V.pdf - Submitted Version
Restricted to Registered users only

Download (150kB) | Request a copy
[img]
Preview
Text (DAFTAR PUSTAKA)
04.DAFTAR PUSTAKA.pdf - Submitted Version

Download (227kB) | Preview
[img] Text (Lampiran)
05.Lampiran.pdf - Submitted Version
Restricted to Registered users only

Download (1MB) | Request a copy

Abstract

Pada era teknologi informasi dan komunikasi seperti saat ini, proses penyebaran informasi menjadi lebih masif dan cepat. Hal ini menyebabkan proses media monitoring yang dilakukan praktisi Public Relations (PR) untuk mengembangkan dan mempertahankan reputasi kawasan Geopark Ciletuh menjadi kurang efektif dan efisien apabila dalam melakukan identifikasi dan analisis berita masih dilakukan secara manual. Penelitian ini mengusulkan sistem klasifikasi berita dengan menggunakan algoritma machine learning untuk membuat proses analisis berita yang dilakukan lebih efektif dan efisien dengan menggunakan dua algoritma Machine Learning yaitu Random Forest dan Multinomial Naive Bayes serta Information Gain sebagai metode pemilihan fitur dengan nilai threshold 0.05 dan 0.01 untuk melakukan klasifikasi berita hard news atau soft news. Dalam sistem media monitoring, proses ini masuk kedalam proses Analysis Backend. Dataset dibentuk berdasarkan dua model yang berbeda yaitu single dimensional dan multidimensional. Hasil penelitian untuk model dataset single dimensional dengan algoritma Random Forest memperoleh rata-rata tertinggi untuk nilai akurasi sebesar 81.42% menggunakan pemilihan fitur Information Gain dengan threshold 0.01, sedangkan algoritma Multinomial Naive Bayes memperoleh rata-rata tertinggi untuk nilai akurasi sebesar 74.18% menggunakan Information Gain dengan threshold 0.01 dan tanpa pemilihan fitur. Untuk model dataset multidimensional algoritma Random Forest memperoleh rata-rata tertinggi untuk nilai akurasi sebesar 93.8%, sedangkan algoritma Multinomial Naive Bayes sebesar 72.72%. Hasil penelitian menunjukkan bahwa penggunaan Information Gain untuk pemilihan fitur menunjukkan performa yang tidak optimal khususnya pada saat diterapkan di dalam algoritma Multinomial Naive Bayes. Hal ini dikarenakan algoritma tersebut memperlakukan seluruh fitur sebagai fitur independen. Selain itu, penggunaan metode laplacian smoothing tidak optimal di dalam melakukan seleksi fitur.

Item Type: Thesis (Tugas Akhir (S1) - )
Uncontrolled Keywords: Machine Learning, Random Forest, Soft News, Hard News, Multinomial Naive Bayes, Information Gain, Single Dimensional, Multidimensional
Subjects: Computer Science
Computer Science > Information analysis
Thesis > Thesis (S1)
Divisions: Fakultas Teknik dan Ilmu Komputer > Program Studi Informatika
Depositing User: Rafi Ramadhan Bahari
Date Deposited: 07 Sep 2021 07:41
Last Modified: 07 Sep 2021 07:41
URI: http://repository.bakrie.ac.id/id/eprint/5420

Actions (login required)

View Item View Item