Bahari, Rafi Ramadhan (2021) Implementasi Algoritma Random Forest dan Multinomial Naive Bayes dengan Menggunakan Seleksi Fitur Information Gain untuk Klasifikasi Berita Media Monitoring Kawasan Geopark Ciletuh. Tugas Akhir (S1) - thesis, UNIVERSITAS BAKRIE.
Preview |
Text (Cover)
00.Cover.pdf - Submitted Version Download (576kB) | Preview |
Text (BAB I-III)
01.BAB I-III.pdf - Submitted Version Restricted to Registered users only Download (988kB) | Request a copy |
|
Text (BAB IV)
02.BAB IV.pdf - Submitted Version Restricted to Registered users only Download (1MB) | Request a copy |
|
Text (BAB V)
03.BAB V.pdf - Submitted Version Restricted to Registered users only Download (150kB) | Request a copy |
|
Preview |
Text (DAFTAR PUSTAKA)
04.DAFTAR PUSTAKA.pdf - Submitted Version Download (227kB) | Preview |
Text (Lampiran)
05.Lampiran.pdf - Submitted Version Restricted to Registered users only Download (1MB) | Request a copy |
Abstract
Pada era teknologi informasi dan komunikasi seperti saat ini, proses penyebaran informasi menjadi lebih masif dan cepat. Hal ini menyebabkan proses media monitoring yang dilakukan praktisi Public Relations (PR) untuk mengembangkan dan mempertahankan reputasi kawasan Geopark Ciletuh menjadi kurang efektif dan efisien apabila dalam melakukan identifikasi dan analisis berita masih dilakukan secara manual. Penelitian ini mengusulkan sistem klasifikasi berita dengan menggunakan algoritma machine learning untuk membuat proses analisis berita yang dilakukan lebih efektif dan efisien dengan menggunakan dua algoritma Machine Learning yaitu Random Forest dan Multinomial Naive Bayes serta Information Gain sebagai metode pemilihan fitur dengan nilai threshold 0.05 dan 0.01 untuk melakukan klasifikasi berita hard news atau soft news. Dalam sistem media monitoring, proses ini masuk kedalam proses Analysis Backend. Dataset dibentuk berdasarkan dua model yang berbeda yaitu single dimensional dan multidimensional. Hasil penelitian untuk model dataset single dimensional dengan algoritma Random Forest memperoleh rata-rata tertinggi untuk nilai akurasi sebesar 81.42% menggunakan pemilihan fitur Information Gain dengan threshold 0.01, sedangkan algoritma Multinomial Naive Bayes memperoleh rata-rata tertinggi untuk nilai akurasi sebesar 74.18% menggunakan Information Gain dengan threshold 0.01 dan tanpa pemilihan fitur. Untuk model dataset multidimensional algoritma Random Forest memperoleh rata-rata tertinggi untuk nilai akurasi sebesar 93.8%, sedangkan algoritma Multinomial Naive Bayes sebesar 72.72%. Hasil penelitian menunjukkan bahwa penggunaan Information Gain untuk pemilihan fitur menunjukkan performa yang tidak optimal khususnya pada saat diterapkan di dalam algoritma Multinomial Naive Bayes. Hal ini dikarenakan algoritma tersebut memperlakukan seluruh fitur sebagai fitur independen. Selain itu, penggunaan metode laplacian smoothing tidak optimal di dalam melakukan seleksi fitur.
Item Type: | Thesis (Tugas Akhir (S1) - ) |
---|---|
Uncontrolled Keywords: | Machine Learning, Random Forest, Soft News, Hard News, Multinomial Naive Bayes, Information Gain, Single Dimensional, Multidimensional |
Subjects: | Computer Science Computer Science > Information analysis Thesis > Thesis (S1) |
Divisions: | Fakultas Teknik dan Ilmu Komputer > Program Studi Informatika |
Depositing User: | Rafi Ramadhan Bahari |
Date Deposited: | 07 Sep 2021 07:41 |
Last Modified: | 07 Sep 2021 07:41 |
URI: | https://repository.bakrie.ac.id/id/eprint/5420 |
Actions (login required)
View Item |