Implementasi Algoritma Sorted Neighborhood Method dan N-Gram dalam aplikasi deteksi duplikasi data (Studi Kasus: Rumah Sakit Swasta di Jakarta)

Fahmi, Amelia (2019) Implementasi Algoritma Sorted Neighborhood Method dan N-Gram dalam aplikasi deteksi duplikasi data (Studi Kasus: Rumah Sakit Swasta di Jakarta). Undergraduate (S1) thesis, UNIVERSITAS BAKRIE.

[img]
Preview
Text (pdf)
00. Cover.pdf - Submitted Version

Download (817kB) | Preview
[img] Text (pdf)
01. BAB I- III.pdf - Submitted Version
Restricted to Registered users only

Download (397kB)
[img] Text (pdf)
02 BAB IV.pdf - Submitted Version
Restricted to Registered users only

Download (652kB)
[img] Text (pdf)
03. BAB V.pdf - Submitted Version
Restricted to Registered users only

Download (88kB)
[img]
Preview
Text (pdf)
04. DAFTAR PUSTAKA.pdf - Submitted Version

Download (104kB) | Preview
[img] Text (pdf)
05. Lampiran.pdf - Submitted Version
Restricted to Registered users only

Download (446kB)

Abstract

Penelitian ini bertujuan untuk mengimplementasikan algoritma Sorted Neighborhood Method dan N-Gram dalam mendeteksi duplikasi pada data pasien Rumah Sakit Swasta di Jakarta. Dalam beberapa aplikasi untuk menjamin kualitas data dan kinerja aplikasi, data harus dibersihkan. Salah satu hal terpenting dalam pembersihan data adalah deteksi duplikasi data. Deteksi duplikasi data merupakan proses identifikasi pada record yang berbeda tetapi memiliki kemiripan yang tinggi. Oleh karena itu aplikasi yang dibangun dalam penelitian ini adalah aplikasi deteksi duplikasi data berbasis web dan dirancang menggunakan PHP. Aplikasi ini bertujuan untuk menghindari kesalahpahaman yang disebabkan kesamaan data pasien Rumah Sakit Swasta di Jakarta pada tingkat operasional, serta memberikan kemudahan bagi tenaga medis ataupun pihak terkait dalam mendapatkan informasi mengenai riwayat penyakit pasien. Dalam penelitian ini untuk mengetahui nilai efektivitas algoritma Sorted Neighborhood Method dan N-Gram terhadap aplikasi yang dibangun, dilakukan pengujian menggunakan hasil perhitungan sampel data pasien untuk menghitung precision, recall dan f-measure. Hasil pengujian metode tersebut dapat dilihat pada grafik hasil pengujian yang menunjukan bahwa nilai f-measure yang lebih optimal pada sampel data pasien terdapat pada perpaduan nilai token 4 gram 4 dan threshold 0.5 dengan nilai f-measure sebesar 0.76.

Item Type: Thesis (Undergraduate (S1))
Uncontrolled Keywords: Deteksi Duplikasi, Sorted Neighborhood Method, N-Gram
Subjects: Computer Science
Thesis > Thesis (S1)
Divisions: Fakultas Teknik dan Ilmu Komputer > Program Studi Informatika
Depositing User: Amelia Fahmi
Date Deposited: 03 May 2019 02:32
Last Modified: 03 May 2019 02:32
URI: http://repository.bakrie.ac.id/id/eprint/2317

Actions (login required)

View Item View Item