RANCANG BANGUN SISTEM DATA CLEANING UNTUK MASTER DATA KONSUMEN DI PT XYZ DENGAN MENERAPKAN METODE SORTED NEIGHBOURHOOD DAN METODE N-GRAM

Mualifa, Rahma (2016) RANCANG BANGUN SISTEM DATA CLEANING UNTUK MASTER DATA KONSUMEN DI PT XYZ DENGAN MENERAPKAN METODE SORTED NEIGHBOURHOOD DAN METODE N-GRAM. Tugas Akhir (S1) - thesis, Universitas Bakrie.

[thumbnail of pdf]
Preview
Text (pdf)
00.Cover.pdf - Submitted Version

Download (754kB) | Preview
[thumbnail of pdf] Text (pdf)
01.Bab I - III.pdf - Submitted Version
Restricted to Registered users only

Download (692kB)
[thumbnail of pdf] Text (pdf)
02.Bab IV.pdf - Submitted Version
Restricted to Registered users only

Download (1MB)
[thumbnail of pdf] Text (pdf)
03.Bab V.pdf - Submitted Version
Restricted to Registered users only

Download (16kB)
[thumbnail of pdf] Text (pdf)
04.Bab Daftar Pustaka.pdf - Submitted Version
Restricted to Registered users only

Download (80kB)
[thumbnail of pdf] Text (pdf)
05.Lampiran.pdf - Submitted Version
Restricted to Registered users only

Download (2MB)

Abstract

Penelitian ini membahas tentang rancang bangun sistem data cleaning untuk dapat mendeteksi duplikasi data yang ada pada master data konsumen Divisi Consumer Care PT XYZ. Metode yang digunakan dalam penelitian ini untuk mendeteksi duplikasi data adalah dengan menerapkan pendekatan metode Sorted Neighbourhood (SNM) dan N-Gram. Sistem data cleaning ini bertujuan membantu user untuk dapat mempermudah menemukan duplikasi data. Selain itu, sistem ini juga dapat membantu user untuk dapat merapikan format penulisan telepon dan fax yang ada pada master data konsumen Divisi Consumer Care PT XYZ. Sistem yang akan dibangun adalah sistem web based dengan menggunakan bahasa pemrograman C#. Hasil dari sistem data cleaning yang dibangun kemudian akan diuji coba kepada user dan dinilai seberapa efektif metode SNM dan N-Gram dalam mendeteksi duplikasi data dengan menghitung nilai recall dan precision terhadap hasil proses deteksi duplikasi data.

Item Type: Thesis (Tugas Akhir (S1) - )
Uncontrolled Keywords: Data cleaning, Deteksi Duplikasi Data, Sorted Neighbourhood, N-gram
Subjects: Computer Science
Computer Science > Database management
Thesis > Thesis (S1)
Divisions: Fakultas Teknik dan Ilmu Komputer > Program Studi Informatika
Depositing User: Rahma Mualifa
Date Deposited: 15 Aug 2016 02:59
Last Modified: 15 Aug 2016 02:59
URI: http://repository.bakrie.ac.id/id/eprint/196

Actions (login required)

View Item View Item