PENERAPAN SISTEM DATA CLEANING DALAM MASTER DATA DENGAN MENGGUNAKAN ALGORITMA DUPLICATE COUNT STRATEGY (STUDI KASUS: PT XYZ)

Arifah, Fildzah Adra (2021) PENERAPAN SISTEM DATA CLEANING DALAM MASTER DATA DENGAN MENGGUNAKAN ALGORITMA DUPLICATE COUNT STRATEGY (STUDI KASUS: PT XYZ). Tugas Akhir (S1) - thesis, Universitas Bakrie.

[thumbnail of Cover]
Preview
Text (Cover)
00 Cover.pdf - Submitted Version

Download (287kB) | Preview
[thumbnail of BAB I - III] Text (BAB I - III)
01 BAB I-III.pdf - Submitted Version
Restricted to Registered users only

Download (679kB) | Request a copy
[thumbnail of BAB IV] Text (BAB IV)
02 BAB IV.pdf - Submitted Version
Restricted to Registered users only

Download (1MB) | Request a copy
[thumbnail of BAB V] Text (BAB V)
03 BAB V.pdf - Submitted Version
Restricted to Registered users only

Download (36kB) | Request a copy
[thumbnail of DAFTAR PUSTAKA]
Preview
Text (DAFTAR PUSTAKA)
04 DAFTAR PUSTAKA.pdf - Submitted Version

Download (154kB) | Preview
[thumbnail of LAMPIRAN] Text (LAMPIRAN)
05 Lampiran.pdf - Submitted Version
Restricted to Registered users only

Download (156kB) | Request a copy

Abstract

Adanya permasalahan berupa duplikasi data dalam sebuah master data, peneliti melakukan penerapan sistem untuk data cleaning yang dapat mendeteksi duplikasi data pada master data konsumen Divisi Consumer Care PT XYZ. Dalam penelitian ini digunakan algoritma untuk mendeteksi duplikasi data yaitu dengan menerapkan pendekatan metode Duplicate Count Strategy (DCS++) dan N-Gram. Sistem data cleaning diperuntukan bagi Sales Admin agar mempermudah dalam menemukan duplikasi data. Selain itu, sistem ini juga dibuat untuk merapikan format penulisan telepon dan fax yang ada pada master data konsumen Divisi Consumer Care PT XYZ. Penerapan ini dibangun dengan menggunakan bahasa pemrograman C#. Hasil dari penerapan sistem data cleaning yang dibangun akan dinilai seberapa efektif metode DCS++ dan N-Gram dengan menghitung nilai recall dan precision dalam mendeteksi duplikasi data.

Item Type: Thesis (Tugas Akhir (S1) - )
Uncontrolled Keywords: Data cleaning, Deteksi Duplikasi Data, Duplicate Count Strategy, N-gram
Subjects: Computer Science > Database design
Thesis > Thesis (S1)
Divisions: Fakultas Teknik dan Ilmu Komputer > Program Studi Informatika
Depositing User: Fildzah Adra Arifah
Date Deposited: 07 Sep 2021 01:26
Last Modified: 07 Sep 2021 01:26
URI: http://repository.bakrie.ac.id/id/eprint/5386

Actions (login required)

View Item View Item