Step 1 :
Pada tahap matching activity kita memilih knowledge base yang kita buat tadi lalu klik kanan pada matching
policy untuk melanjutkan
Di mapping
stage, kita memilih file excel file sebagai data source dan setelah itu pilih Book1.csv
file. Lalu lakukan mapping antara kolom excel dan domain.bila sudah selesai terisi semua antara domain dan
source column maka klik next untuk melanjutkan.
Step 3 :
Klik next untuk
ke tahap matching, kita isi dulu rule
terlebih dahulu, lalu kita isi domain yang ingin kita matching sebagai contoh
antara birth date dan hire date. Klik start untuk
menjalankan tahap matching tersebut.lalu
klik centang prerequisite pada kolom birth date
Step 4 :
Lalu muncul hasil dari
proses matching tersebut, di tabel kita dapat mengetahui terdapat data yang memungkinkan sama atau menyerupai salah satu contohnya berupa nama “Roberto” dan
memiliki score sendiri sendiri salah satu contoh pada “Roberto” pada atas
sendiri dengan score 95% di situ berarti memiliki makna bahwa masuk pada tabel
data pertama
Step 1 :
Untuk masuk ke tahap Cleansing Data maka kita harus
memasukan nama serta knowledge base yang ingin kita eksekusi.lalu plih
cleansing pada bagian bawah sendiri lalu klik next.
Step 2 :
Di mapping
stage, kita memilih extensi file excel file sebagai data source yang
ingin kita eksekusi dan setelah itu pilih Book1.csv
file. Lalu lakukan mapping antara kolom excel dan domain disini kita menyamakan antara mapping dengan
domain.
Step 3 :
Klik next untuk
menuju ke tahap cleansing. Lalu Klik start untuk memulai cleansing. Lalu munculah hasil data cleansing.di bagian profiler maka akan keluar report data
yang memiliki kesalahan dan tidak.
Step 4 :
Setelah tahap cleansing selesai, klik next untuk manage and view
result di sini untuk melihat apakah masih
ada data yang memiliki kesalahan atau tidak.
Step 5 :
Setelah ngerasa data sudah benar dan bila ada yang belum benar maka melakukan
cek data
kembali apa yang perlu diperbaiki, bila data merasa sudah benar maka klik next untuk export file untuk melihat hasil report yang benar.untuk memilih hasil report export
ada pilihan excel dan sql setelah itu pilih tempat dimana tempat hasil eksport
tersebut di letakkan .jika ingin hasil eksport data only saja atau data only
berserta cleansing info.jika sudah selesai menentukan lalu klik export.
TUTORIAL DQS SQL SERVER DATA CLEANSING TAHAP 2 : CLEANSING DATA (PART 2)
Unknown
November 17, 2017
Step 1 :
Import data dqs, dengan cara memilih Create Knowledge Base from : Import from DQS file. Lalu memilih file mana yang akan kita import ke dalam DQS.lalu Select data file yang akan kita eksekusi.
Step 2 :
Setelah di next,
kita masuk ke domain management, Setelah kita cek data keseluruhannya apa sudah masuk semua dan memenuhi data yang
ingin kita eksekusi,setelah merasa terpenuhi maka klik finish lalu klik publish.
Step 3 :
Lalu kita ke tahap selanjutnya kita klik kiri di bagian quiz ,lalu pilih
knowledge discovery
Step 4 :
Setelah klik knowledge discovery, kita memilih data source yang ber extensi
excel file dan memilih excel file mana yang akan kita
gunakan untuk di jalankan. Lalu mapping untuk
bagian mapping kita masukan data domain yang sama dengan Source Column,setelah
data domain terisi semua maka klik next untuk melakukan eksekusi selanjutnya.
Step 5 :
Hasil dari data profiling , untuk tahap discovery
untuk menentukan hasil data yang memiliki kekurangan dan tidak valid atau dalam
artian masih dalam kesalahan untuk rule nya.untuk contoh di bawah data yang kita eksekusi tidak memiliki kesalahan.
Step 6 :
Setelah kita
next, maka kita akan masuk ke manage
domain values yaitu Untuk mengetahui apakah ada data yang invalid atau tidak.setelah tidak ada kesalahan maka klik next untuk
melanjutkan.
Step 7 :
Setelah kita cek
data tersebut, lalu klik finish dan publish.dan pada tahap knowledge base management selesai.
TUTORIAL DQS SQL SERVER TAHAP 1 : PROFILING DATA (PART 1)
Unknown
November 17, 2017