Data Mining dan Warehouse

on

2.1 Data Mining
2.1.1 Pengertian Data Mining
Data mining adalah proses yang menggunakan berbagai perangkat analisis data untuk menemukan pola dan hubungan dalam data yang mungkin dapat digunakan untuk membuat prediksi yang valid.
Secara definisi data mining adalah ekstraksi informasi potensial yang sebelumnya tak diketahui atau implisit atau suatu kelas dari aplikasi database yang mencari pola tersembunyi dalam suatu kelompok data. Atau data mining bisa juga didefinisikan sebagai suatu proses yang menggunakan berbagai perangkat analisis data untuk menemukan pola dan relasi data agar dapat digunakan untuk membuat prediksi dengan tepat.
Pada dasarnya ada empat langkah utama dalam melakukan data mining:
Mendeskripsikan data, yakni menyimpulkan atribut statistik (seperti rata-rata dan standard deviasi), mereview secara visual menggunakan grafik dan diagram, serta mencari hubungan-hubungan potensial antar variabel (seperti misalnya, nilai-nilai yang seringkali keluar bersamaan). 
Membangun model perkiraan (predictive model) berdasarkan pada pola-pola yang ditemukan pada langkah sebelumnya.
Menguji model di luar sampel asli. Sebuah model yang baik tidak harus sama persis dengan kenyataan sebenarnya (seperti peta bukanlah representasi sempurna dari jalan yang sebenarnya), akan tetapi bisa menjadi panduan yang berguna untuk mengerti bisnis kita.
Memverifikasi/menguji model. Misalnya, dari suatu database pelanggan yang telah merespon tawaran yang pernah diiklankan kepada mereka, kita membangun sebuah model perkiraan yang memiliki prospek akan mendapat respon yang sama dari pelanggan dengan tipikal tersebut tersebut. Tapi bisakah kita benar-benar bergantung pada perkiraan kita tersebut? Kita perlu membuktikan model perkiraan kita tersebut ke sample pelanggan yang lain dan melihat hasil yang kita dapatkan.

Untuk melakukan hal tersebut diatas maka setidaknya dibutuhkan suatu    program yang dapat menampilkan (kalau tidak mendeteksi) pola dan keteraturan dalam data sehingga pola-pola yang kuat atau sangat jelas terlihat dapat digunakan untuk melakukan prediksi.

DATA WAREHOUSE
Definisi  Data Warehouse
Data warehouse merupakan tempat penyimpanan untuk ringkasan dari data historis yang diambil dari basis data-basis data yang tersebar di suatu organisasi. Data warehouse mengumpulkan semua data perusahaan dalam satu tempat agar dapat diperoleh pandangan yang lebih baik dari suatu proses bisnis/kerja dan meningkatkan kinerja organisasi. Data warehouse mendukung proses pembuatan keputusan manajemen.

Tujuan Data Warehouse
Tujuan utama dari pembuatan data warehouse adalah untuk menyatukan data yang beragam ke dalam sebuah tempat penyimpanan dimana pengguna dapat dengan mudah menjalankan query (pencarian data), menghasilkan laporan, dan melakukan analisis. Salah satu keuntungan yang diperoleh dari keberadaan data warehouse adalah dapat meningkatkan efektifitas pembuatan keputusan.

Karakteristik Data Warehouse
a. Subject Oriented atau berorientasi pada subyek. Sebuah data warehouse dikatakan berorientasi pada subyek karena data disusun sedemikian rupa sehingga semua elemen data yang terkait dengan event/objek yang sama dihubungkan
b. Time-variant, artinya bahwa perubahan data ditelusuri dan dicatat sehingga laporan dapat dibuat dengan menunjukkan waktu perubahannya.
c. Non Volatile berarti bahwa data yang telah disimpan tidak dapat berubah. Sekali committed, data tidak pernah ditimpa/dihapus. Data akan bersifat static, hanya dapat dibaca dan disimpan untuk kebutuhan pelaporan
d. Integrated, artinya data warehouse akan mencakup semua data operasional organisasi yang disimpan secara konsisten

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout / Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout / Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout / Ubah )

Foto Google+

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s