Data Mining adalah serangkaian proses untuk menggali nilai tambah dari
suatu kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara
manual. Patut diingat bahwa kata mining sendiri berarti usaha untuk mendapatkan
sedikit barang berharga dari sejumlah besar material dasar. Karena itu Data
Mining sebenarnya memiliki akar yang panjang dari bidang ilmu seperti
kecerdasan buatan (artificial intelligent), machine learning, statistik dan
database. Data mining adalah proses menerapkan metode ini untuk data dengan
maksud untuk mengungkap pola-pola tersembunyi. Dengan arti lain Data mining
adalah proses untuk penggalian pola-pola dari data. Data mining menjadi alat
yang semakin penting untuk mengubah data tersebut menjadi informasi. Hal ini
sering digunakan dalam berbagai praktek profil, seperti pemasaran, pengawasan,
penipuan deteksi dan penemuan ilmiah. Telah digunakan selama bertahun-tahun
oleh bisnis, ilmuwan dan pemerintah untuk menyaring volume data seperti catatan
perjalanan penumpang penerbangan, data sensus dan supermarket scanner data
untuk menghasilkan laporan riset pasar.
Alasan utama untuk menggunakan data mining adalah untuk membantu dalam
analisis koleksi pengamatan perilaku. Data tersebut rentan terhadap
collinearity karena diketahui keterkaitan. Fakta yang tak terelakkan data
mining adalah bahwa subset/set data yang dianalisis mungkin tidak mewakili
seluruh domain, dan karenanya tidak boleh berisi contoh-contoh hubungan kritis
tertentu dan perilaku yang ada di bagian lain dari domain . Untuk mengatasi
masalah semacam ini, analisis dapat ditambah menggunakan berbasis percobaan dan
pendekatan lain, seperti Choice Modelling untuk data yang dihasilkan manusia.
Dalam situasi ini, yang melekat dapat berupa korelasi dikontrol untuk, atau
dihapus sama sekali, selama konstruksi desain eksperimental.
Beberapa teknik yang sering disebut-sebut dalam literatur Data Mining
dalam penerapannya antara lain: clustering, classification, association rule
mining, neural network, genetic algorithm dan lain-lain. Yang membedakan
persepsi terhadap Data Mining adalah perkembangan teknik-teknik Data Mining
untuk aplikasi pada database skala besar. Sebelum populernya Data Mining,
teknik-teknik tersebut hanya dapat dipakai untuk data skala kecil saja.
Refensi :
https://id.wikipedia.org/wiki/Penggalian_data
http://hasanxch.blogspot.co.id/2015/12/pengertian-data-mining.html
http://garethdata.blogspot.co.id/2010/03/pengertian-data-mining.html
Tugas Softskill : Arbi Pramana
Tidak ada komentar:
Posting Komentar