Pengertian data mining
Data Mining adalah Serangkaian proses untuk menggali nilai tambah
berupa informasi yang selama ini tidak diketahui secara manual dari suatu
basisdata dengan melakukan penggalian pola-pola dari data dengan tujuan untuk
memanipulasi data menjadi informasi yang lebih berharga yang diperoleh dengan
cara mengekstraksi dan mengenali pola yang penting atau menarik dari data yang
terdapat dalam basisdata.
Data mining biasa juga dikenal
nama lain seperti : Knowledge discovery (mining) in databases (KDD), ekstraksi
pengetahuan (knowledge extraction) Analisa data/pola dan kecerdasan bisnis
(business intelligence) dan merupakan alat yang penting untuk memanipulasi data
untuk penyajian informasi sesuai kebutuhan user dengan tujuan untuk membantu
dalam analisis koleksi pengamatan perilaku, secara umum definisi data-mining
dapat diartikan sebagai berikut
·
Proses penemuan pola yang menarik
dari data yang tersimpan dalam jumlah besar.
·
Ekstraksi dari suatu informasi yang
berguna atau menarik (non-trivial, implisit, sebefumnya belum diketahui
potensial kegunaannya) pola atau pengetahuan dari data yang disimpan dalam
jumfah besar.
·
Ekplorasi dari analisa secara
otomatis atau semiotomatis terhadap data-data dalam jumlah besar untuk mencari
pola dan aturan yang berarti.
Konsep Data Mining
Data mining sangat perlu dilakukan terutama dalam mengelola
Data yang sangat besar untuk memudahkan aktifitas recording suatu transaksi dan
untuk proses data warehousing agar dapat memberikan informasi yang akurat bagi
penggunanya
Alasan utama mengapa data mining
sangat menarik perhatian industri informasi dalam beberapa tahun belakangan ini
adalah karena tersedianya data dalam jumlah yang besar dan semakin besarnya
kebutuhan untuk mengubah data tersebut menjadi informasi dan pengetahuan yang
berguna karena sesuai fokus bidang ilmu ini yaitu melakukan kegiatan
mengekstraksi atau menambang pengetahuan dari data yang berukuran/berjumlah
besar, informasi inilah yang nantinya sangat berguna untuk pengembangan.
berikut langkah-langkahnya :
a. Pembersihan data. Biasanya terdapat data yang kurang bagus untuk
dimasukkan dalam kelengkapan data perusahaan karena hanya akan dianggap tidak
valid bahkan untuk data yang hilang. Sehingga data yang seperti itu lebih baik
dibuang.
b. Integrasi data : Mengalokasikan data kebeberapa
media yang lain.
c. Transformasi data : Beberapa teknik data mining memerlukan format data
yang khusus sebelum bisa digunakan dan disebarluaskan. Dalam tahap ini,
dilakukan pula pemilihan data yang dibutuhkan oleh teknik data mining yang akan
dipakai. Tahap inilah yang akan menentukan kualitas dari data mining.
d. Aplikasi teknik data mining
Ini merupakan salah satu langkah
dari proses data mining. Gunakan teknik data mining yang sesuai dengan hasil
yang dibutuhkan.
e. Evaluasi pola yang ditemukan: Dalam tahap ini hasil dari teknik data mining berupa
pola pola yang khas maupun model prediksi dievaluasi untuk menilai apakah
hipotesis yang ada memang tercapai.
e. Presentasi pola
Tahap terakhir dari proses data
mining adalah bagaimana formulasi keputusan atau aksi dari hasil analisis dari
data mining. Dalam presentasi ini, visualisasi juga dapat membantu
mengkomunikasikan hasil data mining
Teknik Data Mining
Sebelum mengetahui teknik-teknik yang
dapat digunakan dalam data mining terdapat empat operasi yang dapat dihubungkan
dengan data mining sebagai berikut.
a. Predictive
modeling, ada dua teknik yang dapat dilakukan dalam predictive modeling, yaitu:
· Classification
Digunakan untuk membuat dugaan awal
tentang class yang spesifik untuk setiap record dalam database dari satu
setnilai class yang mungkin
· Value
Prediction
Digunakan untuk memperkirakan nilai
numeric yang kontinu yang trasosiasi dengan record database. Teknik ini
menggunakan teknik statistic klasik dari linier regression dan nonlinier
regression.
b. Database
segmentation
Tujuan dabase segmentation adalah
untuk mempartisi database menjadi sejumlah segmen, cluster, atau record yang
sama, dimana record tersebut diharapkan homogen.
c. Link
analysis
Tujuan link analysis adalah untuk
membuat hubungan antara record yang individual atau sekumpulan record dalam
database. Aplikasi pada link analysis meliputi product affinity analysis,
direct marketing, dan stock price movement.
d. Deviation
detection
Teknik ini sering kali merupakan
sumber dari penemuan yang benar karena teknik ini mengidentifikasi outlier yang
mengekspresikan deviasi dari ekspektasi yang telah diketahui sebelumnya.
Operasi ini dapat ditampilkan menggunakan teknik statistik dan visualisasi.
Aplikasi deviation detection
misalnya pada deteksi penipuan dalam penggunaan kartu kredit dan klaim
asuransi, quality control, dan defect tracing.
Kesimpulan : Data mining adalah proses penggalian
pola dari data. Data mining menjadi alat yang semakin penting untuk mengubah
data menjadi informasi. Hal ini umumnya digunakan dalam berbagai profil
praktek, seperti pemasaran, pengawasan, deteksi penipuan dan penemuan ilmiah.
Jurnal
tentang Penerapan konsep Data Mining :
DATA MINING UNTUK
MEMPREDIKSI PRESTASI SISWA BERDASARKAN SOSIAL EKONOMI, MOTIVASI, KEDISIPLINAN
DAN PRESTASI MASA LALU
METODE PENELITIAN
Penelitian ini menggunakan pendekatan
kuantitatif. Tempat Penelitian ini adalah SMK Negeri 4 Surakarta yang beralamat
di Jalan LU Adi Sucipto No. 40 Surakarta. Waktu penelitian dan pengambilan
data pada bulan Juni 2013 sampai Desember 2013.
Target/subjek penelitian adalah siswa
tingkat X SMK Negeri 4 Surakarta Tahun Pelajaran 2013/2014 sejumlah 416 siswa.
Prosedur penelitian menggunakan tahapan-tahapan
KDD (Knowledge Data Discovery). Tahapan-tahapannya adalah: (1) Data
Selection, yaitu tahapan ini dilakukan untuk memilih data yang sesuai
dengan variabel yang dibutuhkan dalam penelitian; (2) Pre-processing/Cleaning,
sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses
cleaning pada data yang menjadi fokus KDD. Proses cleaning mencakup
antara lain membuang duplikasi data, memeriksa data yang inkonsisten, dan
memperbaiki kesalahan pada data, seperti kesalahan cetak (tipografi); (3) Transformation,
coding adalah proses transformasi pada data yang telah dipilih,
sehingga data tersebut sesuai untuk proses data mining; (4) Analisis data; (5) Pattern
Evaluation, merupakan tahapan evaluasi untuk mengidentifikasi pola yang
benar-benar menarik yang mewakili pengetahuan berdasarkan sumber data yang ada.
Kerangka pikir yang digunakan dalam penelitian ini dapat dilihat pada gambar 1.
Penelitian
ini memperoleh data dari angket dan dokumentasi. Teknik dokumentasi digunakan
untuk mengambil data status sosial ekonomi orang tua, kedisiplinan, dan
prestasi masa lalu, sedangkan data motivasi siswa diperoleh melalui angket.
Info lebih Lanjut :
https://webcache.googleusercontent.com/search?q=cache:egQf5VWR140J:https://journal.uny.ac.id/index.php/jpv/article/viewFile/2547/2104+&cd=8&hl=id&ct=clnk&gl=id.
http://gsbipb.com/?p=821
https://abdijeinlaknat.wordpress.com/2012/11/26/pengertian-data-mining
Tidak ada komentar:
Posting Komentar