Pengertian Data Mining
Data mining adalah proses untuk mendapatkan informasi yang berguna dari
gudang basis data yang besar. Data mining juga dapat diartikan sebagai
pengekstrakan informasi baru yang diambil dari bongkahan data bebas yang
membantu dalam pengambilan keputusan. Istilah data minig kadang disebut juga
knowlenge discovery (Tan P, Steinbach M, Kumar V, 2006).
Pada prosesnya data mining akan mengekstrak informasi yang berharga dengan
cara menganalisis adanya pola-pola ataupun hubungan keterkaitan tertentu dari
data-data yang berukuran besar. Data mining berkaitan dengan bidang ilmu-ilmu
lain, seperti Database System, Data Warehousing, Statistic, Machine Learning,
Information Retrieval, dan Komputasi Tingkat Tinggi. Selain itu data mining
didukung oleh ilmu lain seperti Neural Network, Pengenalan Pola, Spatial Data
Analysis, Image Database, Signal Processing.
Pekerjaan yang berkaitan dengan data mining dapat dibagi menjadi empat
kelompok, yaitu model prediksi (prediction modelling), analisis kelompok (cluster
analysis), analisis asosiasi (association analysis) dan deteksi anomaly (anomaly
detection) (Prasetyo, 2012)
Data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang dapat
dilakukan yaitu :
a) Model prediksi
Model prediksi berkaitan dengan pembuatan sebuah model yang dapat
melakukan pemetaan dari setiap himpunan variabel ke setiap targetnya, kemudian
menggunakan model tersebut untuk memberikan nilai target pada himpunan baru
yang didapat. Ada dua jenis model prediksi, yaitu klasisfikasi dan regresi.
Klasifikasi digunakan untuk variabel target diskret, sedangkan regresi untuk
variabel target kontinu. Misalnya pekerjaan untuk melakukan deteksi jenis penyakit
pasien berdasarkan sejumlah nilai parameter penyakit yang diderita masuk dalam
jenis klasifikasi karena di sini target yang diharapkan adalah diskret, hanya
beberapa jenis kemungkinan nilai target yang didapatkan, tidak ada niilai deret
waktu (time series) yang harus didapatkan untuk mendapat target nilai akhir.
Sementara, pekerjaan prediksi jumlah penjualan yang didapatkan pada tiga bulan
ke depan termasuk regresi karena untuk mendapatkan nilai penjualan bulan ketiga,
nilai penjualan bulan kedua harus didapatkan dan untuk mendapatkan nilai
penjualan bulan kedua, nilai penjualan bulan pertama harus didapatkan. Di sini ada
nilai deret waktu yang harus dihitung untuk sampai pada target akhir yang
diinginkan, ada nilai kontinu yang harus dihitung untuk mendapatkan nilai target
akhir yangt diinginkan.
b) Analisis kelompok
Contoh pekerjaan yang berhubungan dengan analisis kelompok (cluster
analysis) adalah bagaimana cara mengetahui pola pembelian barang oleh para
16 Jurnal Satya Informatika Vol. 3 No. 1, Mei 2018 Halaman 12-24
konsumen pada waktu-waktu tertentu. Dengan mengetahui pola kelompok
pembelian tersebut, perusahaan/ pengecer dapat menentukan jadwal promosi yang
dapat diberikan sehingga omzet penjualan bisa ditingkatkan. Analisis kelompok
melakukan pengelompokan data-data ke dalam sejumlah kelompok (cluster)
berdasarkan kesamaan karakteristik masing-masing data pada kelompok-kelompok
yang ada. Data-data yang masuk dalam batas kesamaan dengan kelompoknya akan
bergabung dalam kelompok tersebut, dan akan terpisah dalam kelompok yang
berbeda jika keluar dari batas kesamaan dengan kelompok tersebut.
c) Analisis asosiasi
Analisis asosiasi (association analysis) digunakan untuk menemukan pola yang
menggambarkan kekuatan hubungan fitur dalam data. Pola yang ditemukan
biasanya merepresentasikan bentuk aturan implikasi atau sebset fitur. Tujuannya
adalah untuk menemukan pola yang menarik dengan cara yang efisien. Penerapan
yang paling dekat dengan kehidupan sehari-hari adalah analisis data keranjang
belanja. Sebagai contoh, pembeli adalah ibu rumah tangga yang akan membeli
barang kebutuhan rumah tangga di sebuah supermarket. Jika ibu tersebut membeli
beras, sangat besar kemungkinannya bahwa ibu itu juga akan membeli barang lain,
misalnya minyak, telur, dan tidak mungkin atau jarang membeli barang lain seperti
topi atau buku. Dengan mengetahui hubungan yang lebih kuat antara beras dengan
telur daripada beras dengan topi, pengecer dapat menentukan barang-barang yang
sebaiknya disediakan dalam jumlah yang cukup banyak.
d) Deteksi anomali
Pekerjaan deteksi anomali (anomali detection) berkaitan dengan pengamatan
sebuah data dari sejumlah data yang secara signifikan mempunyai karakteristik
yang berbeda dari sisa data yang lain. Data-data yang karakteristiknya menyimpang
(berbeda) dari data yang lain disebut outlier. Algoritma deteksi anomali yang baik
harus mempunyai laju deteksi yang tinggi dan laju eror yang rendah. Deteksi
anomali dapat diterapkan pada sistem jaringan untuk mengetahui pola data yang
memasuki jaringan sehingga penyusupan bisa ditemukan jika pola kerja data yang
datang berbeda. Perilaku kondisi cuaca mengalami anom ali juga dapat dideteksi
dengan algoritma ini (Prasetyo, 2012).
Implementasi Data Mining di Berbagai Bidang
1. Analisa Pasar dan Manajemen
Solusi yang dapat di selesaikan dengan data mining, diantaranya :
- Menembak target pasar
- Melihat pola beli pemakai dari waktu ke waktu
- Cross-marker analysis
- Profil customer
- Identifikasi kebutuhan customer
- Menilai loyalitas customer
- Informasi summary
2. Analisa Perusahaan dan Manajemen Resiko
Solusi yang dapat diselesaikan dengan data mining, diantaranya :
- Perencanaan keuangan dan Evaluasi aset
-Perencanaan sumber daya (Resource Planning)
- Persaingan (Competition)
3. Telekomunikasi
Sebuah perusahaan telekomunikasi menerapkan data mining untuk melihat dari jutaan transaksi yangmasuk, transaksi mana sajakah yang masih harus ditangani secara manual.
4. Keuangan
Financial Crimes Enforcement Network di Amerika Serikat baru-baru ini menggunakan data mining untuk menambang trilyunan dari berbagai subyek seperti properti, rekening bank dan transaksi keuangan lainnya untuk mendeteksi transaksi-transaksi keuangan yang mencurigakan (seperti money laundry).
5. Asuransi
Australian Health Insurance Commision menggunakan data mining untuk mengidentifikasi layanan kesehatan yang sebenarnya tidak perlu tetapi tetap dilakukan oleh peserta asuransi .
6. Olahraga
IBM Advanced Scout menggunakan data mining untuk menganalisis statistik permainan NBA (jumlah shots blocked, assists dan fouls) dalam rangka mencapai keunggulan bersaing (competitive advantage) untuk tim-tim NBA.
7. Astronomi
Jet Propulsion Laboratory (JPL) di Pasadena, California dan Palomar Observatory berhasil menemukan 22 quasar dengan bantuan data mining. Hal ini merupakan salah satu kesuksesan penerapan data mining di bidang astronomi dan ilmu ruang angkasa.
8. Internet Web surf-aid
IBM Surf-Aid menggunakan algoritma data mining untuk mendata akses halaman Web, khususnya yang berkaitan dengan pemasaran guna melihat prilaku dan minat customer serta melihat keefektifan pemasaran melalui Web.
Referensi :
https://www.kompasiana.com/figorahput/5c927a740b531c34651a0062/data-mining-dan-contoh-implementasi-di-berbagai-bidang.
https://ejurnal.teknokrat.ac.id/index.php/JDMSI.
https://content.co.id/contoh-jurnal-data-mining/.
https://www.scribd.com/doc/306551096/Contoh-Implementasi-Data-Mining#:~:text=Contoh%20Implementasi%20Data%20Mining%201%20Menghitung%20Entropy%20%28S%29,besar%20untuk%20dijadikan%20root.%20...%20More%20items...%20.
https://mti.binus.ac.id/2017/10/04/14-contoh-aplikasi-data-mining-di-berbagai-bidang/.
Tidak ada komentar:
Posting Komentar