Selasa, 08 Maret 2022

Apa itu Data Mining?

Pengertian Data Mining

Data mining adalah proses untuk mendapatkan informasi yang berguna dari gudang basis data yang besar. Data mining juga dapat diartikan sebagai pengekstrakan informasi baru yang diambil dari bongkahan data bebas yang membantu dalam pengambilan keputusan. Istilah data minig kadang disebut juga knowlenge discovery (Tan P, Steinbach M, Kumar V, 2006).

Pada prosesnya data mining akan mengekstrak informasi yang berharga dengan cara menganalisis adanya pola-pola ataupun hubungan keterkaitan tertentu dari data-data yang berukuran besar. Data mining berkaitan dengan bidang ilmu-ilmu lain, seperti Database System, Data Warehousing, Statistic, Machine Learning, Information Retrieval, dan Komputasi Tingkat Tinggi. Selain itu data mining didukung oleh ilmu lain seperti Neural Network, Pengenalan Pola, Spatial Data Analysis, Image Database, Signal Processing.

Pekerjaan yang berkaitan dengan data mining dapat dibagi menjadi empat kelompok, yaitu model prediksi (prediction modelling), analisis kelompok (cluster analysis), analisis asosiasi (association analysis) dan deteksi anomaly (anomaly detection) (Prasetyo, 2012)

Data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang dapat dilakukan yaitu :
a) Model prediksi
Model prediksi berkaitan dengan pembuatan sebuah model yang dapat melakukan pemetaan dari setiap himpunan variabel ke setiap targetnya, kemudian menggunakan model tersebut untuk memberikan nilai target pada himpunan baru yang didapat. Ada dua jenis model prediksi, yaitu klasisfikasi dan regresi. Klasifikasi digunakan untuk variabel target diskret, sedangkan regresi untuk variabel target kontinu. Misalnya pekerjaan untuk melakukan deteksi jenis penyakit pasien berdasarkan sejumlah nilai parameter penyakit yang diderita masuk dalam jenis klasifikasi karena di sini target yang diharapkan adalah diskret, hanya beberapa jenis kemungkinan nilai target yang didapatkan, tidak ada niilai deret waktu (time series) yang harus didapatkan untuk mendapat target nilai akhir. Sementara, pekerjaan prediksi jumlah penjualan yang didapatkan pada tiga bulan ke depan termasuk regresi karena untuk mendapatkan nilai penjualan bulan ketiga, nilai penjualan bulan kedua harus didapatkan dan untuk mendapatkan nilai penjualan bulan kedua, nilai penjualan bulan pertama harus didapatkan. Di sini ada nilai deret waktu yang harus dihitung untuk sampai pada target akhir yang diinginkan, ada nilai kontinu yang harus dihitung untuk mendapatkan nilai target akhir yangt diinginkan.

b) Analisis kelompok
Contoh pekerjaan yang berhubungan dengan analisis kelompok (cluster analysis) adalah bagaimana cara mengetahui pola pembelian barang oleh para 16 Jurnal Satya Informatika Vol. 3 No. 1, Mei 2018 Halaman 12-24 konsumen pada waktu-waktu tertentu. Dengan mengetahui pola kelompok pembelian tersebut, perusahaan/ pengecer dapat menentukan jadwal promosi yang dapat diberikan sehingga omzet penjualan bisa ditingkatkan. Analisis kelompok melakukan pengelompokan data-data ke dalam sejumlah kelompok (cluster) berdasarkan kesamaan karakteristik masing-masing data pada kelompok-kelompok yang ada. Data-data yang masuk dalam batas kesamaan dengan kelompoknya akan bergabung dalam kelompok tersebut, dan akan terpisah dalam kelompok yang berbeda jika keluar dari batas kesamaan dengan kelompok tersebut.

c) Analisis asosiasi
Analisis asosiasi (association analysis) digunakan untuk menemukan pola yang menggambarkan kekuatan hubungan fitur dalam data. Pola yang ditemukan biasanya merepresentasikan bentuk aturan implikasi atau sebset fitur. Tujuannya adalah untuk menemukan pola yang menarik dengan cara yang efisien. Penerapan yang paling dekat dengan kehidupan sehari-hari adalah analisis data keranjang belanja. Sebagai contoh, pembeli adalah ibu rumah tangga yang akan membeli barang kebutuhan rumah tangga di sebuah supermarket. Jika ibu tersebut membeli beras, sangat besar kemungkinannya bahwa ibu itu juga akan membeli barang lain, misalnya minyak, telur, dan tidak mungkin atau jarang membeli barang lain seperti topi atau buku. Dengan mengetahui hubungan yang lebih kuat antara beras dengan telur daripada beras dengan topi, pengecer dapat menentukan barang-barang yang sebaiknya disediakan dalam jumlah yang cukup banyak.

d) Deteksi anomali
Pekerjaan deteksi anomali (anomali detection) berkaitan dengan pengamatan sebuah data dari sejumlah data yang secara signifikan mempunyai karakteristik yang berbeda dari sisa data yang lain. Data-data yang karakteristiknya menyimpang (berbeda) dari data yang lain disebut outlier. Algoritma deteksi anomali yang baik harus mempunyai laju deteksi yang tinggi dan laju eror yang rendah. Deteksi anomali dapat diterapkan pada sistem jaringan untuk mengetahui pola data yang memasuki jaringan sehingga penyusupan bisa ditemukan jika pola kerja data yang datang berbeda. Perilaku kondisi cuaca mengalami anom ali juga dapat dideteksi dengan algoritma ini (Prasetyo, 2012).


Implementasi Data Mining di Berbagai Bidang

1. Analisa Pasar dan Manajemen
Solusi yang dapat di selesaikan dengan data mining, diantaranya :
- Menembak target pasar
- Melihat pola beli pemakai dari waktu ke waktu
- Cross-marker analysis
- Profil customer
- Identifikasi kebutuhan customer
- Menilai loyalitas customer
- Informasi summary

2. Analisa Perusahaan dan Manajemen Resiko
Solusi yang dapat diselesaikan dengan data mining, diantaranya :
- Perencanaan keuangan dan Evaluasi aset
-Perencanaan sumber daya (Resource Planning)
- Persaingan (Competition)

3. Telekomunikasi
Sebuah perusahaan telekomunikasi menerapkan data mining untuk melihat dari jutaan transaksi yangmasuk, transaksi mana sajakah yang masih harus ditangani secara manual.

4. Keuangan
Financial Crimes Enforcement Network di Amerika Serikat baru-baru ini menggunakan data mining untuk menambang trilyunan dari berbagai subyek seperti properti, rekening bank dan transaksi keuangan lainnya untuk mendeteksi transaksi-transaksi keuangan yang mencurigakan (seperti money laundry).

5. Asuransi
Australian Health Insurance Commision menggunakan data mining untuk mengidentifikasi layanan kesehatan yang sebenarnya tidak perlu tetapi tetap dilakukan oleh peserta asuransi .

6. Olahraga
IBM Advanced Scout menggunakan data mining untuk menganalisis statistik permainan NBA (jumlah shots blocked, assists dan fouls) dalam rangka mencapai keunggulan bersaing (competitive advantage) untuk tim-tim NBA.

7.  Astronomi
Jet Propulsion Laboratory (JPL) di Pasadena, California dan Palomar Observatory berhasil menemukan 22 quasar dengan bantuan data mining. Hal ini merupakan salah satu kesuksesan penerapan data mining di bidang astronomi dan ilmu ruang angkasa.

8. Internet Web surf-aid
IBM Surf-Aid menggunakan algoritma data mining untuk mendata akses halaman Web, khususnya yang berkaitan dengan pemasaran guna melihat prilaku dan minat customer serta melihat keefektifan pemasaran melalui Web.


Referensi :

https://www.kompasiana.com/figorahput/5c927a740b531c34651a0062/data-mining-dan-contoh-implementasi-di-berbagai-bidang.

https://ejurnal.teknokrat.ac.id/index.php/JDMSI.

https://content.co.id/contoh-jurnal-data-mining/.

https://www.scribd.com/doc/306551096/Contoh-Implementasi-Data-Mining#:~:text=Contoh%20Implementasi%20Data%20Mining%201%20Menghitung%20Entropy%20%28S%29,besar%20untuk%20dijadikan%20root.%20...%20More%20items...%20.

https://mti.binus.ac.id/2017/10/04/14-contoh-aplikasi-data-mining-di-berbagai-bidang/.

Tidak ada komentar:

Posting Komentar