Blog Sivitas

APA ITU DATA MINING

Dilihat dari pengertiannya mining berarti tambang/penggalian. Jadi secara makna data mining merupakan penggalian lebih untuk mendapatkan informasi yang berguna dari data yang sudah ada.

Untuk apa tentunya sekumpulan informasi yang kita terima dikumpulkan, dianalisa dan disimpulkan untuk memprediksi suatu permasalahan yang mungkin akan terjadi dimasa datang dan pengambilan keputusan.

Zaman dulu, mencari sebuah data dan informasi tidaklah mudah, berbeda dengan zaman sekarang sangat banyak dan begitu cepat informasi yang beredar. Tinggal search di google semua pilihan informasi tersedia, bahkan saking banyaknya kita harus pandai memilah dan memilih informasi mana yang memang kita butuhkan.

Definisi Data Mining

Data mining adalah suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan di dalam database.

Data mining adalah proses yang menggunakan teknik statistic, matematika, kecerdasan buatan, dan machine elerning untuk mengekstrasi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai database besar.

Inti dari data mining adalah kegiatan penggalian pengetahuan data. Pengertian dari istilah lain yang hampir mirip dengan data mining adalah Knowledge discovery dan pattern recognition.

Knowledge Discovery : menemukan pengetahuan dari bongkahan data yang masih tersembunyi

Pattern Recognition : pengenalan pola. Pengetahuan yang digali masih berbentuk pola-pola yang mungkin masih perlu digali dalam bongkahan data.Pengelompokkan Data Mining

Data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang dapat dilakukan , yaitu :

1. Deskripsi
Menggambarkan sekumpulan data secara ringkas. Data yang digambarkan berupa:
- Deskripsi grafis : diagram titik, histogram
- deskripsi lokasi : mean(rata-rata), median(nilai tengah), modus, kuartil, persentil
- Deskripsi keberagaman : range(rentang), varians dan standar deviasi

2. Estimasi
Memperkirakan suatu hal dari sejumlah sample yang kita miliki(yg tidak kita ketahui)
Estimasi hampir sama dengan klasifikasi, kecuali variable target. Estimasi lebih kearah numeric dari pada kearah kategori.

3. Prediksi
Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam prediksi nilai dari hasil akan ada dimasa datang(memperkirakan hal yang belum terjadi). Kita bisa menunggu hingga hal itu terjadi untuk membuktikan seberapa tepat prediksi kita

4. Klasifikasi
kegiatan menggolongkan, dengan menggunakan data historis(sebagai data yang digunakan untuk latihan dan sebagai pengalaman).Dalam klasifikasi terdapat variabel prediktor dan target variable,

5. Pengklusteran
Pengkulusteran merupakan pengelompokan record, pengamatan atau memperhatikan dan membentuk kelas objek-objek yang memiliki kemiripan. Kluster adalah kumpulan record yang memiliki kemiripan satu dengan yang lainya dan memiliki ketidak miripan dengan record-record dalam cluster.

6. Asosiasi
Tugas asosiasi dalam data mining adalah menemukan atribut yang muncul dalam satu waktu. Dalam dunia bisnis lebih umum disebut analisis keranjang biasa.

Berdasarkan pengelompokkan data mining tersebut, masing masing memiliki kelompok fungsi antara lain:
Fungsi Minor (tambahan) : deskripsi, estimasi, prediksi
Fungsi Mayor (utama) : klasifikasi, pengelompokkan, estimasi

Knowledge Discovery in Database (Penemuan Pengetahuan dalam Database) ==> KDD

Data mining digambarkan sebagai proses pencarian pengetahuan yang menarik dalam database seperti pola , asosiasi, aturan, perubahan, keganjilan dan struktur penting dari sejumlah besar data yang disimpan pada bank data dan tempat penyimpanan informasi lainnya.

Berikut merupakan proses KDD (Knowledge Discovery in Database) :

1. pemilihan data (data selection), pemilihan data relevan yang didapat dari basis data;
2. pembersihkan data (data cleaning), proses menghilangkan noise dan data yang tidak konsisten atau data tidak relevan;
3. pengintegrasian data (data integration), penggabungan data dari berbagai basisdata ke dalam satu basisdata baru;
4. transformasi data, data diubah atau digabung ke dalam format yang sesuai untuk diproses dalam data mining;
5. data mining, suatu proses di mana metoda diterapkan untuk menemukan pengetahuan berharga dan tersembunyi dari data;
6. evaluasi pola (pattern evaluation), untuk mengidentifikasi pola-pola menarik untuk di representasikan kedalam knowledge based;
7. representasi pengetahuan (knowledge presentation), visualisasi dan penyajian pengetahuan mengenai teknik yang digunakan untuk memperoleh pengetahuan yangdiperoleh pengguna.

about author

Farham Harvianto M. Kom

199010262014011001

Pusat Data dan Dokumentasi Ilmiah

Komentar (4)

  • Farham Harvianto

    12 Maret 2014, 09:35:37

    Data Mining hanya sebuah teknik untuk penggalian data didalam database. Untuk pengolahannya tergantung jenis database yang anda gunakan apakah Mysql, PostGre, Oracle, SQL Server, MariaDB, MongoDB... yang pasti Software untuk pengolahannya berbeda-beda tiap database..

  • Agdy Wicaksana

    11 Maret 2014, 03:41:16

    Terima kasih mas untuk artikelnya. Sangat membantu.
    Sekalian saya mau bertanya, untuk data mining apa biasanya make software yang udah ada atau bikin programnya sendiri Terus requirement minimum hardware untuk data mining biasanya apa aja Saya lagi ada riset skala kecil untuk data mining dan lagi estimasi biaya. Mungkin mas bisa bantu kasih infonya.
    Terima kasih.

  • Farham Harvianto

    24 Februari 2014, 09:01:07

    Berbeda, data mining disini bisa di artikan sebagai penggunaan teknik untuk penggalian data yang ada di dalam sebuah database. Data Center yang pak Fahmi maksud adalah sebuah server farm atau sebuah kumpulan data yang terpusat jika pak fahmi maksud adalah sebuah kumpulan data yang terpusat, itu dinamakan Data Warehouse, yaitu sebuah database yang menyimpan segala informasi yang berkaitan dengan suatu sistem , yang nantinya data itu diolah dengan "data mining" membentuk sebuah BI (Bussiness Intelegent) untuk pengambilan sebuah keputusan oleh sebuah sistem dalam data warehouse..

    CMIIW

  • Fahmi

    23 Februari 2014, 17:22:32

    Artikelnya sangat membantu saya, bagus sekali.. bolehkah saya bertanya, apakah data mining sama dengan data center jika beda apa yang menjadi perbedaan antara keduanya

    terima kasih

    Fahmi (Pulau TIdung)

Bagaimana Reaksi Anda Tentang Blog ini?


Tinggalkan Komentar

gambar

Komentar di Facebook
jQuery cookie Style Colors Switcher