Konsep Data Mining

Konsep Data Nining
POKOK BAHASAN
Konsep dasar dan pengertian Data
Nining
Tahapan dalam Data Nining
Nodel Data Nining
Fungsi Data Nining
PENDAHULUAN
Teknologi database saat ini memungkinkan
untuk menyimpan sejumlah data dalam
jumlah yang sangat besar dan terakumulasi.
Disinilah awal timbulnya persoalan ledakan
data
Data perlu disimpan, tapi yang lebih penting
dari itu adalah proses penemuan
pengetahuan (knowledge) dari data yang
disimpan !
Pengertian Data Mining
Beberapa definisi umum dari Data mining
Proses penemuan pola yang menarik dari data
yang tersimpan dalam jumlah besar.
Ekstraksi dari suatu informasi yang berguna atau
menarik (non-trivial, implisit, sebelumnya belum
diketahui, potensial kegunaannya) pola atau
pengetahuan dari data yang disimpan dalam
jumlah besar.
Ekplorasi dari analisa secara otomatis atau
semiotomatis terhadap data-data dalam jumlah
besar untuk mencari pola dan aturan yang berarti.
Nama lain Data Nining
Data mining memiliki beberapa sebutan
atau nama lain yaitu :
Knowledge discovery (mining) in databases
(KDD),
ekstraksi pengetahuan (knowledge
extraction),
Analisa datafpola,
kecerdasan bisnis (business intelligence),
dll.
Nengapa Data Nining perlu ?
Beberapa faktor yang mendukung
perlunya dilakukan data mining adalah :
Data telah mencapai jumlah dan ukuran
yang sangat besar
Telah dilakukan proses data warehousing
Kemampuan Komputasi yang semakin
terjangkau
Persaingan bisnis yang semakin ketat
Nodel Dalam Data Nining
Terdapat dua tipe atau mode operasi yang
bisa digunakan untuk mencari informasi yang
dibutuhkan user lewat proses data mining,
yaitu :
Nodel verifikasi menggunakan pendekatan top
down dengan mengambil hipotesa dari user dan
memeriksa validitasnya dengan data sehingga bisa
dibuktikan kebenaran hipotesa tersebut.
Nodel Knowledge Discovery menggunakan
pendekatan bottom up untuk mendapatkan
informasi yang sebelumnya tidak diketahui.
Nodel Knowledge Discovery
Nodel ini terbagi menjadi dua :
directed knowledge discovery
data mining akan mencoba mencari penjelasan nilai target
field tertentu ( seperti penghasilan, respons, usia, dan lain-
lain) terhadap field-field yang lain.
undirected knowledge discovery
tidak ada target field karena komputer akan mencari pola
yang ada pada data.
Jadi undirected knowledge discovery digunakan
untuk mengenali hubungan f relasi yang ada pada
data sedangkan directed knowledge discovery akan
menjelaskan hubungan f relasi tersebut.
Tahapan Proses Dalam Data
Nining
Netode Data Nining
Netode data mining dapat
diklasifikasikan berdasarkan fungsi yang
dilakukan atau berdasarkan jenis
aplikasinya :
Klasifikasi (supervised)
Clustering (unsupervised)
Association Rules (unsupervised)
Attribute !mportance (supervised)
KLAS!F!KAS! (SUPERv!SED)
Pada persoalan klasifikasi, kita memiliki
sejumlah kasus (sampel data) dan ingin
memprediksi beberapa class yang ada pada
sampel data tersebut.
Tiap instan data berisi banyak atribut, dimana
masing-masing atribut memiliki satu dari
beberapa kemungkinan nilai.
Hanya satu atribut diantara banyak atribut
tersebut yang disebut dengan atribut target,
sedangkan atribut yang lain disebut sebagai
atribut prediktor.
CLUSTER!NG
(UNSUPERv!SED)
Clustering adalah teknik yang berguna untuk
mengeksplorasi data.
Digunakan pada saat banyak kasus dan tidak
memiliki pengelompokan secara alami => dalam hal
ini algoritma data mining dapat digunakan untuk
mencari pengelompokan yang ada pada data.
Clustering model berbeda dari model prediktif
dikarenakan pada clustering tidak perlu ada atribut
target.
Clustering juga dapat diorganisasi ke dalam struktur
hirarkikal akan mendefinisikan taksonomi dari data.
ASSOC!AT!ON RULES
(UNSUPERv!SED)
Fungsi Association Rules seringkali disebut dengan
"market basket analysis", yang digunakan untuk
menemukan relasi atau korelasi diantara himpunan
item2.
Fungsi ini paling banyak digunakan untuk
menganalisa data dalam rangka keperluan strategi
pemasaran, desain katalog, dan proses pembuatan
keputusan bisnis.
Tipe association rule bisa dinyatakan sebagai misal :
"70 dari orangorang yang membeli mie, juice dan
saus akan membeli juga roti tawar".
ATTR!BUTE !NPORTANCE
(SUPERv!SED)
Attribute !mportance, disebut juga dengan feature
selection, menyediakan solusi otomatis untuk
meningkatkan kecepatan dan akurasi dari model
klasifikasi yang dibangun pada table data yang
memiliki jumlah atribut yang sangat banyak.
Attribute !mportance meranking atribut prediktif
dengan melakukan eleminasi nilai yang redundant,
tidak relevant atau tidak informative dan
mengidentifikasi atribut predictor yang banyak paling
berpengaruh dalam pengambilan keputusan.

Konsep Data Mining

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Konsep Data Mining

Uploaded by

Copyright:

Available Formats

Konsep Data Nining

You might also like