P. 1
naive bayes

naive bayes

|Views: 119|Likes:
Published by Rosyid Ridho
DATA NAIVE BAYES
DATA NAIVE BAYES

More info:

Categories:Types, School Work
Published by: Rosyid Ridho on Dec 17, 2012
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as DOC, PDF, TXT or read online from Scribd
See more
See less

10/15/2013

pdf

text

original

NAÏVE BAYES

A. Data Training dan Hipotesa

Dari data diatas dapat dinyatakan pengertian tentang data konsisten dan tidak konsisten. • Data konsisten Suatu data disebut konsisten, jika setiap atributnya memiliki nilai target yang sama.
Day # # # Cuaca Cerah Cerah Cerah Temperatur Normal Normal Normal Kecepatan Angin Pelan Pelan Kencang Berolah raga Ya Ya Ya

Atribut Cuaca, Temperatur mempunyai nilai target yang sama (Berolah-raga), maka data ini adalah data yang konsisten. • Data tidak konsisten Suatu data disebut tidak konsisten, jika setiap atributnya memiliki nilai target yang sama, tapi nilai yang berbeda untuk atriibutnya.
Day # # # Cuaca Cerah Cerah Hujan Temperatur Normal Tinggi Normal Kecepatan Angin Pelan Pelan Kencang Berolah raga Ya Ya Ya

Tidak satupun atribut yang mempunyai nilai yang sama dalam satu keputusan (berolah-raga).

tidak konsisten atau bias. H(cuaca=cerah. *. kec. temperature=normal. pelan)=ya 3. temperature=normal. normal. dan kec.• Data bias Suatu data disebut data bias jika memiliki target atau keputusan yang berbeda sedangkan instance pada semua atributnya sama Day # # # Cuaca Cerah Cerah Cerah Temperatur Normal Normal Normal Kecepatan Angin Pelan Pelan Pelan Berolah raga Ya Ya Tidak Dataset yang digunakan sebagai data training bias bersifat konsisten. Hipotesa dituliskan dengan: Contoh Hipotesa: 1.angin=pelan)=ya Hipotesa ini menunjukkan bahawa keputusan untuk berolah raga bila cuaca=cerah. kec.angin=pelan. untuk singkatnya dituliskan hanya instance pada setiap atribut dengan H(cerah.angin=pelan. H(cuaca=cerah. pelan)=ya 2. Prediksi dari suatu kejadian disebut Hipotesa. untuk singkatnya dituliskan hanya instance pada setiap atribut dengan H(cerah. H(cuaca=cerah)=ya .angin=pelan)=ya Hipotesa ini menunjukkan bahawa keputusan untuk berolah raga bila cuaca=cerah. kec. Data set tersebut digunakan untuk memprediksi suatu kejadian dari fakta atau kenyataan yang diketahui sebelumnya.

sangat sulit mencari data seperti itu. Memecah data berdasarkan target keputusan Untuk memperoleh hipotesa dengan Find-S dari data diatas. Padahal pada kenyataan.Hipotesa ini menunjukkan bahawa keputusan untuk berolah raga bila cuaca=cerah. untuk singkatnya dituliskan hanya instance pada setiap atribut dengan H(cerah. *. Algoritma FIND-S Find-S adalah suatu metode paling sederhana yang dapat digunkan untuk mendapatkan suatu hipotesa berdasarkan data. sehingga akan diperoleh 2 data: pertama untuk keputusan=ya dan kedua untuk keputusan=tidak . langkah pertama adalah memecah data berdasarkan target keputusannya. *)=ya Pada dasarnya semua algoritma yang dikembangkan dalam mesin pembelajaran yang ada pada Data Mining adalah algoritma yang menghasilkan hipotesa dari suatu keputusan berdasarkan data pembelajaran B. Berikut ini ada Dataset Cuaca: Langkahnya adalah: 1. Kelemahan dari Find-S adalah data yang digunakan harus bersifat konsisten dan tidak bias. Find-S mencari kesamaan nilai attribute untuk memperoleh suatu hipotesa.

dan diteruskan hingga data terakhir dengan memperhatikan kesamaan sampai didapat hipotesa umum. . Pembuatan hipotesa ini dilakukan dengan mengambil data pertama sebagai hipotesa awal yang dianggap sebagai hipotesa spesifik. 2. Membuat hipotesa untuk masing-masing keputusan Langkah berikutnya adalah membuat hipotesa untuk masing-masing keputusan.Dari hasil pemisahan tersebut terlihat bahwa data training ersebut konsisten dan tidak bias. Langkah ini digunakan untuk menentukan hipotesa dari keputusan=ya.

Normal. tidak ada perubahan karena semua nilai instancenya sama: H(Cerah. *)=Ya Langkah ini digunakan untuk menentukan hipotesa dari keputusan=tidak 1.angin sehingga: H(Cerah. *)=Tidak . Data kedua. Pelan)=Ya 2. Hipotesa awal disamakan dengan data pertama H(Hujan. Pelan)=Ya 3. sehingga: H(Cerah. Normal. ada perubahan di atribut kec. Pelan)=Tidak 2. ada perubahan di kec. Normal.angin H(Hujan.1. *)=Ya 4. Normal. Hipotesa awal disamakan dengan data pertama: H(Cerah.angin. Tinggi. Data keempat. Data kelima. ada perubahan di atribut kec. Data keenam. Tinggi.

atau dengan bahasa lain P(X|Y) adalah prosentase banyaknya X di dalam Y. Konsep Dasar dan Definisi Metode Bayes Metode Find-S tidak dapat digunakan untuk data yang tidak konsisten dan data yang bias. C. Pertama kali dibahas terlebih dahulu tentang konsep dasar dan definisi pada Teorema Bayes.Dari hasil keputusan diatas. jika ada pertanyaan ”Bila cuaca cerah saat ini apakah akan berolahraga?” Hasil keputusannya adalah = ya (Hipotesa I). Algoritma Find-S hanya bisa digunakan jika datanya konsisten dan tidak bias. . Probabilitas bersyarat dalam data diilustrasikan pada contoh berikut. kemudian menggunkan teorema ini untuk melakukan klasifikasi dalam Data Mining. Metode Bayes merupakan pendekatan statistic untuk melakukan inferensi induksi pada persoalan klasifikasi. Dalam ilmu probabilitas bersyarat dinyatakan sebagai: Probabilitas X di dalam Y adalah probabilitas inteseksi X dan Y dari probabilitas Y. Metode Bayes menggunakan propabilitas bersyarat sebagai dasarnya. sehingga untuk bentuk data semacam ini salah satu metode sederhana yang dapat digunakan adalah metode bayes.

maka dituliskan P(cuaca=cerah dan Olahraga=ya)= 4/6. Banyaknya data cerah dan berolah-raga adalah 4 dari 6 data. Metode Bayes dan HMAP (Hypothesis Maximum Appropri Probability) . Dari informasi tersebut. maka probabilitas cuaca cerah pada saat olahraga adalah: D.Banyaknya data berolah-raga=ya adalah 4 dari 6 data maka dituliskan P(olahraga)= 4/6.

HMAP dapat digunakan sebagai metode untuk mendapatkan hipotesis dari suatu keputusan. apakah dapat dinyatakan bahwa besar kemungkinan akan menderita sakit paru-paru jika dia seorang perokok? . Contoh: Pertanyaan : Berdasarkan hasil survey tersebut. Terminologi dari HMAP menyatakan hipotesa yang diambil berdasarkan nilai probabilitas berdasarkan kondisi prior yang diketahui. HMAP dapat diartikan untuk mencari probabilitas terbesar dari semua instance pada atribut target atau semua kemungkinan keputusan.Dimana: keadaan Posteriror (Probabilitas Xk di dalam Y) dapat dihitung dari keadaan prior (Probabilitas Y di dalam Xk dibagi dengan jumlah probabilitas Y dalam semua Xi). HMAP adalah model penyederhanaan dari metode bayes yang disebut dengan Naive Bayes.

You're Reading a Free Preview

Download
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->