P. 1
Contoh KMeans

Contoh KMeans

|Views: 11|Likes:
Published by Anyan Right
K-means Algorithm (KMA)
K-means Algorithm (KMA)

More info:

Categories:Types, Presentations
Published by: Anyan Right on Oct 11, 2013
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

06/29/2014

pdf

text

original

K-means Algorithm (KMA

)
Kasus 1.
Diketahui angka kematian kasar (CDR) dan angka kelahiran kasar (CBR) 10 negara seperti terlihat pada Tabel 1. Negara-negara tersebut akan dikelompokkan berdasarkan CBR dan CDRnya menjadi tiga kelompok. Proses pengelompokkan menggunakan metode k-means. Tabel 1. CDR dan CBR tahun 1994 (sumber: ESCAP Population Data Sheet 1996) http://bankdata.depkes.go.id/Profil/Indo98/Annex/lvia5.htm No Negara CBR CDR 1 Brunei Darusalam 27 3 2 Kamboja 38 14 3 Indonesia 24 8 4 Laos 43 15 5 Malaysia 28 5 6 Myanmar 32 11 7 Filipina 30 7 8 Singapura 17 5 9 Thailand 20 6 10 Vietnam 29 8 1. Misalkan kita akan pengelompokkan data tersebut menjadi 3 cluster, K = 3. Misalkan pusat cluster kita tetapkan sembarang, c1 = (20, 5); c2 = (25,4); dan c3 = (30,10). 2. Hitung jarak setiap data terhadap setiap pusat cluster. Misalkan untuk menghitung jarak data pertama (Brunei Darusalam) dengan pusat cluster pertama adalah:
d 11 =

(27 − 20)2 + (3 − 5)2

= 7,2801

Jarak data pertama (Brunei Darusalam) dengan pusat cluster kedua adalah:
d 12 =

(27 − 25)2 + (3 − 4)2

= 2,2361

Jarak data pertama (Brunei Darusalam) dengan pusat cluster ketiga adalah:
d 13 =

(27 − 30)2 + (3 − 10)2

= 7,6158

Hasil perhitungan jarak selengkapnya adalah;

3246 13. ada 2 data yaitu data ke-8 dan data ke-9.8995 5. jarak terkecil diperoleh pada cluster kedua.5 .7703 2.2361 3.6158 8.9284 5. Suatu data akan menjadi anggota dari suatu cluster yang memiliki jarak terkecil dari pusat clusternya.0000 25.3852 5. Posisi cluster selengkapnya adalah: No 1 2 3 4 5 6 7 8 9 10 Negara Brunei Darusalam Kamboja Indonesia Laos Malaysia Myanmar Filipina Singapura Thailand Vietnam CBR 27 38 24 43 28 32 30 17 20 29 CDR 3 14 8 15 5 11 7 5 6 8 Anggota Cluster C1 C2 C3 * * * * * * * * * * Berdasarkan hasil penggolongan tersebut.0000 13.0623 5.0000 1.1623 9.4012 4.1246 5.2361 16.9443 6. Untuk cluster pertama.0000 13. Hitung pusat cluster baru.1231 21.9284 10. 2 .4164 10. Demikian juga untuk data kedua (Kamboja).No 1 2 3 4 5 6 7 8 9 10 Negara Brunei Darusalam Kamboja Indonesia Laos Malaysia Myanmar Filipina Singapura Thailand Vietnam CBR 27 38 24 43 28 32 30 17 20 29 CDR 3 14 8 15 5 11 7 5 6 8 C1 7. sehingga: c11 = 17 + 20 = 18.8310 8. diperoleh anggota cluster pertama ada 2. cluster kedua ada 3. dan cluster keempat ada 5.2361 3.4868 Jarak C2 2.6569 C3 7. 2 c12 = 5+6 = 5.5 .0000 9. sehingga data pertama akan menjadi anggota dari cluster pertama. jarak terkecil ada pada cluster ketiga.1980 3.0950 3.3852 2. 4. maka data tersebut akan masuk pada cluster ketiga. Misalkan untuk data pertama.2801 20.0799 8.

2671 1.3683 3.9464 18.8240 9.5811 10.8600 21. Hasil perhitungan jarak selengkapnya terlihat pada Tabel 4.7712 C3 10.7727 2.5131 14. No 1 2 3 4 5 6 7 8 9 10 Negara Brunei Darusalam Kamboja Indonesia Laos Malaysia Myanmar Filipina Singapura Thailand Vietnam CBR 27 38 24 43 28 32 30 17 20 29 CDR 3 14 8 15 5 11 7 5 6 8 C1 8.8977 4.4267 14.Untuk cluster kedua.33 . 5 14 + 15 + 11 + 7 + 8 = 11 5 5.4 . sehingga: c 31 = c 32 = 38 + 43 + 32 + 30 + 29 = 34.0415 26.5335 3. data ke-6.6997 8. 3 3+8+5 = 5. data ke-4.7935 Jarak C2 2. ada 3 data yaitu data ke-1. data ke-3 dan data ke-5. sehingga: c 21 = c 22 = 27 + 24 + 28 = 26. ada 5 data yaitu data ke-2.0277 9.33 3 Untuk cluster ketiga.3393 6. Posisi cluster selengkapnya terlihat pada Tabel 5.4847 8.2434 6.5811 1.0139 4. Ulangi menghitung jarak setiap data terhadap setiap pusat cluster yang baru.5774 11.2774 9. data ke-7 dan data ke-10.6861 10.2720 6.4000 5.5974 1.4054 15.1774 6. No 1 2 3 4 5 6 7 8 Negara Brunei Darusalam Kamboja Indonesia Laos Malaysia Myanmar Filipina Singapura CBR 27 38 24 43 28 32 30 17 CDR 3 14 8 15 5 11 7 5 C1 Anggota Cluster C2 C3 * * * * * * ** * .5434 19.

No 1 2 3 4 5 6 7 8 9 10 Negara Brunei Darusalam Kamboja Indonesia Laos Malaysia Myanmar Filipina Singapura Thailand Vietnam CBR 27 38 24 43 28 32 30 17 20 29 CDR 3 14 8 15 5 11 7 5 6 8 C1 8. c31 = 37.6705 5.2774 9. c32 = 13.5.33.1283 9. c22 = 6. Hitung pusat cluster baru sebagaimana pada langkah ke-4.2804 C3 14.7370 1.0000 4.9443 22. Hasil perhitungan jarak selengkapnya terlihat pada Tabel 6.1762 9.5811 10.5298 10.2649 6.67.9 10 Thailand Vietnam 20 29 6 8 * ** Terlihat masih ada 2 data yang berubah posisi dari kondisi semula.7454 14. sehingga diperoleh: c11 = 18. No 1 2 3 4 5 6 7 8 9 10 Negara Brunei Darusalam Kamboja Indonesia Laos Malaysia Myanmar Filipina Singapura Thailand Vietnam CBR 27 38 24 43 28 32 30 17 20 29 CDR 3 14 8 15 5 11 7 5 6 8 Anggota Cluster C1 C2 C3 * * * * * * * * * * . Ulangi menghitung jarak setiap data terhadap setiap pusat cluster yang baru. 8.2. 7. c21 = 27.2835 19.8600 21.6677 7.2558 13.7628 6.5974 1.5811 1. Sehingga perlu dihitung pusat cluster baru. c12 = 5.2720 6.0249 17.5131 14.1282 10.7935 Jarak C2 3. Posisi cluster selengkapnya terlihat pada Tabel 7.6.8511 0.5774 11.0415 26.5115 2.5.6026 2. yaitu data ke-7 dan ke-10.5877 12.

33) yang dapat diartikan sebagai kelompok negara-negara dengan dengan CBR tinggi dan CDR tinggi.5. sehingga proses iterasi sudah dapat dihentikan. 6.2) yang dapat diartikan sebagai kelompok negara-negara dengan dengan CBR sedang dan CDR sedang. yaitu Singapura dan Thailand. 13. • Cluster kedua memiliki pusat (27. Ada 5 negara yang termasuk dalam kelompok ini. 5. Filipina dan Vietnam. . yaitu Brunei Darusalam. Malaysia. Laos dan Myanmar.5) yang dapat diartikan sebagai kelompok negara-negara dengan dengan CBR rendah dan CDR rendah. • Cluster ketiga memiliki pusat (37.Terlihat bahwa posisi data sudah tidak mengalami perubahan.6. Indonesia. yaitu Kamboja.67. Ada 3 negara yang termasuk dalam kelompok ini. dengan: • Cluster pertama memiliki pusat (18. Ada 2 negara yang termasuk dalam kelompok ini. Hasil akhir yang diperoleh adalah 3 cluster.

diperoleh nilai ai sebagai berikut.24 9.16 6 9.85 7.22 Berada pada Cluster ke1 2 1 2 1 2 1 1 1 1 Untuk data pertama.2 + 7.43 6.1 20.22 10 5.41 8 10.82 3 5.56 15.16 13 4.33) Posisi data pada cluster adalah sebagai berikut: Data ke1 2 3 4 5 6 7 8 9 10 Jarak antar data adalah: Data ke1 2 3 4 5 6 7 8 9 10 Jarak 1 15.16 4.03 7. Nilai a1 merupakan rata-rata jarak tersebut.05 1.62 27.23 5.904 5.06 3.7 7. Demikian seterusnya.43 5 10.65 5 2.15 3.24 13. 5.7 15. 13.21 2.86 24.7 4.25 18.05 3.47 13.86 11 16. dihitung rata-rata jarak antara X1 dengan semua data yang ada dicluster pertama (karena data pertama terletak di cluster pertama).45 5 18.25 5 8.2 22.39)/6 = 6.16 13. pusat cluster untuk jumlah cluster = 2 adalah: C1 = (25.62 + 5.41 12. i 1 2 3 ai 6.67.03 11. 6) dan C2 = (37.06 13 10.37 9 7.26 2.82 5 15.47 16.667 .45 6.047 5.08 7.62 19. yaitu jarak terhadap data ke-3.37 9. yaitu: a1 = (5.39 10.047.83 + 2.08 15.83 11 8.54 6.Untuk mendapatkan jumlah cluster optimal dengan metode silhoutte measure.23 20. Dengan menggunakan KMA.63 6.85 19.24 7 5 10.7 8.83 15.83 20 2.15 10.21 4.24 + 5 + 10. perlu dilakukan proses clustering dengan jumlah cluster dari 2 sampai 9.56 5.16 9.7 15.39 2 15.71 8.7 10.2 7.71 10.47 24.65 3.62 5.62 4.26 27. 7 – 10.63 22.24 1.47 5 4 20 5.16 12.1 13.54 11.83 4.

570 0.250 12.629 0. Nilai rata-rata jarak tersebut = (15.898 9.583 -0. dihitung rata-rata jarak antara X1 dengan semua data yang ada dicluster kedua (hanya ada cluster kedua selain cluster pertama).237 Dengan menggunakan persamaan (3).098 6. yaitu jarak terhadap data ke-2.495 . i 1 2 3 4 5 6 7 8 9 10 Rata-rata si 0.207 6.287 19.122 22. untuk data pertama.997. maka diperoleh nilai b1 = 14. 4. diperoleh nilai si sebagai berikut.43)/3 = 14.092 Demikian pula.422 9. Karena hanya ada 1 cluster diluar cluster pertama.997 15.402 5.583 7.597 0. i 1 2 3 4 5 6 7 8 9 10 bi 14.022 0. dan 6.585 0. Demikian seterusnya sehingga diperoleh bi sebagai berikut.56 + 20 + 9.618 0.132 10.462 14.614 0.382 9.675 20.997.405 0.009 10.4 5 6 7 8 9 10 8.366 0.

sehingga diperoleh s2 = 0.131 0.047 s1 = 1 − = 1 − 0. hasilnya dapat dilihat pada Tabel.159 0.997 nilai a1 < b1. pada data pertama.299 0. proses Sehingga nilai rata-rata si untuk 2 cluster adalah ~ tersebut dilakukan untuk jumlah cluster 3 sampai 9. yaitu 0.185 0. .193 0.597.495. 14. sehingga jumlah cluster Terlihat bahwa nilai ~ yang optimal untuk kasus tersebut adalah 2.495. Jumlah cluster 2 3 4 5 6 7 8 9 ~ sk 0.495 0.418 0.Sebagai contoh. Demikian seterusnya.105 s2 memiliki angka terbesar.403 = 0. 6.

You're Reading a Free Preview

Download
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->