K-means Algorithm (KMA

)
Kasus 1.
Diketahui angka kematian kasar (CDR) dan angka kelahiran kasar (CBR) 10 negara seperti terlihat pada Tabel 1. Negara-negara tersebut akan dikelompokkan berdasarkan CBR dan CDRnya menjadi tiga kelompok. Proses pengelompokkan menggunakan metode k-means. Tabel 1. CDR dan CBR tahun 1994 (sumber: ESCAP Population Data Sheet 1996) http://bankdata.depkes.go.id/Profil/Indo98/Annex/lvia5.htm No Negara CBR CDR 1 Brunei Darusalam 27 3 2 Kamboja 38 14 3 Indonesia 24 8 4 Laos 43 15 5 Malaysia 28 5 6 Myanmar 32 11 7 Filipina 30 7 8 Singapura 17 5 9 Thailand 20 6 10 Vietnam 29 8 1. Misalkan kita akan pengelompokkan data tersebut menjadi 3 cluster, K = 3. Misalkan pusat cluster kita tetapkan sembarang, c1 = (20, 5); c2 = (25,4); dan c3 = (30,10). 2. Hitung jarak setiap data terhadap setiap pusat cluster. Misalkan untuk menghitung jarak data pertama (Brunei Darusalam) dengan pusat cluster pertama adalah:
d 11 =

(27 − 20)2 + (3 − 5)2

= 7,2801

Jarak data pertama (Brunei Darusalam) dengan pusat cluster kedua adalah:
d 12 =

(27 − 25)2 + (3 − 4)2

= 2,2361

Jarak data pertama (Brunei Darusalam) dengan pusat cluster ketiga adalah:
d 13 =

(27 − 30)2 + (3 − 10)2

= 7,6158

Hasil perhitungan jarak selengkapnya adalah;

cluster kedua ada 3.0000 1. dan cluster keempat ada 5. diperoleh anggota cluster pertama ada 2. Hitung pusat cluster baru.0000 13.3246 13.4164 10.6158 8. Untuk cluster pertama.0000 25. maka data tersebut akan masuk pada cluster ketiga.1980 3.6569 C3 7.1246 5.2361 3.4868 Jarak C2 2.0000 9. 4.5 . Misalkan untuk data pertama.0799 8.0950 3.7703 2. ada 2 data yaitu data ke-8 dan data ke-9.2801 20. 2 . Suatu data akan menjadi anggota dari suatu cluster yang memiliki jarak terkecil dari pusat clusternya.0000 13. sehingga data pertama akan menjadi anggota dari cluster pertama. 2 c12 = 5+6 = 5.8995 5. Demikian juga untuk data kedua (Kamboja).2361 3.1231 21.5 . sehingga: c11 = 17 + 20 = 18.9284 5.9284 10.1623 9.8310 8. Posisi cluster selengkapnya adalah: No 1 2 3 4 5 6 7 8 9 10 Negara Brunei Darusalam Kamboja Indonesia Laos Malaysia Myanmar Filipina Singapura Thailand Vietnam CBR 27 38 24 43 28 32 30 17 20 29 CDR 3 14 8 15 5 11 7 5 6 8 Anggota Cluster C1 C2 C3 * * * * * * * * * * Berdasarkan hasil penggolongan tersebut.0623 5.2361 16.No 1 2 3 4 5 6 7 8 9 10 Negara Brunei Darusalam Kamboja Indonesia Laos Malaysia Myanmar Filipina Singapura Thailand Vietnam CBR 27 38 24 43 28 32 30 17 20 29 CDR 3 14 8 15 5 11 7 5 6 8 C1 7.9443 6.4012 4.3852 2.3852 5. jarak terkecil ada pada cluster ketiga. jarak terkecil diperoleh pada cluster kedua.

6861 10. sehingga: c 21 = c 22 = 27 + 24 + 28 = 26.5974 1.4054 15. ada 5 data yaitu data ke-2. Posisi cluster selengkapnya terlihat pada Tabel 5.5774 11.4000 5.4 . 3 3+8+5 = 5.5335 3.3393 6.8240 9.5811 1.7727 2.7712 C3 10.5131 14.2720 6. ada 3 data yaitu data ke-1. 5 14 + 15 + 11 + 7 + 8 = 11 5 5. No 1 2 3 4 5 6 7 8 9 10 Negara Brunei Darusalam Kamboja Indonesia Laos Malaysia Myanmar Filipina Singapura Thailand Vietnam CBR 27 38 24 43 28 32 30 17 20 29 CDR 3 14 8 15 5 11 7 5 6 8 C1 8.8600 21.9464 18. sehingga: c 31 = c 32 = 38 + 43 + 32 + 30 + 29 = 34.5811 10.3683 3.0415 26.2774 9.33 .7935 Jarak C2 2. data ke-4.2671 1.6997 8.4267 14.2434 6.0277 9.33 3 Untuk cluster ketiga.4847 8. Hasil perhitungan jarak selengkapnya terlihat pada Tabel 4.5434 19. No 1 2 3 4 5 6 7 8 Negara Brunei Darusalam Kamboja Indonesia Laos Malaysia Myanmar Filipina Singapura CBR 27 38 24 43 28 32 30 17 CDR 3 14 8 15 5 11 7 5 C1 Anggota Cluster C2 C3 * * * * * * ** * .1774 6.Untuk cluster kedua. data ke-3 dan data ke-5.0139 4. Ulangi menghitung jarak setiap data terhadap setiap pusat cluster yang baru. data ke-6. data ke-7 dan data ke-10.8977 4.

2. Hitung pusat cluster baru sebagaimana pada langkah ke-4.7370 1. yaitu data ke-7 dan ke-10.1762 9.6.6677 7.5115 2.7454 14.5.5. Ulangi menghitung jarak setiap data terhadap setiap pusat cluster yang baru.5298 10.8600 21.5811 1.6705 5. No 1 2 3 4 5 6 7 8 9 10 Negara Brunei Darusalam Kamboja Indonesia Laos Malaysia Myanmar Filipina Singapura Thailand Vietnam CBR 27 38 24 43 28 32 30 17 20 29 CDR 3 14 8 15 5 11 7 5 6 8 C1 8.0000 4.2649 6.1283 9.5131 14.7628 6. c21 = 27. 8. c12 = 5. c31 = 37.2720 6.7935 Jarak C2 3. 7.0415 26.9 10 Thailand Vietnam 20 29 6 8 * ** Terlihat masih ada 2 data yang berubah posisi dari kondisi semula.2558 13.9443 22.33.5877 12.8511 0.0249 17.5774 11. Posisi cluster selengkapnya terlihat pada Tabel 7.67. c32 = 13.1282 10.5974 1. Sehingga perlu dihitung pusat cluster baru. No 1 2 3 4 5 6 7 8 9 10 Negara Brunei Darusalam Kamboja Indonesia Laos Malaysia Myanmar Filipina Singapura Thailand Vietnam CBR 27 38 24 43 28 32 30 17 20 29 CDR 3 14 8 15 5 11 7 5 6 8 Anggota Cluster C1 C2 C3 * * * * * * * * * * .5811 10.2804 C3 14.6026 2. sehingga diperoleh: c11 = 18.2774 9. c22 = 6.2835 19. Hasil perhitungan jarak selengkapnya terlihat pada Tabel 6.

Ada 3 negara yang termasuk dalam kelompok ini. sehingga proses iterasi sudah dapat dihentikan. Laos dan Myanmar. Ada 2 negara yang termasuk dalam kelompok ini.67. Malaysia.5. dengan: • Cluster pertama memiliki pusat (18.5) yang dapat diartikan sebagai kelompok negara-negara dengan dengan CBR rendah dan CDR rendah. • Cluster kedua memiliki pusat (27. yaitu Singapura dan Thailand.Terlihat bahwa posisi data sudah tidak mengalami perubahan. Ada 5 negara yang termasuk dalam kelompok ini. yaitu Brunei Darusalam.2) yang dapat diartikan sebagai kelompok negara-negara dengan dengan CBR sedang dan CDR sedang. 13.33) yang dapat diartikan sebagai kelompok negara-negara dengan dengan CBR tinggi dan CDR tinggi. Filipina dan Vietnam.6. . • Cluster ketiga memiliki pusat (37. Hasil akhir yang diperoleh adalah 3 cluster. 5. 6. yaitu Kamboja. Indonesia.

23 5.diperoleh nilai ai sebagai berikut.71 10.Untuk mendapatkan jumlah cluster optimal dengan metode silhoutte measure.86 11 16.54 6.63 6. Nilai a1 merupakan rata-rata jarak tersebut.03 7.82 5 15.65 3.047 5.62 4.54 11.85 19.39 2 15. perlu dilakukan proses clustering dengan jumlah cluster dari 2 sampai 9.71 8.24 + 5 + 10.1 20.15 3.39 10.05 1.47 13.08 15.7 8.62 5.47 16.41 8 10.39)/6 = 6.47 24.33) Posisi data pada cluster adalah sebagai berikut: Data ke1 2 3 4 5 6 7 8 9 10 Jarak antar data adalah: Data ke1 2 3 4 5 6 7 8 9 10 Jarak 1 15.16 9.23 20.47 5 4 20 5. Demikian seterusnya.7 15.86 24.667 .43 6.06 3. dihitung rata-rata jarak antara X1 dengan semua data yang ada dicluster pertama (karena data pertama terletak di cluster pertama).83 4. 6) dan C2 = (37.08 7.7 7.24 1.21 4.15 10.21 2. yaitu jarak terhadap data ke-3.7 4.047.7 15.16 13. 5.7 10.45 6.37 9 7.37 9.45 5 18.62 19.16 4.2 + 7. pusat cluster untuk jumlah cluster = 2 adalah: C1 = (25.26 2.2 7.26 27.16 12.67.1 13.05 3.22 Berada pada Cluster ke1 2 1 2 1 2 1 1 1 1 Untuk data pertama.16 13 4.63 22. Dengan menggunakan KMA.83 + 2.83 11 8.85 7.83 15.24 13.06 13 10.41 12. 7 – 10. i 1 2 3 ai 6.25 18.82 3 5.65 5 2.43 5 10.22 10 5.16 6 9.24 9. yaitu: a1 = (5.62 27.56 15.904 5.83 20 2.62 + 5. 13.56 5.25 5 8.24 7 5 10.03 11.2 22.

132 10.583 -0. diperoleh nilai si sebagai berikut.366 0.495 . 4.997. Nilai rata-rata jarak tersebut = (15.997.583 7.287 19. dan 6.402 5.570 0.237 Dengan menggunakan persamaan (3). Karena hanya ada 1 cluster diluar cluster pertama.022 0. yaitu jarak terhadap data ke-2. untuk data pertama.56 + 20 + 9.009 10.382 9.614 0. Demikian seterusnya sehingga diperoleh bi sebagai berikut.43)/3 = 14. maka diperoleh nilai b1 = 14.997 15.585 0.675 20.250 12. i 1 2 3 4 5 6 7 8 9 10 Rata-rata si 0.405 0. i 1 2 3 4 5 6 7 8 9 10 bi 14.422 9.098 6.629 0.898 9.462 14.092 Demikian pula.207 6. dihitung rata-rata jarak antara X1 dengan semua data yang ada dicluster kedua (hanya ada cluster kedua selain cluster pertama).597 0.4 5 6 7 8 9 10 8.618 0.122 22.

997 nilai a1 < b1. Jumlah cluster 2 3 4 5 6 7 8 9 ~ sk 0. sehingga diperoleh s2 = 0.403 = 0. proses Sehingga nilai rata-rata si untuk 2 cluster adalah ~ tersebut dilakukan untuk jumlah cluster 3 sampai 9. Demikian seterusnya.131 0. .597.299 0.193 0.Sebagai contoh. yaitu 0.495.495. pada data pertama.418 0.185 0. 6. 14.495 0.047 s1 = 1 − = 1 − 0. sehingga jumlah cluster Terlihat bahwa nilai ~ yang optimal untuk kasus tersebut adalah 2.105 s2 memiliki angka terbesar. hasilnya dapat dilihat pada Tabel.159 0.

Sign up to vote on this title
UsefulNot useful