K-means Algorithm (KMA

)
Kasus 1.
Diketahui angka kematian kasar (CDR) dan angka kelahiran kasar (CBR) 10 negara seperti terlihat pada Tabel 1. Negara-negara tersebut akan dikelompokkan berdasarkan CBR dan CDRnya menjadi tiga kelompok. Proses pengelompokkan menggunakan metode k-means. Tabel 1. CDR dan CBR tahun 1994 (sumber: ESCAP Population Data Sheet 1996) http://bankdata.depkes.go.id/Profil/Indo98/Annex/lvia5.htm No Negara CBR CDR 1 Brunei Darusalam 27 3 2 Kamboja 38 14 3 Indonesia 24 8 4 Laos 43 15 5 Malaysia 28 5 6 Myanmar 32 11 7 Filipina 30 7 8 Singapura 17 5 9 Thailand 20 6 10 Vietnam 29 8 1. Misalkan kita akan pengelompokkan data tersebut menjadi 3 cluster, K = 3. Misalkan pusat cluster kita tetapkan sembarang, c1 = (20, 5); c2 = (25,4); dan c3 = (30,10). 2. Hitung jarak setiap data terhadap setiap pusat cluster. Misalkan untuk menghitung jarak data pertama (Brunei Darusalam) dengan pusat cluster pertama adalah:
d 11 =

(27 − 20)2 + (3 − 5)2

= 7,2801

Jarak data pertama (Brunei Darusalam) dengan pusat cluster kedua adalah:
d 12 =

(27 − 25)2 + (3 − 4)2

= 2,2361

Jarak data pertama (Brunei Darusalam) dengan pusat cluster ketiga adalah:
d 13 =

(27 − 30)2 + (3 − 10)2

= 7,6158

Hasil perhitungan jarak selengkapnya adalah;

4012 4. 4. 2 . sehingga: c11 = 17 + 20 = 18.7703 2.2801 20. Suatu data akan menjadi anggota dari suatu cluster yang memiliki jarak terkecil dari pusat clusternya.1231 21.6569 C3 7.5 . dan cluster keempat ada 5.4164 10. diperoleh anggota cluster pertama ada 2. Misalkan untuk data pertama.3852 5.8310 8.0623 5.1246 5. 2 c12 = 5+6 = 5.5 . Posisi cluster selengkapnya adalah: No 1 2 3 4 5 6 7 8 9 10 Negara Brunei Darusalam Kamboja Indonesia Laos Malaysia Myanmar Filipina Singapura Thailand Vietnam CBR 27 38 24 43 28 32 30 17 20 29 CDR 3 14 8 15 5 11 7 5 6 8 Anggota Cluster C1 C2 C3 * * * * * * * * * * Berdasarkan hasil penggolongan tersebut. sehingga data pertama akan menjadi anggota dari cluster pertama. Untuk cluster pertama.6158 8.0000 1.3852 2.0799 8.2361 16.0000 9.0000 13.2361 3.0950 3. Demikian juga untuk data kedua (Kamboja). cluster kedua ada 3.4868 Jarak C2 2.9284 10.3246 13.0000 25. ada 2 data yaitu data ke-8 dan data ke-9. maka data tersebut akan masuk pada cluster ketiga.8995 5.No 1 2 3 4 5 6 7 8 9 10 Negara Brunei Darusalam Kamboja Indonesia Laos Malaysia Myanmar Filipina Singapura Thailand Vietnam CBR 27 38 24 43 28 32 30 17 20 29 CDR 3 14 8 15 5 11 7 5 6 8 C1 7.1980 3.0000 13. jarak terkecil ada pada cluster ketiga.9443 6.9284 5.2361 3. jarak terkecil diperoleh pada cluster kedua. Hitung pusat cluster baru.1623 9.

4847 8.8977 4. Ulangi menghitung jarak setiap data terhadap setiap pusat cluster yang baru. Hasil perhitungan jarak selengkapnya terlihat pada Tabel 4.Untuk cluster kedua. ada 5 data yaitu data ke-2.3393 6. sehingga: c 21 = c 22 = 27 + 24 + 28 = 26.33 3 Untuk cluster ketiga.5811 10.4267 14.8600 21.6861 10.2720 6. 3 3+8+5 = 5. data ke-6.9464 18.5335 3.5811 1.2671 1.7935 Jarak C2 2.6997 8.5434 19. 5 14 + 15 + 11 + 7 + 8 = 11 5 5.2774 9.3683 3.2434 6.8240 9.5131 14.4000 5.0139 4. No 1 2 3 4 5 6 7 8 9 10 Negara Brunei Darusalam Kamboja Indonesia Laos Malaysia Myanmar Filipina Singapura Thailand Vietnam CBR 27 38 24 43 28 32 30 17 20 29 CDR 3 14 8 15 5 11 7 5 6 8 C1 8.1774 6.4 .7727 2.5774 11. ada 3 data yaitu data ke-1. sehingga: c 31 = c 32 = 38 + 43 + 32 + 30 + 29 = 34.4054 15.0415 26. data ke-3 dan data ke-5. Posisi cluster selengkapnya terlihat pada Tabel 5. No 1 2 3 4 5 6 7 8 Negara Brunei Darusalam Kamboja Indonesia Laos Malaysia Myanmar Filipina Singapura CBR 27 38 24 43 28 32 30 17 CDR 3 14 8 15 5 11 7 5 C1 Anggota Cluster C2 C3 * * * * * * ** * .0277 9. data ke-4.33 .5974 1.7712 C3 10. data ke-7 dan data ke-10.

7628 6.7935 Jarak C2 3.5877 12. c22 = 6.5.0415 26.67. c32 = 13.6.2804 C3 14.9443 22.8511 0.6026 2.9 10 Thailand Vietnam 20 29 6 8 * ** Terlihat masih ada 2 data yang berubah posisi dari kondisi semula.5811 10.2558 13.2774 9.5774 11.2.6677 7. c31 = 37. 8. Posisi cluster selengkapnya terlihat pada Tabel 7. 7.0000 4.5811 1. sehingga diperoleh: c11 = 18. Sehingga perlu dihitung pusat cluster baru.7370 1. Ulangi menghitung jarak setiap data terhadap setiap pusat cluster yang baru.0249 17.2720 6.33. c21 = 27. c12 = 5.2649 6. Hitung pusat cluster baru sebagaimana pada langkah ke-4.2835 19.1283 9. yaitu data ke-7 dan ke-10.5131 14.7454 14.6705 5.5.5974 1.1282 10.5115 2.8600 21.1762 9.5298 10. No 1 2 3 4 5 6 7 8 9 10 Negara Brunei Darusalam Kamboja Indonesia Laos Malaysia Myanmar Filipina Singapura Thailand Vietnam CBR 27 38 24 43 28 32 30 17 20 29 CDR 3 14 8 15 5 11 7 5 6 8 Anggota Cluster C1 C2 C3 * * * * * * * * * * . Hasil perhitungan jarak selengkapnya terlihat pada Tabel 6. No 1 2 3 4 5 6 7 8 9 10 Negara Brunei Darusalam Kamboja Indonesia Laos Malaysia Myanmar Filipina Singapura Thailand Vietnam CBR 27 38 24 43 28 32 30 17 20 29 CDR 3 14 8 15 5 11 7 5 6 8 C1 8.

Filipina dan Vietnam. Malaysia. sehingga proses iterasi sudah dapat dihentikan. yaitu Singapura dan Thailand. • Cluster ketiga memiliki pusat (37.33) yang dapat diartikan sebagai kelompok negara-negara dengan dengan CBR tinggi dan CDR tinggi. dengan: • Cluster pertama memiliki pusat (18. Ada 2 negara yang termasuk dalam kelompok ini.5) yang dapat diartikan sebagai kelompok negara-negara dengan dengan CBR rendah dan CDR rendah.2) yang dapat diartikan sebagai kelompok negara-negara dengan dengan CBR sedang dan CDR sedang. yaitu Kamboja. • Cluster kedua memiliki pusat (27. . 5. Laos dan Myanmar.6. 6. Ada 5 negara yang termasuk dalam kelompok ini. Indonesia. Hasil akhir yang diperoleh adalah 3 cluster.67. Ada 3 negara yang termasuk dalam kelompok ini.5. 13. yaitu Brunei Darusalam.Terlihat bahwa posisi data sudah tidak mengalami perubahan.

23 20.47 13. yaitu jarak terhadap data ke-3.33) Posisi data pada cluster adalah sebagai berikut: Data ke1 2 3 4 5 6 7 8 9 10 Jarak antar data adalah: Data ke1 2 3 4 5 6 7 8 9 10 Jarak 1 15.85 19.25 18.39)/6 = 6.37 9 7. Nilai a1 merupakan rata-rata jarak tersebut. yaitu: a1 = (5.67.25 5 8.43 5 10.1 13.37 9.47 16.62 19.16 9.54 6.7 15. perlu dilakukan proses clustering dengan jumlah cluster dari 2 sampai 9.83 20 2.86 11 16.62 + 5.24 13.26 2.1 20.83 15.22 Berada pada Cluster ke1 2 1 2 1 2 1 1 1 1 Untuk data pertama.03 11. 7 – 10.62 27.7 15.86 24.24 9.03 7.85 7. i 1 2 3 ai 6.06 3.82 5 15.22 10 5. Demikian seterusnya. dihitung rata-rata jarak antara X1 dengan semua data yang ada dicluster pertama (karena data pertama terletak di cluster pertama).16 4.08 7.667 .21 4.65 5 2. 13. pusat cluster untuk jumlah cluster = 2 adalah: C1 = (25.45 6.047 5.05 1.7 7.08 15.06 13 10.904 5.21 2.47 5 4 20 5.39 2 15.16 6 9.26 27.15 10.047.62 5.71 8.83 4.15 3.16 13 4.54 11.7 10.45 5 18. 5.Untuk mendapatkan jumlah cluster optimal dengan metode silhoutte measure.56 15. 6) dan C2 = (37.7 8.83 11 8.71 10.24 7 5 10.83 + 2.16 12.2 + 7.56 5.23 5.05 3.24 1.diperoleh nilai ai sebagai berikut.24 + 5 + 10.7 4.2 22.62 4. Dengan menggunakan KMA.63 22.2 7.43 6.47 24.39 10.63 6.41 12.82 3 5.65 3.16 13.41 8 10.

583 7.583 -0.366 0.237 Dengan menggunakan persamaan (3). 4.495 .122 22.997 15. Demikian seterusnya sehingga diperoleh bi sebagai berikut. i 1 2 3 4 5 6 7 8 9 10 Rata-rata si 0.56 + 20 + 9.43)/3 = 14.402 5.382 9.422 9. Karena hanya ada 1 cluster diluar cluster pertama.570 0.405 0.250 12.462 14. dan 6.629 0. dihitung rata-rata jarak antara X1 dengan semua data yang ada dicluster kedua (hanya ada cluster kedua selain cluster pertama).614 0.092 Demikian pula.132 10.207 6. i 1 2 3 4 5 6 7 8 9 10 bi 14.618 0.022 0.898 9.675 20.4 5 6 7 8 9 10 8. untuk data pertama.287 19.997. Nilai rata-rata jarak tersebut = (15.997. diperoleh nilai si sebagai berikut.597 0.585 0. yaitu jarak terhadap data ke-2.098 6. maka diperoleh nilai b1 = 14.009 10.

hasilnya dapat dilihat pada Tabel. Demikian seterusnya.105 s2 memiliki angka terbesar.Sebagai contoh. pada data pertama.997 nilai a1 < b1.403 = 0. yaitu 0.418 0. 14. sehingga diperoleh s2 = 0. proses Sehingga nilai rata-rata si untuk 2 cluster adalah ~ tersebut dilakukan untuk jumlah cluster 3 sampai 9. sehingga jumlah cluster Terlihat bahwa nilai ~ yang optimal untuk kasus tersebut adalah 2. .131 0.299 0. 6.159 0.597.185 0.193 0.047 s1 = 1 − = 1 − 0.495.495 0. Jumlah cluster 2 3 4 5 6 7 8 9 ~ sk 0.495.

Sign up to vote on this title
UsefulNot useful