K-means Algorithm (KMA

)
Kasus 1.
Diketahui angka kematian kasar (CDR) dan angka kelahiran kasar (CBR) 10 negara seperti terlihat pada Tabel 1. Negara-negara tersebut akan dikelompokkan berdasarkan CBR dan CDRnya menjadi tiga kelompok. Proses pengelompokkan menggunakan metode k-means. Tabel 1. CDR dan CBR tahun 1994 (sumber: ESCAP Population Data Sheet 1996) http://bankdata.depkes.go.id/Profil/Indo98/Annex/lvia5.htm No Negara CBR CDR 1 Brunei Darusalam 27 3 2 Kamboja 38 14 3 Indonesia 24 8 4 Laos 43 15 5 Malaysia 28 5 6 Myanmar 32 11 7 Filipina 30 7 8 Singapura 17 5 9 Thailand 20 6 10 Vietnam 29 8 1. Misalkan kita akan pengelompokkan data tersebut menjadi 3 cluster, K = 3. Misalkan pusat cluster kita tetapkan sembarang, c1 = (20, 5); c2 = (25,4); dan c3 = (30,10). 2. Hitung jarak setiap data terhadap setiap pusat cluster. Misalkan untuk menghitung jarak data pertama (Brunei Darusalam) dengan pusat cluster pertama adalah:
d 11 =

(27 − 20)2 + (3 − 5)2

= 7,2801

Jarak data pertama (Brunei Darusalam) dengan pusat cluster kedua adalah:
d 12 =

(27 − 25)2 + (3 − 4)2

= 2,2361

Jarak data pertama (Brunei Darusalam) dengan pusat cluster ketiga adalah:
d 13 =

(27 − 30)2 + (3 − 10)2

= 7,6158

Hasil perhitungan jarak selengkapnya adalah;

diperoleh anggota cluster pertama ada 2.3246 13.9284 5.No 1 2 3 4 5 6 7 8 9 10 Negara Brunei Darusalam Kamboja Indonesia Laos Malaysia Myanmar Filipina Singapura Thailand Vietnam CBR 27 38 24 43 28 32 30 17 20 29 CDR 3 14 8 15 5 11 7 5 6 8 C1 7. cluster kedua ada 3.2361 16. Suatu data akan menjadi anggota dari suatu cluster yang memiliki jarak terkecil dari pusat clusternya. 4. jarak terkecil diperoleh pada cluster kedua.0000 9. jarak terkecil ada pada cluster ketiga. maka data tersebut akan masuk pada cluster ketiga.0000 13. sehingga data pertama akan menjadi anggota dari cluster pertama.2801 20.0000 1. sehingga: c11 = 17 + 20 = 18.0950 3.6569 C3 7.4164 10. Untuk cluster pertama.9443 6.4868 Jarak C2 2.7703 2.0799 8.1980 3. 2 c12 = 5+6 = 5. Hitung pusat cluster baru.5 . Misalkan untuk data pertama.4012 4.2361 3. Posisi cluster selengkapnya adalah: No 1 2 3 4 5 6 7 8 9 10 Negara Brunei Darusalam Kamboja Indonesia Laos Malaysia Myanmar Filipina Singapura Thailand Vietnam CBR 27 38 24 43 28 32 30 17 20 29 CDR 3 14 8 15 5 11 7 5 6 8 Anggota Cluster C1 C2 C3 * * * * * * * * * * Berdasarkan hasil penggolongan tersebut.9284 10.1231 21. Demikian juga untuk data kedua (Kamboja).1623 9.1246 5. dan cluster keempat ada 5. ada 2 data yaitu data ke-8 dan data ke-9.8310 8.8995 5.0623 5.3852 2.6158 8.0000 25.2361 3. 2 .0000 13.3852 5.5 .

7712 C3 10. Hasil perhitungan jarak selengkapnya terlihat pada Tabel 4.4 .7727 2.9464 18.0415 26.4000 5.5131 14. sehingga: c 31 = c 32 = 38 + 43 + 32 + 30 + 29 = 34.Untuk cluster kedua.3393 6. data ke-4.2720 6. 5 14 + 15 + 11 + 7 + 8 = 11 5 5.7935 Jarak C2 2.6861 10.2774 9.5434 19. 3 3+8+5 = 5.2434 6.4054 15.5335 3. data ke-6. ada 5 data yaitu data ke-2. No 1 2 3 4 5 6 7 8 9 10 Negara Brunei Darusalam Kamboja Indonesia Laos Malaysia Myanmar Filipina Singapura Thailand Vietnam CBR 27 38 24 43 28 32 30 17 20 29 CDR 3 14 8 15 5 11 7 5 6 8 C1 8.5811 1. ada 3 data yaitu data ke-1.8977 4.33 3 Untuk cluster ketiga.8240 9.33 .5811 10.0139 4.5974 1.5774 11. sehingga: c 21 = c 22 = 27 + 24 + 28 = 26.0277 9. Posisi cluster selengkapnya terlihat pada Tabel 5.3683 3.8600 21. data ke-7 dan data ke-10. No 1 2 3 4 5 6 7 8 Negara Brunei Darusalam Kamboja Indonesia Laos Malaysia Myanmar Filipina Singapura CBR 27 38 24 43 28 32 30 17 CDR 3 14 8 15 5 11 7 5 C1 Anggota Cluster C2 C3 * * * * * * ** * .2671 1.6997 8. data ke-3 dan data ke-5.1774 6.4847 8.4267 14. Ulangi menghitung jarak setiap data terhadap setiap pusat cluster yang baru.

6026 2. c32 = 13.5774 11.7628 6.7370 1. 7.9 10 Thailand Vietnam 20 29 6 8 * ** Terlihat masih ada 2 data yang berubah posisi dari kondisi semula.6.5131 14.6705 5. yaitu data ke-7 dan ke-10. No 1 2 3 4 5 6 7 8 9 10 Negara Brunei Darusalam Kamboja Indonesia Laos Malaysia Myanmar Filipina Singapura Thailand Vietnam CBR 27 38 24 43 28 32 30 17 20 29 CDR 3 14 8 15 5 11 7 5 6 8 C1 8.33.0249 17. Posisi cluster selengkapnya terlihat pada Tabel 7. c31 = 37. sehingga diperoleh: c11 = 18.2649 6.2558 13. Sehingga perlu dihitung pusat cluster baru.2720 6. c12 = 5.2835 19.1283 9.8600 21.0415 26.5115 2.8511 0.7454 14.5811 1.1282 10. Ulangi menghitung jarak setiap data terhadap setiap pusat cluster yang baru.5298 10.5877 12.5811 10.5.7935 Jarak C2 3. c21 = 27.2774 9.9443 22. c22 = 6.0000 4.67.2804 C3 14. Hitung pusat cluster baru sebagaimana pada langkah ke-4. 8.2.5.6677 7. Hasil perhitungan jarak selengkapnya terlihat pada Tabel 6.5974 1. No 1 2 3 4 5 6 7 8 9 10 Negara Brunei Darusalam Kamboja Indonesia Laos Malaysia Myanmar Filipina Singapura Thailand Vietnam CBR 27 38 24 43 28 32 30 17 20 29 CDR 3 14 8 15 5 11 7 5 6 8 Anggota Cluster C1 C2 C3 * * * * * * * * * * .1762 9.

. Indonesia.33) yang dapat diartikan sebagai kelompok negara-negara dengan dengan CBR tinggi dan CDR tinggi. 13. Laos dan Myanmar. 5. sehingga proses iterasi sudah dapat dihentikan.5. Filipina dan Vietnam.6. 6.67. Malaysia. Hasil akhir yang diperoleh adalah 3 cluster. yaitu Singapura dan Thailand.2) yang dapat diartikan sebagai kelompok negara-negara dengan dengan CBR sedang dan CDR sedang. • Cluster kedua memiliki pusat (27. dengan: • Cluster pertama memiliki pusat (18. Ada 2 negara yang termasuk dalam kelompok ini.Terlihat bahwa posisi data sudah tidak mengalami perubahan. yaitu Brunei Darusalam. • Cluster ketiga memiliki pusat (37. Ada 3 negara yang termasuk dalam kelompok ini.5) yang dapat diartikan sebagai kelompok negara-negara dengan dengan CBR rendah dan CDR rendah. Ada 5 negara yang termasuk dalam kelompok ini. yaitu Kamboja.

71 10.21 4.43 6.25 18.37 9 7.47 16.56 5. Demikian seterusnya.85 19.08 15.7 15.63 6.67.24 1.23 20.1 20.54 6. 13.85 7.41 8 10.41 12. 6) dan C2 = (37.45 5 18.16 12.diperoleh nilai ai sebagai berikut.Untuk mendapatkan jumlah cluster optimal dengan metode silhoutte measure.05 1.45 6.83 4.65 5 2.71 8.37 9.22 Berada pada Cluster ke1 2 1 2 1 2 1 1 1 1 Untuk data pertama.7 8.06 3. dihitung rata-rata jarak antara X1 dengan semua data yang ada dicluster pertama (karena data pertama terletak di cluster pertama).06 13 10.82 5 15.047 5.24 + 5 + 10.16 9.1 13.22 10 5.047. 5.83 + 2.24 7 5 10.15 10.56 15.7 4.86 11 16.7 15.43 5 10.33) Posisi data pada cluster adalah sebagai berikut: Data ke1 2 3 4 5 6 7 8 9 10 Jarak antar data adalah: Data ke1 2 3 4 5 6 7 8 9 10 Jarak 1 15.24 9.667 . yaitu jarak terhadap data ke-3.62 4.904 5.24 13.82 3 5.16 4.39 10.08 7.62 19.83 20 2.26 27. 7 – 10. yaitu: a1 = (5.65 3.16 6 9. perlu dilakukan proses clustering dengan jumlah cluster dari 2 sampai 9.7 7.16 13.62 27.47 5 4 20 5.15 3. pusat cluster untuk jumlah cluster = 2 adalah: C1 = (25.39)/6 = 6.03 11.47 13.47 24.2 7.63 22.23 5. Dengan menggunakan KMA.25 5 8. i 1 2 3 ai 6.2 + 7.21 2.16 13 4.62 + 5.26 2. Nilai a1 merupakan rata-rata jarak tersebut.39 2 15.7 10.83 15.2 22.62 5.83 11 8.86 24.05 3.03 7.54 11.

583 7.009 10.898 9.402 5. i 1 2 3 4 5 6 7 8 9 10 bi 14. i 1 2 3 4 5 6 7 8 9 10 Rata-rata si 0. 4.382 9.597 0.585 0.132 10.250 12. Nilai rata-rata jarak tersebut = (15.495 .583 -0.207 6.570 0.122 22.462 14. maka diperoleh nilai b1 = 14.43)/3 = 14.092 Demikian pula.675 20. Karena hanya ada 1 cluster diluar cluster pertama.4 5 6 7 8 9 10 8.629 0.287 19. yaitu jarak terhadap data ke-2.56 + 20 + 9. dan 6.997.237 Dengan menggunakan persamaan (3). Demikian seterusnya sehingga diperoleh bi sebagai berikut.405 0.997 15. untuk data pertama. dihitung rata-rata jarak antara X1 dengan semua data yang ada dicluster kedua (hanya ada cluster kedua selain cluster pertama).614 0.997.098 6.366 0.422 9.022 0.618 0. diperoleh nilai si sebagai berikut.

159 0. . 6. proses Sehingga nilai rata-rata si untuk 2 cluster adalah ~ tersebut dilakukan untuk jumlah cluster 3 sampai 9.131 0.403 = 0.997 nilai a1 < b1.185 0.597.495 0. 14. pada data pertama. sehingga diperoleh s2 = 0.299 0. Demikian seterusnya.193 0. yaitu 0. hasilnya dapat dilihat pada Tabel. sehingga jumlah cluster Terlihat bahwa nilai ~ yang optimal untuk kasus tersebut adalah 2.495.105 s2 memiliki angka terbesar.418 0.047 s1 = 1 − = 1 − 0.Sebagai contoh.495. Jumlah cluster 2 3 4 5 6 7 8 9 ~ sk 0.

Sign up to vote on this title
UsefulNot useful