Articles

Studi Kasus Perhitungan Algortima K-Means

Algoritma K-Means adalah suatu metode penganalisaan data atau metode Data Mining yang melakukan proses pemodelan tanpa supervisi (unsupervised) dan merupakan salah satu metode yang melakukan pengelompokan data dengan sistem partisi.  Metode k-means berusaha mengelompokkan data yang ada ke dalam beberapa kelompok/cluster, dimana data dalam satu kelompok/cluster mempunyai karakteristik yang sama satu sama lainnya dan mempunyai karakteristik yang berbeda dengan data yang ada di dalam kelompok/cluster yang lain
Langkah-langkah Algoritma K-Means
1.Tentukan jumlah cluster
2.Tentukan centroid awal dari tiap cluster (Using Lower and Upper bounds or Randomly)
3.Alokasikan data dengan jumlah cluster yang ditentukan berdasarkan jarak terdekat dengan centroid (menggunakan rumus Ecludien distance space atau Manhattan/City Block distance space)
4.Setelah cluster dan anggotanya terbentuk, hitung mean tiap cluster dan jadikan sebagai centroid baru
5.Kembali ke-3 apabila masih terdapat perpindahan data dari satu cluster ke cluster yang lain, atau apabila perubahan pada nilai centroid masih di atas nilai threshold yang ditentukan
Studi Kasus Perhitungan Algoritma K-Means
Misalkan terdapat data sebanyak 6 record dimana data tersebut memiliki atribut Nilai 1 dan Nilai 2. Pada dataset ini tidak memiliki label sehingga data ini cocok untuk kasus K-Means

Langkah-langkah Perhitungan K-Means
1.Tentukan jumlah cluster, Misalkan disini karena hanya memiliki 6 record data saya bagi menjadi 2 cluster. Jadi k=2
2.Tentukan centroid awal dari tiap cluster (Using Lower and Upper bounds or Randomly). Pada penentuan centroid (titik pusat cluster) awal saya menggunakan lower dan upper bond yaitu menggunakan data terendah dan data tertinggi yaitu record ke 1 (1,0 1,0) dan record ke 4 (8,0 7,0). Penggunaan lower dan upper bond cukup efektif yang ditunjukan dengan looping yang sedikit. Tetapi untuk dataset yang besar bisa menggunakan algoritma optimasi agar didapat penentuan centroid awal yang optimal
3.Alokasikan data dengan jumlah cluster yang ditentukan berdasarkan jarak terdekat dengan centroid (menggunakan rumus Ecludien distance space atau Manhattan/City Block distance space)
Disni saya menggunakan Manhattan tetapi yang populer digunakan adalah Ecludian distance.
Centroid Awal

Jarak data ke Centroid Awal


Perhitungan Jarak untuk record
Jarak Cluster 1 untuk record 1 = |1.0-1.0|+|1.0-1.0|=0.0
Jarak Cluster 2 untuk record 1 = |1.0-8.0|+|1.0-7.0|=|-7.0|+|-6.0|=13.0
Jarak Cluster 1 untuk record 2 = |2.5-1.0|+|2.0-1.0|=2.5
Jarak Cluster 2 untuk record 2 = |2.5-8.0|+|2.0-7.0|=|-5.5|+|-5.0|=10.5
Jarak Cluster 1 untuk record 3 = |3.0-1.0|+|5.5-1.0|=6.5
Jarak Cluster 2 untuk record 3 = |3.0-8.0|+|5.5-7.0|=|-5.0|+|1.5|=6.5
Jarak Cluster 1 untuk record 4 = |8.0-1.0|+|7.0-1.0|=13.0
Jarak Cluster 2 untuk record 4 = |8.0-8.0|+|7.0-7.0|=0.0
Jarak Cluster 1 untuk record 5 = |4.0-1.0|+|4.0-1.0|=6.0
Jarak Cluster 2 untuk record 5 = |4.0-8.0|+|4.0-7.0|=7.0
Jarak Cluster 1 untuk record 6 = |6.0-1.0|+|5.0-1.0|=9.0
Jarak Cluster 2 untuk record 6 = |6.0-8.0|+|5.0-7.0|=4.0
Hasil Cluster


Keterangan : untuk record ke 1 karena jarak ke cluster 1 adalah 0.0 dan jarak ke cluster 2 adalah 13.0 maka masuk ke Cluster 1 karena jarak ke cluster 1 lebih kecil daripada jarak ke cluster 2
4.Setelah cluster dan anggotanya terbentuk, hitung mean tiap cluster dan jadikan sebagai centroid baru.

Centroid Cluster 1  (menghitung rata-rata untuk cluster 1 yaitu record ke 1,2,3 dan 5)
=average(1.0+2.5+3.0+4.0)=2.6
=average(1.0+2.0+5.5+4.0)=3.1
Centroid Cluster 2  (menghitung rata-rata untuk cluster 2 yaitu record ke 4 dan 6)
=average(8.0+6.0)=7.0
=average(7.0+5.0)=6.0
Jadi Centroid nya adalah sebagai berikut

5.Kembali ke-3 apabila masih terdapat perpindahan data dari satu cluster ke cluster yang lain, atau apabila perubahan pada nilai centroid masih di atas nilai threshold yang ditentukan.
Untuk perhitungan jarak menggunakan centroid yang baru dihitung yaitu sbb:


Perhitungan Jarak untuk record
Jarak Cluster 1 untuk record 1 = |1.0-2.6|+|1.0-3.1|= 3.75
Jarak Cluster 2 untuk record 1 = |1.0-7.0|+|1.0-6.0|= 11.0
Hasil


Karena keanggotaan data pada Cluster 1 dan Cluster 2 tidak berubah maka centroid tetap sehingga looping atau perhitungan berhenti. Jadi hasil pengklusteran adalah Cluster 1 adala data ke 1,2,3, dan 4 sedangkan cluster 2 data 4 dan 6

 


Related Articles


29 Komentar :


Distributor Alat Pemadam Api Murah

08 Agustus 2017 - 09:14 WIB

sering-sering update lagi artikelnya

Alat Pemadam Api Murah

07 Agustus 2017 - 09:34 WIB

baik sekali agan membuat informasi yang bagus seperti ini lanjutkan

Alat Pemadam Api Portable

07 Agustus 2017 - 10:01 WIB

saya berterimakasih karena website ini selalu memberikan hal menarik kepada para pembaca

Jual Alat Pemadam Api

07 Agustus 2017 - 10:36 WIB

website ini mempunyai banyak sekali informasi menarik untuk parapembaca terus update gan

Jual Alat Pemadam Api Murah

07 Agustus 2017 - 11:10 WIB

info yang membuat parapembaca kagum akan website ini

Jual Alat Pemadam Api Portable

07 Agustus 2017 - 11:44 WIB

website ini memberikan segala informasi yang bagus dan bermanfaat

Toko Alat Pemadam Api

07 Agustus 2017 - 13:24 WIB

makasih gan, lanjutkan update nya

Toko Alat Pemadam Api Murah

07 Agustus 2017 - 14:02 WIB

ditunggu update selanjutnya

Distributor Alat Pemadam Api

07 Agustus 2017 - 14:39 WIB

pertamax gan terimakasih untuk infonya

Tabung Pemadam Api

28 Juli 2017 - 10:43 WIB

saya berterimakasih karena website ini selalu memberikan hal menarik kepada para pembaca

Kampung Inggris

27 Juli 2017 - 06:35 WIB

Thanks bro... Infonya sangat menambah pengetahuan bagi kami.
Lantai Vinyl

13 Mei 2017 - 21:39 WIB

Penjelasannya mudah dicerna dan dimengerti. Terima kasih banyak pak...
furniture duco

05 April 2017 - 09:16 WIB

Mantap sekali desain website anda pak bos... Jada kepincut nih.
tempat tidur

05 April 2017 - 09:17 WIB

salam sukses http://www.tempatidur123.com
mimbar masjid

05 April 2017 - 09:18 WIB

salam sukses http://www.jualpodium.com
mebel minimalis

05 April 2017 - 09:18 WIB

salam sukses http://www.meubelminimalis.com
pintu

05 April 2017 - 09:19 WIB

salam sukses http://www.furniturepintu.com
kamar set

05 April 2017 - 09:19 WIB

salam sukses http://www.jeparadisemebeland.com
Obat Akibat Benjolan Asam Urat

17 Februari 2017 - 13:54 WIB


Bagi para wanita,berjilbab merupakan suatu kaharusan dan kewajiaban.Maka tutup lah urat mu,dan hanya tampilkan kecantikan di depan suami saja.

http://ow.ly/NqsZc 48 | http://ow.ly/Nt6hs | http://goo.gl/G43HKX 2 | http://goo.gl/RPe6eo | http://goo.gl/0WKcBg | http://goo.gl/fHC0CA | http://goo.gl/iZgnAm | http://goo.gl/9zr0FJ | http://goo.gl/W3QpoG | http://goo.gl/8h3Byr
Obat Jantung Berdebar Untuk Ibu Hamil

17 Februari 2017 - 13:58 WIB


Orang tua merupakan orang yang harus selalu kita utamakan.Kasih sayang ibu tak kan pernah bisa kita bayar.
Obat Tumor Telinga Luar

17 Februari 2017 - 13:58 WIB


Hadapi semua dengan senyuman,dengan senyuman dengan senyuaman :)
ciri ciri obat anabolic rx24 asli

01 Februari 2017 - 23:45 WIB

nice blog and article
hammer pembesar penis

01 Februari 2017 - 23:46 WIB

hammer pembesar penis
viagra asli

22 Desember 2016 - 19:00 WIB

Nice blog and article, thanks for sharing. However want to statement on few common issues, The
website taste is great, the articles is in point of fact excellent.
https://goo.gl/Fy17SE
https://goo.gl/Pvgc 0k
https://goo.gl/RNre7W
https://goo.gl/5G3HfZ
h ttps://goo.gl/D8gVyF
https://goo.gl/QX3PxK
https:// goo.gl/x0F6Ew
https://goo.gl/E6qkzD
https jasa seo website

22 September 2016 - 05:37 WIB

Mantap sekali desain website anda pak bos... Jada kepincut nih.
https://jasaseo.website/jasa-seo-handal/
batik muslim modern

05 Agustus 2016 - 09:06 WIB

terimakasih gan
Obat Atasi Mani Encer

04 Juni 2016 - 09:38 WIB

Bismillah, meunang vixion~ http://ow.ly/Qqiv300m7wP
Program Kasir

02 Juni 2016 - 09:30 WIB

Ah saya masih kurang mengerti mengenai algoritma kmeans kalau misalnya tidak diajarkan secara langsung, apalagi kalau programmer harus bisa fasih banget sama yang namanya algoritma. Mau ga mau ane baca sendiri dan praktekin sendiri dari nyari-nyari website, dan akhirnya salah satunya ketemu disini, lumayanlah buat nambah ilmu...
Program Kasir

01 Juni 2016 - 16:09 WIB

Ah saya masih kurang mengerti mengenai algoritma kmeans kalau misalnya tidak diajarkan secara langsung, apalagi kalau programmer harus bisa fasih banget sama yang namanya algoritma. Mau ga mau ane baca sendiri dan praktekin sendiri dari nyari-nyari website, dan akhirnya salah satunya ketemu disini, lumayanlah buat nambah ilmu :)

Post Comments