Klasifikasi Menggunakan K-Means

   

Klasifikasi Menggunakan K-Means

(Pertemuan 10 Machinelearning)

Halo teman sobat cerita pada kali ini akan sharing terkait klasifikasi menggunakan K-Means. apa sih itu K-Means? dan bagaimana penerapanannya dalam mengelola data? yuk kita simak.

Pendahuluan

Dalam sistem klasifikasi terdapat 2 jenis klasifikasi yaitu :
  1. Supervised classification (untuk klasifikasinya udah jelas)
  2. Unsupervised Classification (klasifikasinya belum jelas)
Clustering dapat dianggapyang paling penting dalam masalah unsupervised learning. sebuah cluster merupakan kumpulan objek-objek yang "sama" diantara mereka dan "berbeda" pada objek dari cluster lainnya.

K-Means

K-Means merupakan algoritma untuk cluster n objek berdasarkan atribut menjadi k partisi, dimana k<n. Secara umum K-Means clustering merupakan salah satu metode data clustering non-hirarki (tidak ada level apakah data lebih tinggi atau rendah dari yang lain) yang mengelompokkan data dalam bentuk satu atau lebih cluster/kelompok. Ketentuan objek saat melakukan clustering menggunakan K-Means :
  1. Mempunyai tingkat homogenitas yang tinggi dalam satu kelompok
  2. Mempunyai tingkat heterogenitas yang tinggi antar kelompok

Tujuan K-Means

Tujuannya adalah untuk mendapatkan kelompok-kelompok dimana dalam 1 kelompok memiliki tingkat homogentias yang tinggi dan memiliki tingkat heterogenitas yang tinggi antar kelompok


Gambar 1.0 Data sebelum K-Means dan setelah K-Means


Gambar 1.2 Hasil clustering

Langkah-Langkah Algoritma K-Means :

  1. Menentukan jumlah cluster
  2. Menentukan nilai centroid
    Dalam menentukan nilai centroin untuk awal iterasi, nilai awal centroid dilakukan secara acak. sedangkan jika menentukan nilai centroid yang merupakan tahap dari iterasi, maka digunakan rumus :
  3. Gambar 2.0 Rumus untuk Algoritma K-Means



 



Komentar