Algorithm Agglomerative Hierarchical Clustering

 

Algorithm Agglomerative Hierarchical Clustering 

(Pertemuan 11 Machinelearning)

Halo semua sekarang kita akan membahas tentang Agglomerative Hirarchical Clustering. penasaran apa itu? langsung aja kita bahas ada kesempatan kali ini :

Analisis cluster merupakan metode pengelompokan multivariat (banyak variabel) dengan tujuan utama yaitu mengelompokkan objek berdasarkan kemiripan karakteristik yang dimilikinya.

Analisis cluster terbagi menjadi dua metode yaitu 
  • hirarki 
  • non-hirarki.
Pada artikel ini, bagian cluster yang akan dibahas hanya metode hirarki saja.

Hierarchical methods adalah teknik clustering membentuk hirarki atau berdasarkan tingkatan tertentu sehingga menyerupai struktur pohon. Dengan demikian proses pengelompokannya dilakukan secara bertingkat atau bertahap. Biasanya, metode ini digunakan pada data yang jumlahnya tidak terlalu banyak dan jumlah cluster yang akan dibentuk belum diketahui.

sedangakan...

Agglomerative (metode penggabungan) adalah strategi pengelompokan hirarki yang dimulai dengan setiap objek dalam satu cluster yang terpisah kemudian membentuk cluster yang semakin membesar. Jadi, banyaknya cluster awal adalah sama dengan banyaknya objek.
Sedangkan Divisive (metode pembagian) adalah strategi pengelompokan hirarki yang dimulai dari semua objek dikelompokkan menjadi cluster tunggal kemudian dipisah sampai setiap objek berada dalam cluster yang terpisah. (Supranto, 2004)

Teknik Agglomerative

Ada beberapa teknik yang sering digunakan pada algoritma ini : 
  1. Single linkage (jarak terdekat atau tautan tunggal) Teknik yang menggabungkan cluster-cluster menurut jarak antara anggota-anggota terdekat di antara dua cluster.
  2. Average linkage (jarak rata-rata atau tautan rata-rata) Teknik yang menggabungkan cluster-cluster menurut jarak rata-rata pasangan anggota masing-masing pada himpunan antara dua cluster.
  3. Complete linkage (jarak terjauh atau tautan lengkap) Teknik yang menggabungkan cluster-cluster menurut jarak antara anggota-anggota terjauh di antara dua cluster.

Contohh Hasil Clustering :




Komentar