Klasifikasi Menggunakan Support Vector Machine

  

Klasifikasi Data Menggunakan SVM

(Pertemuan 7 Machinelearning)

Balik lagi nih sobat cerita, kali ini ke model klasifikasi selanjutnya yaitu ada SVM apa itu SVM? penasaran kan? yuk scroll!

Apa ituSupport Vector Machine?

SVM (Support Vector Machine) merupakan salah satu metode superviside learning. SVM memiliki konsep yang lebih baik dari pafa teknik yang lainnya. SVM juga di sebut-sebut dapat mengatasi masalah klasifikasi dari regresi linear.

Cara kerja SVM ini mencari Hyperplane terbaik dengan menggunakan jarak maskimal antar klas. Hyperplane adalah sebuah fungsi yang dapat digunakan untuk klasifikasi antar kelas disebut sebagai line wheras. fungsinya menggunakan antar kelas dalam 3-D (plane similary) sedangkan fungsi yang digunakan untuk klasifikasi di dalam ruang kelsa dimesni yang lebih tinggi disebut hyperplane



Hyperplane yang ditemukan SVM diilustrasikan seperti Gambar 1 posisinya berada ditengah-tengah antara dua kelas, artinya jarak antara hyperplane dengan objek-objek data berbeda dengan kelas yang berdekatan (terluar) yang diberi tanda bulat kosong dan positif. Dalam SVM objek data terluar yang paling dekat dengan hyperplane disebut support vector

Praktikum Menggunakanbahasa pyhton via google colabs


import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

Code diatas adalah penjelasan bahwa kita menggunakan library pandas, numpy dan matplotlib

from sklearn.datasets import load_breast_cancer
cancer = load_breast_cancer() 

disini kita akan menggunakan model data dari sklearn yaitu breast cancer

df_cancer = pd.DataFrame(np.c_[cancer['data'], cancer['target']], 
                         columns = np.append(cancer['feature_names'], ['target'])
                         )
df_cancer

kita akan coba menampilkan data dengan menggunakan libraru numpy, pandas. supaya tampilan yang dihasilkan dapat lebih rapih dan dapat dipahami


X = df_cancer.drop(['target'], axis=1)
X.head()

fiatas kita akan coba split manual, splitnya disini kita menggunakan X sebagai data train dengan menghilangkan atribut target

y= df_cancer['target']
y

targer dihilangkan dari x karena akan dipakai oleh variable y. jadi disini isi dari variable y adalah isi dari vatribut target

from sklearn.svm import SVC
model = SVC()
model.fit(X_train, y_train)

diatas, kita udah ciba melatih data kita menggunakan metode SVM

y_pred = model.predict(X_test)
y_pred


Menampilkan variable y_pred yang didalamnya terdapat X_test

from sklearn.metrics import confusion_matrix, classification_report

cm = np.array(confusion_matrix(y_test, y_pred))
confusion = pd.DataFrame(cm, index=['cancer' ,'sehat'],
                         columns=['prediksi kanker','prediksi sehat'])
confusion

Hasil dari prediksi akan dipetakkan menjadi matriks dengan ukuran 2x2. disini baru kita bisa apat mengetahui kelemahan data latih kita.

print(classification_report(y_test, y_pred))

Disini kita akan menguji hasil dari keakuratan data kita

Komentar