Klasifikasi Menggunakan Support Vector Machine
Klasifikasi Data Menggunakan SVM
(Pertemuan 7 Machinelearning)
Balik lagi nih sobat cerita, kali ini ke model klasifikasi selanjutnya yaitu ada SVM apa itu SVM? penasaran kan? yuk scroll!
Apa ituSupport Vector Machine?
SVM (Support Vector Machine) merupakan salah satu metode superviside learning. SVM memiliki konsep yang lebih baik dari pafa teknik yang lainnya. SVM juga di sebut-sebut dapat mengatasi masalah klasifikasi dari regresi linear.
Cara kerja SVM ini mencari Hyperplane terbaik dengan menggunakan jarak maskimal antar klas. Hyperplane adalah sebuah fungsi yang dapat digunakan untuk klasifikasi antar kelas disebut sebagai line wheras. fungsinya menggunakan antar kelas dalam 3-D (plane similary) sedangkan fungsi yang digunakan untuk klasifikasi di dalam ruang kelsa dimesni yang lebih tinggi disebut hyperplane
Hyperplane yang ditemukan SVM diilustrasikan seperti Gambar 1 posisinya berada ditengah-tengah antara dua kelas, artinya jarak antara hyperplane dengan objek-objek data berbeda dengan kelas yang berdekatan (terluar) yang diberi tanda bulat kosong dan positif. Dalam SVM objek data terluar yang paling dekat dengan hyperplane disebut support vector
Praktikum Menggunakanbahasa pyhton via google colabs
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
Code diatas adalah penjelasan bahwa kita menggunakan library pandas, numpy dan matplotlib
from sklearn.datasets import load_breast_cancer
cancer = load_breast_cancer()
disini kita akan menggunakan model data dari sklearn yaitu breast cancer
df_cancer = pd.DataFrame(np.c_[cancer['data'], cancer['target']],
columns = np.append(cancer['feature_names'], ['target'])
)
df_cancer
kita akan coba menampilkan data dengan menggunakan libraru numpy, pandas. supaya tampilan yang dihasilkan dapat lebih rapih dan dapat dipahami
X = df_cancer.drop(['target'], axis=1)
X.head()
fiatas kita akan coba split manual, splitnya disini kita menggunakan X sebagai data train dengan menghilangkan atribut target
y= df_cancer['target']
y
targer dihilangkan dari x karena akan dipakai oleh variable y. jadi disini isi dari variable y adalah isi dari vatribut target
from sklearn.svm import SVC
model = SVC()
model.fit(X_train, y_train)
diatas, kita udah ciba melatih data kita menggunakan metode SVM
y_pred = model.predict(X_test)
y_pred
Menampilkan variable y_pred yang didalamnya terdapat X_test
from sklearn.metrics import confusion_matrix, classification_report
cm = np.array(confusion_matrix(y_test, y_pred))
confusion = pd.DataFrame(cm, index=['cancer' ,'sehat'],
columns=['prediksi kanker','prediksi sehat'])
confusion
Hasil dari prediksi akan dipetakkan menjadi matriks dengan ukuran 2x2. disini baru kita bisa apat mengetahui kelemahan data latih kita.
print(classification_report(y_test, y_pred))
Disini kita akan menguji hasil dari keakuratan data kita
Komentar
Posting Komentar