K-MEANS Dalam System klasifikasi terdapat 2 jeni klasifikasi yaitu : 1. Supervised Classification Kelasnya atau Targetnya sudah diketahui 2. Unsupervised Classification Kelasnya atau Targetnya belum diketahui Sebuah Cluster merupakan kumpulan objek- objek yang "sama" di antara mereka dan "berbeda" pada objek dari cluster lainnya. K-Means Algorithm Clustering K-Means merupakan algoritma untuk cluster n objek berdasarkan atribut menjadi k partisi, dimana k < n. Secara Umum K-Means Clustering merupakan salah satu metode data clustering non-hirarki yang mengelompokkan data dalam bentuk satu atau lebih cluster/kelompok. Langkah-langkah dalam Algoritma K-Means Clustering : 1. Menentukan jumlah cluster. 2. Menentukan nilai centroid. Dalam menentukan nilai centroid untuk awal iterasi, nilai awal centroid dilakukan secara acak. sedangkan jika menentukan nilai centroid yang merupakan tahap dari iterasi, maka digunakan rumus sebagai berikut : 3. Menghitung jarak antara ti...
Support Vector Machine Konsep Klasifikasi dengan Support Vector Machine (SVM) adalah mencari hyperplane terbaik yang berfungsi sebagai pemisah du akelas data Ide sederhana dari SVM adalah memaksimalkan margin, yang merupakan jarak pemisah antara kelas data SVM mampu bekerja pada dataset yang berdiensi tinggi dengan menggunakan kernel titik SVM hanya menggunakan beberapa titik data terpilih yang berkontribusi (Support Vector) untuk membentuk model yang akan digunakan dalam proses klasifikasi. Tujuan Mencari Hyperlane maksimum Definisi Dasar Decision Boundary : Pemisah antar class – hyperlane Margin : Jarak terdekat dari decision boundary dengan data yang ingin dipisahkan ...
Agglomerative Hierarchical Clustering (AHC) Hierarchical CLustering adalah metode analisis kelompok yang berusaha untuk membangun sebuah hirarki kelompok data. Strategi pengelompokkannya umumnya ada 2 jenis yaitu Agglomerative (Bottom-Up) dan Devisive (Top-Down). Pada bagian ini akan dibatasi hanya menggunakan konsep Agglomerative (Bottom-Up). Algoritma AHC 1. Hitung matrik jarak antar data (menggunakan Euclidean atau Manhattan Disatance) 2. Gabungkan dua kelompok terdekat menjadi satu kelompok data: Single Lingkage (Jarak Terdekat) : Jarak antara member terdekat dari dua kluster Complete Lingkage (Jarak Terjauh) : Jarak antara member terjauh dari kluster. Maximum distance between cluster , Average Lingkage (Jarak Rata- Rata : Menghitung semua jarak dari kumpulan - kumpulan, lalu dibuat rata- rata. Average distance between cluster 3. Perbarui matrik jatrak antar data untuk mempresentasikan antara kelompok baru dengan kelompok yang tersis...
Comments
Post a Comment