Support Vector Machine Konsep Klasifikasi dengan Support Vector Machine (SVM) adalah mencari hyperplane terbaik yang berfungsi sebagai pemisah du akelas data Ide sederhana dari SVM adalah memaksimalkan margin, yang merupakan jarak pemisah antara kelas data SVM mampu bekerja pada dataset yang berdiensi tinggi dengan menggunakan kernel titik SVM hanya menggunakan beberapa titik data terpilih yang berkontribusi (Support Vector) untuk membentuk model yang akan digunakan dalam proses klasifikasi. Tujuan Mencari Hyperlane maksimum Definisi Dasar Decision Boundary : Pemisah antar class – hyperlane Margin : Jarak terdekat dari decision boundary dengan data yang ingin dipisahkan ...
Agglomerative Hierarchical Clustering (AHC) Hierarchical CLustering adalah metode analisis kelompok yang berusaha untuk membangun sebuah hirarki kelompok data. Strategi pengelompokkannya umumnya ada 2 jenis yaitu Agglomerative (Bottom-Up) dan Devisive (Top-Down). Pada bagian ini akan dibatasi hanya menggunakan konsep Agglomerative (Bottom-Up). Algoritma AHC 1. Hitung matrik jarak antar data (menggunakan Euclidean atau Manhattan Disatance) 2. Gabungkan dua kelompok terdekat menjadi satu kelompok data: Single Lingkage (Jarak Terdekat) : Jarak antara member terdekat dari dua kluster Complete Lingkage (Jarak Terjauh) : Jarak antara member terjauh dari kluster. Maximum distance between cluster , Average Lingkage (Jarak Rata- Rata : Menghitung semua jarak dari kumpulan - kumpulan, lalu dibuat rata- rata. Average distance between cluster 3. Perbarui matrik jatrak antar data untuk mempresentasikan antara kelompok baru dengan kelompok yang tersis...
Machine Learning bahan utamanya adalah data Data yang diproduksi bisa mencapai zeta. Bidang bidang yang menghasilkan data banyak, yaitu terutama social media. Perbedaan data terstruktur & Data tidak terstrukturData Terstruktur - Sudah tertabulasi (terdata gampang) 2. Data Tidak Terstruktur - Data – data berupa teks Perbedaan Data dan Informasi 1. Data : Data adalah fakta mentah atau rincian peristiwa yang belum diolah, yang terkadang tidak dapat diterima oleh akal pikiran dari penerima tersebut, maka dari itu data harus diolah terlebih dahulu menjadi informasi unuk dapat diterima oleh penerima 2. Informasi : ...
Comments
Post a Comment