Analisis data mining K-Means cluster analysis untuk data berjenis biner
Pengelompokan (clustering) adalah salah satu proses dari data mtntng yang
bertujuan untuk menemukan "pengetahuan" atau pola yang berharga ...
-
Code CallNo Lokasi Ketersediaan 01001100700041 519.5 Sae a Perpustakaan Pusat (REF.14.84) Tersedia -
Perpustakaan Perpustakaan PusatJudul Seri -No. Panggil 519.5 Sae a/R.14.84Penerbit Magister Statistika Terapan : Bandung., 2010 Deskripsi Fisik vi,;102 hlm ,;29,5 cmBahasa IndonesiaISBN/ISSN -Klasifikasi 519.5 Sae aTipe Isi -Tipe Media -Tipe Pembawa -Edisi -Subyek Info Detil Spesifik -Pernyataan Tanggungjawab Saepulloh, Dadan -
Pengelompokan (clustering) adalah salah satu proses dari data mtntng yang
bertujuan untuk menemukan "pengetahuan" atau pola yang berharga dari data
yang berukuran relatif besar yang umumnya dikelola sebagai data history dan
disimpan baik sebagai database maupun datawarehouse. Metode pengelompokan
digunakan terhadap data-data yang bersifat un-supervised learning, sehingga proses
pengelompokan didalam konsep data mining termasuk dalam Un-supervised
analysis.
Terdapat dua kelompok metode pengelompokan yang sudah dikenal yaitu metode
cluster analysis hirarki (hierarchical clustering method) dan metode cluster analysis
non hirarki (non hierarchical clustering method), Algoritma K-Means Cluster
Analysis termasuk dalam kelompok metode cluster analysis non hirarki, dimana
jumlah kelompok yang akan dibentuk sudah terlebih dahulu diketahui atau
ditetapkan jumlahnya.
AIgoritma K-Means Cluster Analysis mempergunakan metode perhitungan jarak
(distance) untuk mengukur tingkat kedekatan antara data dengan titik tengah
(centroid), umumnya menggunakan Euclidean distance atau metode pengukuran
jarak lainnya, untuk data yang berjenis biner metode perhitungan jarak ini menjadi
tidak tepat diterapkan sehingga perlu dilakukan perubahan yaitu dengan cara
mempergunakan metode perhitungan tingkat similaritas, terdapat beberapa metode
perhitungan similaritas diantaranya yang dipergunakan dalam laporan ini adalah
Jaccard simililarity, Anderberg similarity, Czekanowsky similarity, dan Kulczynski
similarity. Kemudian untuk menentukan nilai centroid awal pada algoritma K
Means Cluster Analysis umumnya dilakukan dengan cara acak (random), pada
analisa ini dilakukan modifikasi dengan terlebih dahulu dilakukan proses
pengurutan (sorting) data dan nilai awal centroid ditetapkan berdasarkan kriteria
pembentuk kelompok yang sudah diketahui. Dengan melakukan pendekatan
similaritas dan perubahan pada algoritma k-means cluster analysis seperti diatas
menghasilkan algoritma k-means cluster analysis yang dapat dipergunakan pada
data berjenis biner dan validitas yang lebih baik . -
Tidak tersedia versi lain
-
Silakan login dahulu untuk melihat atau memberi komentar.
//






