Detail Cantuman

Image of Analisis data mining K-Means cluster analysis  untuk data berjenis biner

 

Analisis data mining K-Means cluster analysis untuk data berjenis biner


Pengelompokan (clustering) adalah salah satu proses dari data mtntng yang
bertujuan untuk menemukan "pengetahuan" atau pola yang berharga ...

  • CodeCallNoLokasiKetersediaan
    01001100700041519.5 Sae aPerpustakaan Pusat (REF.14.84)Tersedia
  • Perpustakaan
    Perpustakaan Pusat
    Judul Seri
    -
    No. Panggil
    519.5 Sae a/R.14.84
    Penerbit Magister Statistika Terapan : Bandung.,
    Deskripsi Fisik
    vi,;102 hlm ,;29,5 cm
    Bahasa
    Indonesia
    ISBN/ISSN
    -
    Klasifikasi
    519.5 Sae a
    Tipe Isi
    -
    Tipe Media
    -
    Tipe Pembawa
    -
    Edisi
    -
    Subyek
    Info Detil Spesifik
    -
    Pernyataan Tanggungjawab
  • Pengelompokan (clustering) adalah salah satu proses dari data mtntng yang
    bertujuan untuk menemukan "pengetahuan" atau pola yang berharga dari data
    yang berukuran relatif besar yang umumnya dikelola sebagai data history dan
    disimpan baik sebagai database maupun datawarehouse. Metode pengelompokan
    digunakan terhadap data-data yang bersifat un-supervised learning, sehingga proses
    pengelompokan didalam konsep data mining termasuk dalam Un-supervised
    analysis.

    Terdapat dua kelompok metode pengelompokan yang sudah dikenal yaitu metode
    cluster analysis hirarki (hierarchical clustering method) dan metode cluster analysis
    non hirarki (non hierarchical clustering method), Algoritma K-Means Cluster
    Analysis termasuk dalam kelompok metode cluster analysis non hirarki, dimana
    jumlah kelompok yang akan dibentuk sudah terlebih dahulu diketahui atau
    ditetapkan jumlahnya.

    AIgoritma K-Means Cluster Analysis mempergunakan metode perhitungan jarak
    (distance) untuk mengukur tingkat kedekatan antara data dengan titik tengah
    (centroid), umumnya menggunakan Euclidean distance atau metode pengukuran
    jarak lainnya, untuk data yang berjenis biner metode perhitungan jarak ini menjadi
    tidak tepat diterapkan sehingga perlu dilakukan perubahan yaitu dengan cara
    mempergunakan metode perhitungan tingkat similaritas, terdapat beberapa metode
    perhitungan similaritas diantaranya yang dipergunakan dalam laporan ini adalah
    Jaccard simililarity, Anderberg similarity, Czekanowsky similarity, dan Kulczynski
    similarity. Kemudian untuk menentukan nilai centroid awal pada algoritma K­
    Means Cluster Analysis umumnya dilakukan dengan cara acak (random), pada
    analisa ini dilakukan modifikasi dengan terlebih dahulu dilakukan proses
    pengurutan (sorting) data dan nilai awal centroid ditetapkan berdasarkan kriteria
    pembentuk kelompok yang sudah diketahui. Dengan melakukan pendekatan
    similaritas dan perubahan pada algoritma k-means cluster analysis seperti diatas
    menghasilkan algoritma k-means cluster analysis yang dapat dipergunakan pada
    data berjenis biner dan validitas yang lebih baik .
  • Tidak tersedia versi lain

  • Silakan login dahulu untuk melihat atau memberi komentar.


//

Informasi