Apa itu clustering, jelaskan perannya dalam datamining?
Apa itu clustering, jelaskan perannya dalam datamining?

Video: Apa itu clustering, jelaskan perannya dalam datamining?

Video: Apa itu clustering, jelaskan perannya dalam datamining?
Video: Belajar Data Mining - Konsep Clustering 2024, Mungkin
Anonim

Pengantar. Dia adalah penambangan data teknik yang digunakan untuk menempatkan elemen data ke dalam milik mereka kelompok terkait. Kekelompokan adalah proses mempartisi data (atau objek) ke dalam kelas yang sama, Data dalam satu kelas lebih mirip dengan setiap selain untuk yang di lain gugus.

Selain itu, apa gunanya clustering?

Kekelompokan digunakan dalam segmentasi pasar; di mana kami mencoba mendenda pelanggan yang mirip satu sama lain baik dalam hal perilaku atau atribut, segmentasi/kompresi gambar; di mana kami mencoba mengelompokkan wilayah yang serupa, dokumen kekelompokan berdasarkan topik, dll.

Orang mungkin juga bertanya, mengapa kita menggunakan analisis klaster? Analisis klaster dapat menjadi alat penambangan data yang kuat untuk organisasi mana pun yang perlu mengidentifikasi kelompok pelanggan yang berbeda, transaksi penjualan, atau jenis perilaku dan hal lainnya. Misalnya, penyedia asuransi menggunakan analisis klaster untuk mendeteksi klaim penipuan, dan bank menggunakannya untuk penilaian kredit.

Selanjutnya, apa itu clustering dalam data mining beserta contohnya?

Kekelompokan adalah proses membuat sekelompok objek abstrak menjadi kelas objek serupa. A gugus dari data objek dapat diperlakukan sebagai satu kelompok. Saat melakukan gugus analisis, pertama-tama kita mempartisi himpunan data ke dalam kelompok berdasarkan data kesamaan dan kemudian menetapkan label ke grup.

Mengapa K berarti pengelompokan digunakan?

Penggunaan Bisnis. NS K - berarti algoritma pengelompokan digunakan untuk menemukan kelompok yang belum secara eksplisit diberi label dalam data. Ini bisa jadi digunakan untuk mengkonfirmasi asumsi bisnis tentang jenis grup apa yang ada atau untuk mengidentifikasi grup yang tidak dikenal dalam kumpulan data yang kompleks.

Direkomendasikan: