Ο αλγόριθμος k-Means δεν ισχύει για κατηγορικά δεδομένα, καθώς οι κατηγορικές μεταβλητές είναι διακριτές και δεν έχουν φυσική προέλευση. Επομένως, ο υπολογισμός της ευκλείδειας απόστασης για όπως το διάστημα δεν έχει νόημα.
Μπορούμε να χρησιμοποιήσουμε ομαδοποίηση για κατηγορικά δεδομένα;
Τα δεδομένα της κατηγορίας έχουν μετατραπεί σε αριθμητικά με την ανάθεση τιμής κατάταξης. Είναι ότι ένα κατηγορηματικό σύνολο δεδομένων μπορεί να ομαδοποιηθεί ως αριθμητικά σύνολα δεδομένων.. Παρατηρείται ότι η εφαρμογή αυτής της λογικής, ο k-μέσος αποδίδει την ίδια απόδοση με εκείνη που χρησιμοποιείται στα σύνολα αριθμητικών δεδομένων.
Μπορεί να χρησιμοποιηθεί για κατηγορικές μεταβλητές;
Δεν υπάρχει τρόποςνα βρείτε μια μέση τιμή από αυτά τα δεδομένα, επειδή δεν υπάρχει "μέσο" χρώμα ματιών. Μπορείτε να βρείτε τις αναλογίες, αλλά όχι τη μέση. Ελπίζω αυτό να βοηθήσει!
Τι πρέπει να χρησιμοποιείται όταν τα δεδομένα είναι κατηγορηματικά;
Τα κατηγορικά δεδομένα αναλύονται χρησιμοποιώντας λειτουργία και διάμεσες κατανομές, όπου τα ονομαστικά δεδομένα αναλύονται με λειτουργία ενώ τα τακτικά δεδομένα χρησιμοποιούν και τα δύο. Σε ορισμένες περιπτώσεις, τα τακτικά δεδομένα μπορεί επίσης να αναλυθούν χρησιμοποιώντας μονομεταβλητές στατιστικές, διμεταβλητές στατιστικές, εφαρμογές παλινδρόμησης, γραμμικές τάσεις και μεθόδους ταξινόμησης.
Τι είναι η ομαδοποίηση με κατηγορικές ιδιότητες;
Η
Η ομαδοποίηση κατηγοριών δεδομένων αναφέρεται στην περίπτωση όπου τα αντικείμενα δεδομένων ορίζονται σε κατηγορίες κατηγοριών … Δηλαδή, δεν υπάρχει ενιαία διάταξη ή εγγενής συνάρτηση απόστασης για τις κατηγορικές τιμές, και δεν υπάρχει αντιστοίχιση από τις κατηγορικές σε αριθμητικές τιμές που να είναι σημασιολογικά κατανοητή.