Το
Normalization είναι καλό να χρησιμοποιείται όταν γνωρίζετε ότι η κατανομή των δεδομένων σας δεν ακολουθεί μια κατανομή Gauss. … Η τυποποίηση, από την άλλη πλευρά, μπορεί να είναι χρήσιμη σε περιπτώσεις όπου τα δεδομένα ακολουθούν μια κατανομή Gauss.
Πρέπει να χρησιμοποιήσω κανονικοποίηση ή τυποποίηση;
Η κανονικοποίηση είναι χρήσιμη όταν τα δεδομένα σας έχουν ποικίλες κλίμακες και ο αλγόριθμος που χρησιμοποιείτε δεν κάνει υποθέσεις σχετικά με την κατανομή των δεδομένων σας, όπως k-πλησιέστερους γείτονες και τεχνητά νευρωνικά δίκτυα. Τυποποίηση υποθέτει ότι τα δεδομένα σας έχουν κατανομή Gaussian (καμπανάκι).
Είναι η τυποποίηση ίδια με την κανονικοποίηση;
Στον επιχειρηματικό κόσμο, η "κανονικοποίηση" σημαίνει συνήθως ότι το εύρος των τιμών είναι "κανονικοποιημένο ώστε να είναι από 0.0 έως 1,0". "Τυποποίηση" σημαίνει συνήθως ότι το εύρος τιμών είναι "τυποποιημένο" για να μετρήσει πόσες τυπικές αποκλίσεις είναι η τιμή από τον μέσο όρο της.
Είναι πάντα καλό να ομαλοποιούμε δεδομένα;
Με την κανονικοποίηση, στην πραγματικότητα πετάτε κάποιες πληροφορίες σχετικά με τα δεδομένα, όπως τις απόλυτες μέγιστες και ελάχιστες τιμές. Έτσι, δεν υπάρχει εμπειρικός κανόνας. Όπως είπαν άλλοι, η κανονικοποίηση δεν είναι πάντα εφαρμόσιμη. π.χ. από πρακτική άποψη.
Πότε δεν πρέπει να ομαλοποιήσετε τα δεδομένα;
Μερικοί καλοί λόγοι για να μην ομαλοποιηθεί
- Οι συμμετοχές είναι ακριβές. Η κανονικοποίηση της βάσης δεδομένων σας συχνά περιλαμβάνει τη δημιουργία πολλών πινάκων. …
- Ο κανονικοποιημένος σχεδιασμός είναι δύσκολος. …
- Το γρήγορο και βρώμικο πρέπει να είναι γρήγορο και βρώμικο. …
- Εάν χρησιμοποιείτε βάση δεδομένων NoSQL, η παραδοσιακή κανονικοποίηση δεν είναι επιθυμητή.