Logo el.boatexistence.com

Ποια είναι τα ελαττώματα της απόδοσης τιμών που λείπουν με τη μέση τιμή;

Πίνακας περιεχομένων:

Ποια είναι τα ελαττώματα της απόδοσης τιμών που λείπουν με τη μέση τιμή;
Ποια είναι τα ελαττώματα της απόδοσης τιμών που λείπουν με τη μέση τιμή;

Βίντεο: Ποια είναι τα ελαττώματα της απόδοσης τιμών που λείπουν με τη μέση τιμή;

Βίντεο: Ποια είναι τα ελαττώματα της απόδοσης τιμών που λείπουν με τη μέση τιμή;
Βίντεο: SAFUUGO 4 HOUR KICKOFF SPECTACULAR 2024, Ενδέχεται
Anonim

Ο μέσος καταλογισμός παραμορφώνει τις σχέσεις μεταξύ των μεταβλητών Αλλά ο μέσος καταλογισμός παραμορφώνει επίσης τις πολυμεταβλητές σχέσεις και επηρεάζει στατιστικά στοιχεία όπως η συσχέτιση. Για παράδειγμα, η ακόλουθη κλήση προς PROC CORR υπολογίζει τη συσχέτιση μεταξύ της μεταβλητής Orig_Height και των μεταβλητών Weight and Age.

Γιατί η χρήση μέσου όρου για δεδομένα που λείπουν είναι κακή ιδέα;

Ο

Μέσος μειώνει μια διακύμανση των δεδομένων Μετάβαση βαθύτερα στα μαθηματικά, μια μικρότερη διακύμανση οδηγεί σε μικρότερο διάστημα εμπιστοσύνης στην κατανομή πιθανοτήτων[3]. Αυτό δεν οδηγεί σε τίποτα άλλο από το να εισάγουμε μια προκατάληψη στο μοντέλο μας.

Γιατί οι τιμές που λείπουν είναι πρόβλημα;

Τα δεδομένα που λείπουν παρουσιάζουν διάφορα προβλήματα. Πρώτον, η απουσία δεδομένων μειώνει τη στατιστική ισχύ, η οποία αναφέρεται στην πιθανότητα ότι το τεστ θα απορρίψει τη μηδενική υπόθεση όταν είναι ψευδής. Δεύτερον, τα χαμένα δεδομένα μπορεί να προκαλέσουν μεροληψία στην εκτίμηση των παραμέτρων. Τρίτον, μπορεί να μειώσει την αντιπροσωπευτικότητα των δειγμάτων.

Γιατί ο καταλογισμός μέσου όρου είναι κακός;

Πρόβλημα 1: Ο μέσος όρος ο καταλογισμός δεν διατηρεί τις σχέσεις μεταξύ των μεταβλητών. Είναι αλήθεια ότι η απόδοση του μέσου όρου διατηρεί τον μέσο όρο των παρατηρούμενων δεδομένων. Επομένως, εάν τα δεδομένα λείπουν εντελώς τυχαία, η εκτίμηση του μέσου όρου παραμένει αμερόληπτη.

Θα πρέπει να αντικαταστήσετε τα δεδομένα που λείπουν με τον μέσο όρο;

Τα σημεία δεδομένων εξωγενών θα έχουν σημαντικό αντίκτυπο στον μέσο όρο και επομένως, σε τέτοιες περιπτώσεις, δεν συνιστάται η χρήση του μέσου όρου για την αντικατάσταση των τιμών που λείπουν. Η χρήση μέσων τιμών για την αντικατάσταση τιμών που λείπουν ενδέχεται να μην δημιουργήσει ένα εξαιρετικό μοντέλο και, ως εκ τούτου, αποκλείεται.

Συνιστάται: