Για να συνοψίσουμε, γενικά εάν η κατανομή των δεδομένων είναι λοξή προς τα αριστερά, ο μέσος όρος είναι μικρότερος από τον διάμεσο, που είναι συχνά μικρότερος από τον τρόπο λειτουργίας. Εάν η κατανομή των δεδομένων είναι λοξή προς τα δεξιά, η λειτουργία είναι συχνά μικρότερη από τη διάμεσο, η οποία είναι μικρότερη από τη μέση.
Γιατί η διάμεσος επηρεάζεται λιγότερο από λοξά δεδομένα;
Γιατί η διάμεσος επηρεάζεται λιγότερο από λοξά δεδομένα από τη μέση; Ωστόσο, καθώς τα δεδομένα γίνονται λοξά, ο μέσος όρος χάνει την ικανότητά του να παρέχει την καλύτερη κεντρική θέση για τα δεδομένα, επειδή τα λοξά δεδομένα τα απομακρύνουν από την τυπική τιμή.
Γιατί η διάμεσος είναι καλύτερη για λοξά δεδομένα;
Για κατανομές που έχουν ακραίες τιμές ή είναι λοξές, η διάμεσος είναι συχνά το προτιμώμενο μέτρο της κεντρικής τάσης επειδή η διάμεσος είναι πιο ανθεκτική σε ακραίες τιμές από τη μέση… Σημειώστε ότι ο μέσος όρος τραβιέται προς την κατεύθυνση της λοξότητας (δηλαδή, την κατεύθυνση της ουράς).
Όταν είναι λοξό προς τα δεξιά, ο μέσος όρος είναι διάμεσος;
Για μια δεξιά λοξή κατανομή, ο μέσος όρος είναι συνήθως μεγαλύτερος από τη διάμεσο Παρατηρήστε επίσης ότι η ουρά της κατανομής στη δεξιά πλευρά (θετική) είναι μεγαλύτερη από την αριστερή πλευρά. Από το διάγραμμα κουτιού και μουστάκι μπορούμε επίσης να δούμε ότι η διάμεσος είναι πιο κοντά στο πρώτο τεταρτημόριο από το τρίτο τεταρτημόριο.
Πώς επηρεάζει η λοξότητα τα δεδομένα;
Επιπτώσεις λοξότητας
Εάν υπάρχει υπερβολική λοξότητα στα δεδομένα, τότε πολλά στατιστικά μοντέλα δεν λειτουργούν, αλλά γιατί. Έτσι, στα λοξά δεδομένα, η περιοχή ουράς μπορεί να λειτουργεί ως ακραίο στοιχείο για το στατιστικό μοντέλο και γνωρίζουμε ότι οι ακραίες τιμές επηρεάζουν αρνητικά την απόδοση του μοντέλου, ειδικά τα μοντέλα που βασίζονται σε παλινδρόμηση.