ο Κανονικός Πίνακας Διανομής, Επεξήγηση

Ο κανονικός τύπος κατανομής βασίζεται σε δύο απλές παραμέτρους - μέση και τυπική απόκλιση - που ποσοτικοποιούν χαρακτηριστικά ενός δεδομένου συνόλου δεδομένων. Ενώ ο μέσος όρος υποδεικνύει την "κεντρική" ή τη μέση τιμή ολόκληρου του συνόλου δεδομένων, η τυπική απόκλιση υποδεικνύει την "εξάπλωση" ή τη μεταβολή των σημείων δεδομένων γύρω από αυτή τη μέση τιμή.

Εξετάστε τους ακόλουθους 2 συνόλου δεδομένων:

Σειρά δεδομένων 1 = {10, 10, 10, 10, 10, 10, 10, 10, 10}

Δέσμη δεδομένων 2 = {6, 8, 10, 12, 14, 14, 12, 10, 8, 6}

Για τη συνάρτηση δεδομένων1, μέση = 10 και τυπική απόκλιση (stddev)

Για το Dataset2, μέσος όρος = 10 και τυπική απόκλιση (stddev) = 2. 83

Ας σχεδιάσουμε αυτές τις τιμές για το DataSet1:

Ομοίως για το DataSet2:

Η τιμή stddev έχει μερικά σημαντικά και χρήσιμα χαρακτηριστικά που είναι εξαιρετικά χρήσιμα στην ανάλυση δεδομένων. Για μια κανονική κατανομή, οι τιμές των δεδομένων κατανέμονται συμμετρικά σε κάθε πλευρά του μέσου όρου. Για κάθε φυσιολογικά κατανεμημένο σύνολο δεδομένων, γράφοντας γράφημα με stddev στον οριζόντιο άξονα και όχι. των τιμών δεδομένων στον κατακόρυφο άξονα, λαμβάνεται το ακόλουθο γράφημα.

Ιδιότητες μιας κανονικής κατανομής

Η κανονική καμπύλη είναι συμμετρική ως προς τον μέσο όρο.

  1. Ο μέσος όρος είναι στη μέση και διαιρεί την περιοχή σε δύο μισά.
  2. Η συνολική επιφάνεια κάτω από την καμπύλη είναι ίση με 1 για μέση τιμή = 0 και stdev = 1.
  3. Η κατανομή περιγράφεται εντελώς με τον μέσο όρο και stddev
  4. Όπως φαίνεται από το παραπάνω γράφημα, το stddev αντιπροσωπεύει τα εξής:

68. 3%

  • των τιμών δεδομένων είναι 1 τυπική απόκλιση της μέσης τιμής (-1 έως +1) 95. 4%
  • των τιμών δεδομένων είναι 2 τυπικές αποκλίσεις της μέσης τιμής (-2 έως +2) 99. 7%
  • των τιμών δεδομένων 3 τυπικές αποκλίσεις της μέσης τιμής (-3 έως +3) Η περιοχή κάτω από την καμπύλη σχήματος καμπάνας, όταν μετριέται, υποδεικνύει την επιθυμητή πιθανότητα μιας δεδομένης περιοχή:

μικρότερη από X: -

  • e. σολ. πιθανότητα των τιμών των δεδομένων να είναι μικρότερες από 70 μεγαλύτερες από X -
  • e. σολ. πιθανότητα των τιμών των δεδομένων να είναι μεγαλύτερες από 95 μεταξύ X
  • 1 και X 2 - e. σολ. πιθανότητα τιμών δεδομένων μεταξύ 65 και 85 όπου το Χ είναι τιμή ενδιαφέροντος (παραδείγματα παρακάτω).

Η αντιστοίχιση και ο υπολογισμός της περιοχής δεν είναι πάντα βολικά, καθώς διαφορετικά σύνολα δεδομένων θα έχουν διαφορετικές τιμές μέσης και stddev.Για να διευκολυνθεί μια ομοιόμορφη τυποποιημένη μέθοδος για εύκολους υπολογισμούς και δυνατότητα εφαρμογής σε προβλήματα πραγματικού κόσμου, εισήχθη η τυπική μετατροπή σε τιμές Ζ, οι οποίες αποτελούν το τμήμα του

Πίνακα Κανονικής Διανομής . Z = (X - μέση τιμή) / stddev, όπου X είναι η τυχαία μεταβλητή.

Βασικά, αυτή η μετατροπή αναγκάζει το μέσο και το stddev να τυποποιηθούν σε 0 και 1 αντίστοιχα, πράγμα που επιτρέπει τον εύκολο υπολογισμό ενός καθορισμένου συνόλου τιμών Z (από τον

Κανονικό πίνακα διανομής ) . Μια στιγμιαία απεικόνιση του τυπικού πίνακα τιμών z που περιέχει τις πιθανότητες είναι η εξής: z

0. 00

0. 01

0. 02

0. 03

0. 04

0. 05

0. 06

0. 0

0. 00000

0. 00399

0. 00798

0. 01197

0. 01595

0. 01994

...

0. 1

0. 0398

0. 04380

0. 04776

0. 05172

0. 05567

0. 05966

...

0. 2

0. 0793

0. 08317

0. 08706

0. 09095

0. 09483

0. 09871

...

0. 3

0. 11791

0. 12172

0. 12552

0. 12930

0. 13307

0. 13683

...

0. 4

0. 15542

0. 15910

0. 16276

0. 16640

0. 17003

0. 17364

...

0. 5

0. 19146

0. 19497

0. 19847

0. 20194

0. 20540

0. 20884

...

0. 6

0. 22575

0. 22907

0. 23237

0. 23565

0. 23891

0. 24215

...

0. 7

0. 25804

0. 26115

0. 26424

0. 26730

0. 27035

0. 27337

...

...

...

...

...

...

...

...

... ... , στρογγυλοποιήστε το πρώτο με 2 δεκαδικά ψηφία (δηλ. 0,24). Στη συνέχεια, ελέγξτε για τα πρώτα 2 σημαντικά ψηφία (0,2) στις σειρές και για το λιγότερο σημαντικό ψηφίο (υπόλοιπο 0,4) στη στήλη. Αυτό θα οδηγήσει σε τιμή 0. 09483.

Ο πλήρης κανονικός πίνακας διανομής, με ακρίβεια έως και 5 δεκαδικούς για τις τιμές πιθανότητας (συμπεριλαμβανομένων και των αρνητικών τιμών), μπορεί να βρεθεί εδώ.

Ας δούμε κάποια παραδείγματα πραγματικής ζωής. Το ύψος των ατόμων σε μια μεγάλη ομάδα ακολουθεί ένα κανονικό μοτίβο διανομής. Ας υποθέσουμε ότι έχουμε ένα σύνολο 100 ατόμων των οποίων τα ύψη καταγράφονται και τα μέσα και stddev υπολογίζονται σε 66 και 6 ίντσες αντίστοιχα.

Ακολουθούν μερικές ερωτήσεις που μπορείτε εύκολα να απαντήσετε χρησιμοποιώντας τον πίνακα τιμών z:

Ποια είναι η πιθανότητα ένα άτομο στην ομάδα να είναι 70 ίντσες ή λιγότερο;

Ερώτηση είναι να βρούμε

  • αθροιστική τιμή

P (X <= 70) i. μι. σε ολόκληρη την ομάδα δεδομένων 100, πόσες τιμές θα είναι μεταξύ 0 και 70.

Ας αρχικά μετατρέψουμε την τιμή Χ του 70 στην ισοδύναμη τιμή Ζ.

Z = (X - μέση τιμή) / stddev = (70-66) / 6 = 4/6 = 0. 66667 = 0. 67 (γύρο με 2 δεκαδικά ψηφία)

<= 0,67) = 0,24857 (από τον παραπάνω πίνακα ζ)

i. μι. υπάρχει μια πιθανότητα 24. 857% ότι ένα άτομο στην ομάδα θα είναι μικρότερο ή ίσο με 70 ίντσες.

Αλλά κρατήστε πατημένο - τα παραπάνω είναι ελλιπή.Θυμηθείτε, ψάχνουμε για πιθανότητα όλων των πιθανών ύψους έως και 70 ί. μι. από 0 έως 70. Τα παραπάνω σας δίνουν ακριβώς το τμήμα από τη μέση στην επιθυμητή τιμή (δηλ. από 66 έως 70). Πρέπει να συμπεριλάβουμε και το άλλο μισό - από το 0 έως το 66 - για να φτάσουμε στη σωστή απάντηση.

Από το 0 έως το 66 αντιπροσωπεύει το μισό τμήμα (δηλαδή ένα ακραίο έως μέσο μέσο όρο), η πιθανότητα του είναι απλά 0. 5.

Ως εκ τούτου η σωστή πιθανότητα ενός ατόμου να είναι 70 ίντσες ή λιγότερο = 0. 24857 + 0. 5 = 0. 74857 =

74. 857%

Γραφικά (με τον υπολογισμό της περιοχής), αυτές είναι οι δύο αθροισμένες περιοχές που αντιπροσωπεύουν τη λύση: Ποια είναι η πιθανότητα ότι ένα άτομο είναι 75 ίντσες ή υψηλότερο;

i. μι. Βρείτε

  • Συμπληρωματικά

αθροιστικά P (X> = 75). Z = (X - μέση τιμή) / stddev = (75-66) / 6 = 9/6 = 1. 5 P (Z> = 1.5) = 1- P (Z < 5) = 1 - (0. 5 + 0, 43319) = 0. 06681 = 6. 681%

Ποια είναι η πιθανότητα ενός ατόμου να είναι μεταξύ 52 ίντσες και 67 ίντσες;

Βρείτε P (52 <= x <= 67).

  • P (52 <= χ <= 67) = p [(52-66) / 6 <= z <= (67-66) / 6] = p. 17)

= P (Z <= 0. 17) -p (Z <= -0.233) = (0. 5 + 0. 56749) - ο πίνακας διανομής

(και οι τιμές z) χρησιμοποιείται συνήθως για οποιονδήποτε υπολογισμό πιθανοτήτων για τις αναμενόμενες κινήσεις τιμών στη χρηματιστηριακή αγορά για αποθέματα και δείκτες. Χρησιμοποιούνται σε εμπορικές συναλλαγές με βάση το εύρος τιμών, προσδιορίζοντας την ανοδική τάση ή την πτωτική τάση, τα επίπεδα υποστήριξης ή αντοχής και άλλους τεχνικούς δείκτες που βασίζονται σε έννοιες κανονικής διανομής μέσης και τυπικής απόκλισης.