Curbele de distribuție - studopediya
Cel mai sigur mod de a identifica modele de distribuție - creșterea numărului de observații. Pe măsură ce numărul de observații (în cadrul aceleiași populații omogene), reducând în același timp valoarea caracteristicii model de interval pentru o anumită distribuție, va acționa mai mult și mai clar, dar care arată rupt poligonul de frecvență linie este mai aproape de o linie netedă și în limita ar trebui să rândul său, într-o linie curbă.
Curba, care reflectă modificarea configurației de frecvență într-un loc curat, exclude influența factorilor accidentali ca numita curba de distribuție.
În prezent am investigat un număr semnificativ de diferite forme de distribuție. În practică, studiile statistice utilizate adesea Raspredelenie Puassona, Maxwell, în special o distribuție normală. Distribuție aproape de distribuția normală, au fost găsite în studiul unei game largi de fenomene atât în natură cât și în dezvoltarea societății.
Caracteristici ale curbei normale:
• curba este simetrică în raport ordonata maximă care corespunde valorii = Mo = Me, valoarea sa este egală cu
• Curba are două puncte de inflexiune situate la o distanță de ±;
• Curba se apropie asimptotic axa x, extinse în ambele direcții la infinit; cu atât mai mare valorile de deviere ale lui x. cu atât mai puțin de multe ori acestea apar;
• în cazul în care o curbă cu creșterea devine mai puțin adâncă; atunci când o schimbare în curba nu se schimba forma, ci doar mutat spre stânga sau spre dreapta pe axa orizontală;
• un decalaj este de 68,3% toate valorile; în intervalul - 95,4% toate valorile; în termen - 99,7% toate valorile.
În practica statistică, de mare interes este întrebarea în ce măsură poate fi considerată ca rezultând din observarea statistică de distribuție caracteristică în populația de studiu, distribuția normală corespunzătoare.
Pentru a rezolva această problemă ar trebui să fie calculată teoretic
frecvența distribuției normale, t. e. aceste frecvențe
Ar fi fost dacă această distribuție este urmat exact o distribuție normală. Formula este utilizată pentru a calcula frecvențele teoretice:
în cazul în care - deviația standard;
Valoarea determinată de o masă specială (a se vedea. Anexa 1 Workshop).
În consecință, în funcție de frecvența teoretică (coloana 9 din tabelul 5.2.) Sunt determinate pentru fiecare dintr-un număr de interval empiric.
Pentru a verifica proximitatea distribuțiile teoretice și empirice sunt indicatori speciali, numit criteriile de acord. Cea mai comună este bunătatea Pearson ( „chi-pătrat“). calculat cu formula:
în care - frecvențele empirice (frecvența relativă) în intervalul;
- frecvențele teoretice (frecvența relativă) în intervalul.
Criteriul valoarea nominală primită este comparată cu valoarea intabulate, care se determină conform unui tabel special (a se vedea. Workshop anexa 2) în funcție de probabilitatea primită (P) și numărul de grade de libertate (pentru distribuția normală este egal cu numărul de grupuri într-o alocare rând minus 3). Pentru acest exemplu k = 2; P = 0,95; = 5,99.
Dacă există o ipoteză cu privire la gradul de apropiere a distribuției empirice la normal nu este respins.
La calcularea condițiilor de testare Pearson trebuie observat: numărul de observații trebuie să fie suficient de mare (n> 50); dacă frecvența teoretică în anumite intervale de timp este mai mică de 5, intervalele sunt combinate, astfel încât frecvența a fost mai mare de 5.
Utilizarea valorii VI Romanovsky propuse pentru a evalua gradul de apropiere a distribuției empirice a curbei de distribuție normală prin:
, (5,49), în cazul în care - numărul de grade de libertate;
este numărul de parametri ai unei legi de distribuție teoretică (pentru distribuția normală);
În acest exemplu, valoarea criteriului calculat egal cu 0,2, prin urmare, poate fi luată ca ipoteză caracterul distribuției empirice normale.
Criteriul A. N. Kolmogorova se bazează pe determinarea valorilor maxime (în mărime), diferența dintre distribuțiile de frecvență cumulative ale empirice și teoretice (d), un grafic din Tabelul 11. 5.2:
O condiție necesară pentru utilizarea unui criteriu Kolmogorov este un număr suficient de mare de cazuri (cel puțin 100).
Prin valorile din tabele de probabilitate - criteriul sunt asociate de probabilitate (P). Dacă valoarea găsită corespunde celei mai mari probabilitate semnificativă (P), diferențele dintre distribuții teoretice și empirice nesemnificative (a se vedea. Tabelul. Anexa 1 la curs, P = 0,999).
În plus față de aceste criterii pentru a evalua respectarea cu acordul atât distribuția empirică sunt grupate și datele nu sunt grupate în legea normală poate testa inegalitățile:
Rețineți că, pentru această problemă, ambele inegalități sunt îndeplinite.
Importanța practică și științifică este Raspredelenie Puassona. Este tipic pentru evenimente rare, de aceea este numită „legea evenimentelor rare“ (sau „legea numerelor mici“).
legea lui Poisson se aplică populațiilor care sunt suficient de mari în ceea ce privește (n> 100) și având o suficient de mică proporție de unități care au trăsăturii (), de exemplu, pentru distribuirea loturilor de produse finite în funcție de numărul de produse defecte, paginile imprimate în funcție de numărul de greșeli de tipar, mașini în funcție de numărul de eșecuri, războaie de țesut cu privire la numărul de întreruperi cu incandescență, și așa mai departe. d.
distribuția teoretică frecvență Poisson definită prin formula:
în cazul în care - numărul total de încercări independente;
- numărul mediu de apariție a unui eveniment rar în aceeași testare independente;
- frecvența evenimentelor (= 0,1,2.);
e - baza logaritmilor naturali, e = 2,71828.
Valoarea determinată de un tabel special (apendicele 8);
- produs de 1 * 2 * 3 *; 0! - este considerat a fi egal cu unu.
Gradul de discrepanță între frecvențele teoretice și empirice este evaluată pe baza unor criterii de consimțământ.