Determinarea mărimii eșantionului 1

Determinarea mărimii eșantionului

Mai devreme ne-am uitat la metode pentru construirea unui interval de încredere pentru așteptările populației generale. În fiecare dintre aceste cazuri, prefixat mărimea eșantionului, care nu ia în considerare lățimea intervalului de încredere. determină mărimea eșantionului este dificil în aplicații reale. Aceasta depinde de disponibilitatea resurselor financiare, de timp și ușurința de a crea eșantionului. 1 De exemplu, în cazul în care avem nevoie pentru a estima valoarea medie a facturilor sau a miza facturi false în sistemul de calculatoare a companiei, trebuie să găsească mai întâi, cât de exacte ar trebui să fie evaluarea. Cu alte cuvinte, este necesar să se stabilească eroarea de eșantionare este permisă evaluarea fiecărui parametru. Mai mult decât atât, este necesar să se stabilească în estimarea încrederii în avans a parametrului adevărat în populație.

Determinarea dimensiunii eșantionului pentru evaluarea așteptărilor

Pentru a determina mărimea eșantionului necesar pentru a estima populația generală așteptare, ia în considerare valoarea de eroare de eșantionare și nivel de încredere. De asemenea, pentru informații suplimentare cu privire la valoarea abaterii standard. Pentru a obține o formulă pentru a calcula dimensiunea eșantionului, vom începe cu formula (1) (originea formulei vedea de construcție a intervalului de încredere pentru așteptarea întregii populații.):

unde h - valoarea medie a probei, Z - standardizată valoare distribuită în mod normal, variabila aleatoare corespunzătoare probabilității cumulative de 1 - α / 2. σ - abaterea standard a populației, n - mărimea eșantionului

În această formulă, valoarea care se adaugă și se scade din X. egală cu jumătate din lungimea intervalului. Aceasta determină măsura erorii care apar din cauza unei erori de eșantionare, care este notată cu e, și se calculează cu formula

Rezolvarea ecuației (2) în raport cu n. obținem:

Astfel, pentru a determina mărimea eșantionului trebuie să știți trei parametri:



  1. Nivelul de încredere necesar care afectează magnitudinea de care este o valoare Z. critică standardizată de distribuție normală; 2

  2. eșantionaj eroare e;

  3. Abaterea standard sigma.

În practică, pentru a calcula aceste valori nu este ușor. Cum pentru a determina nivelul de încredere și eroarea de eșantionare? Răspunsul obișnuit la această întrebare nu poate fi decât experți în zona de subiect (de exemplu, oameni care înțeleg semnificația valorilor estimate). Ca regulă generală, nivelul de încredere este de 95% (în acest caz, Z = 1,96). 3 Dacă este necesar pentru a ridica nivelul de încredere este selectată în mod obișnuit valoare egală cu 99%. În cazul în care este posibil să se restricționeze un nivel de încredere mai mic, este selectat 90%. Definirea erorii de eșantionare, nu este necesar să se gândească la ea cantitatea (în principiu, orice eroare este de nedorit). Ar trebui stabilită o astfel de eroare la rezultatele obținute permit o interpretare rezonabilă.

În plus față de nivelul de încredere și eroarea de eșantionare, este necesar să se cunoască deviația standard a populației. Din păcate, această opțiune este greu de cunoscut-o vreodată. În unele cazuri, abaterea standard a populației poate fi estimată pe baza studiilor anterioare. În alte situații, expertul poate lua în considerare domeniul de aplicare al eșantionare și distribuția variabilei aleatoare. De exemplu, în cazul în care populația generală are o distribuție normală, magnitudinea sa este aproximativ egală 6σ (adică ± 3σ în vecinătatea de așteptare). Prin urmare, deviația standard este aproximativ egală cu o șesime din gama. În cazul în care magnitudinea σ este imposibil de estimat în acest mod, pilotul trebuie să efectueze și să calculeze deviația standard a rezultatelor.

Exemplul 1. Să ne întoarcem la problema auditului. Să presupunem că din sistemul informatic extras un eșantion format din 100 de bancnote, completate pe parcursul ultimei luni. Compania vrea să construiască intervalul care conține speranța matematică din totalul populației, nivelul de încredere este egal cu 95%. După cum s-a determinat mărimea eșantionului? Fie pentru actualizare?

Să presupunem că, după consultarea cu experți care lucrează în cadrul companiei, a stabilit o eroare de eșantionare statistică permisă de ± 5 dolari și de încredere. - 95%. Rezultatele studiilor anterioare arată că deviația standard a populației este aproximativ egală cu $ 25. Astfel, e = 5, σ = 25 și Z = 1,96 (care corespunde unui nivel de încredere de 95%). Conform formulei (3) obținem:

Prin urmare, n = 96. Astfel, o mărime a eșantionului de 100 a fost ales în mod convenabil și corespunde cerințelor impuse de societate.

Exemplul 2: Un tip de companie industrială din Midwest produce izolatori electrici. Dacă în timpul izolatorul nu reușește, are loc un scurt-circuit. Pentru a testa puterea de izolator, compania este de testare, în timpul căreia a determinat forța maximă necesară pentru a rupe izolator. Rezistența este măsurată în sarcină lire, ceea ce duce la distrugerea izolatorului (Fig. 1, coloana A). Să presupunem că avem nevoie pentru a estima rezistența medie fractură a izolatorului, cu o precizie de 25 de lire sterline, la un interval de încredere de 95% pentru această valoare. Datele obținute într-un studiu anterior indică faptul că abaterea standard este de 100 de lire sterline. Se determină volumul eșantionului necesar.

Decizie. Astfel, e = 25, σ = 100, 95% nivel de încredere (adică Z = 1,96) (Fig. 1).

Determinarea mărimii eșantionului 1

Fig. 1. Determinarea mărimii eșantionului

Astfel, n = 62 (rezultatele fractionare sunt de obicei rotunjite la cel mai apropiat întreg excesul).

Determinarea dimensiunii eșantionului pentru caracteristica de evaluare proporția în populație

Am revizuit metoda de determinare a mărimii eșantionului pentru estimarea așteptărilor matematice din totalul populației. Să presupunem acum că avem nevoie pentru a determina proporția de cheltuieli generale, care nu sunt conforme cu normele adoptate de societate (a se vedea condițiile inițiale. Exemplul 1 de mai sus). Cât de mult deasupra capului care urmează să fie extrase din sistemul de informații, în scopul de a construit intervalul a dat nivel de încredere? Pentru a răspunde la această întrebare, aplicăm aceeași abordare ca și pentru determinarea mărimii eșantionului pentru estimarea așteptărilor matematice.

eroare de eșantionare este determinată prin formula (2). Atunci când se evaluează proporția caracteristicii valoare σ ar trebui să fie înlocuită cu suma. Astfel, formula de eroare de eșantionare ia forma:

Exprimându n via celelalte mărimi, obținem următoarea formulă:

Astfel, pentru a determina mărimea eșantionului trebuie să știți trei parametri:



  1. Nivelul dorit de încredere, care identifică valoarea Z.

  2. Admisibila eroarea de eșantionare e.

  3. Adevărata rată de succes p.

În practică, pentru a calcula aceste valori nu este ușor. Dacă nivelul de încredere este cunoscut, este posibil să se calculeze valoarea critică a standardizat Z. distribuție normală Prelevarea de probe de eroare este, determină precizia cu care ponderea estimată a succese în populație. A treia opțiune - proporția de succese în populația p - aceasta este opțiunea pe care trebuie să evaluăm. Deci, cum să evalueze intervalul de variație p pe valorile sale de probă?

Există două moduri. În primul rând, în multe situații, pentru a evalua valoarea p se poate folosi rezultatele studiilor anterioare. În al doilea rând, în cazul în care datele din studiile anterioare nu sunt disponibile, puteți încerca să estimeze parametrul p, astfel încât să se evite o subestimare a dimensiunii eșantionului. Rețineți că în formula (5) valoarea p (1 - p) este în numărător. Prin urmare, este necesar să se găsească valoarea maximă a acestei cantități. Evident, este realizat cu p = 0.5.

Astfel, în cazul în care semnul proporția p în necunoscut populația generală în prealabil, pentru a determina mărimea eșantionului trebuie setat p = 0.5. În acest caz, dimensiunea eșantionului va fi supraestimate, ceea ce duce la costuri suplimentare pentru producția sa. În cazul în care proporția de adevărat succes în rândul populației diferă de 0,5, intervalul de încredere va fi mult mai îngust decât este necesar. Evaluarea parametrului p, în acest caz, va fi foarte exacte, dar va trebui să plătească timp suplimentar și resursele financiare mi.

Să ne întoarcem la problema auditului. Să presupunem că auditorul dorește să construiască un interval care conține eroare fracțiunea de vârf, nivelul de încredere este egal cu 95%. Precizia admisă este de ± 0,07. Rezultatele testelor anterioare indică faptul că proporția de facturi false nu depășește 0,15. Astfel, e = 0,07, p = 0,15 și Z = 1,96 (care corespunde unui nivel de încredere de 95%). Conform formulei (5), obținem:

Astfel, o dimensiune a eșantionului de 100 a fost ales în mod corect și să respecte pe deplin cerințele prezentate de companie.

Determinarea mărimii eșantionului extras din populația generală finit

Pentru a determina volumul eșantionului extras dintr-o populație generală finită fără posibilitate de înlocuire, este necesar să se utilizeze factorul de corecție. De exemplu, eroarea de eșantionare în evaluarea așteptarea se calculează după cum urmează:

În evaluarea ponderii de eroare de eșantionare caracteristică este:

Pentru a calcula dimensiunea eșantionului pentru evaluarea caracteristicii așteptare sau de acțiune, se aplică formula:

în cazul în care N0 - mărimea eșantionului cu excepția unui factor de corecție finală pentru întreaga populație. Aplicarea rezultatelor factorului de corectie în următoarea formulă:

Articolul anterior Construirea intervalului de încredere pentru așteptările populației

Înapoi la Cuprins Statistici pentru manageri utilizând Microsoft Excel


2? Pentru a determina valoarea mărimii eșantionului este utilizată în loc de Z. t. pentru a calcula valorile t de dimensiunea critică a eșantionului trebuie să fie cunoscute în prealabil. In cele mai multe cazuri, dimensiunile eșantioanelor permit bine aproximată prin distribuție t într-o distribuție normală standardizată.


3? Nivelul c Interval de încredere de 95% este împărțit în două părți egale. Prima parte este în stânga speranța matematică din totalul populației, iar al doilea - pe dreapta. Valoarea lui Z, probabilitatea corespunzătoare de 2,5% (0025 pătrat) este egal cu -1.96, iar valoarea lui Z, suprafața totală corespunzătoare de 0975, egal cu 1,96. Pentru a calcula funcția este convenabil de a folosi Excel Z = NORM.ST.OBR (p) unde p - probabilitatea, substituind valorile p1 = 2,5%, și p2 = 97,5%

Determinarea mărimii eșantionului