Съдържание:
За да се правят оценки за населението, статистиците използват случайна представителна извадка от населението. Например, ако тежите 50 случайни американски жени, можете да прецените теглото на всички американски жени въз основа на тяхното средно тегло. Грешка при извадката възниква, когато вашите примерни резултати се отклоняват от истинската стойност на популацията. Това е, ако 50 жени дават средно тегло от 135 паунда, когато истинската средна стойност е 150 паунда, тогава вашата пробна грешка е -15 (наблюдаваното минус действително), което означава, че сте подценили истинската стойност с 15 точки. Тъй като истинската стойност е рядко известна, статистиците използват други оценки, като стандартна грешка и доверителни интервали, за да оценят грешката на извадката.
стъпка
Изчислете процента, който измервате. Например, ако искате да знаете какъв процент от учениците в дадено училище пушат цигари, вземете случайна извадка (да речем n, размерът на нашата извадка е равен на 30), накарайте ги да попълнят анонимно проучване и да изчислят процента на ученици, които казват, че пушат. За илюстрация, да кажем, шест ученика казаха, че пушат. Тогава процентът на пушещите = (# които пушат) / (общо # измерени студенти) x 100% = 6/30 x 100% = 20%.
стъпка
Изчислете стандартната грешка. Тъй като не знаем действителния процент на студентите, които пушат, можем само да приближим извадковата грешка, като изчислим стандартната грешка. В статистиката използваме пропорция, p, вместо проценти за изчисления, така че нека превърнем 20% в пропорция. Разделяйки 20% от 100%, получавате p = 0.20. Стандартна грешка (SE) за големи пробни размери = sqrt p x (1 - p) / n, където sqrt x означава да вземем квадратен корен от x. В този пример получаваме SE = sqrt 0.2 x (0.8) / 30 = sqrt 0.00533…? 0.073.
стъпка
Създайте доверителен интервал. Долна граница: оценено съотношение - 1.96 x SE = 0.2 - 1.96 (0.073) = 0.0569 Горна граница: оценено съотношение + 1.96 x SE = 0.2 + 1.96 (0.073) = 0.343 Така че бихме казали, че сме 95% уверени в истинския дял на пушачите е между 0.0569 и 0.343, или като процент, 5.69% или 34.3% от студентите пушат. Това широко разпространение показва възможността за доста голяма грешка на извадката.
стъпка
Измерете всички, за да изчислите точната грешка на извадката. Накарайте всички ученици в училището да завършат анонимното проучване и да изчислят процента на учениците, които казват, че пушат. Да кажем, че 120 от 800 ученици са казали, че пушат, тогава процентът ни е 120/800 х 100% = 15%. Следователно, нашата "грешка на извадката" = (приблизителна) - (действителна) = 20 - 15 = 5. Колкото по-близо до нула, толкова по-добра е нашата оценка и по-малката нашата грешка за вземане на проби се казва. В реална ситуация обаче няма вероятност да знаете действителната стойност и ще трябва да разчитате на SE и интервала на доверие за тълкуване.