Расчет размера выборки

Доверительная вероятность ("точность") 85% 90%
95% 97%
99% 99,7%
Доверительный интервал ("погрешность" ± %)
Генеральная совокупность ("всего респондентов")
 
Требуемый размер выборки

Расчет доверительного интервала
("погрешность", ± % )

Доверительная вероятность ("точность")

85% 90%
95% 97%
99% 99,7%

Размер выборки, человек

Генеральная совокупность

Процент ответов

Доверительный интервал  ( ± %)

 

Если размер генеральной совокупности более 1 000 000 или сложно оценить точно иначе чем фразой "ну очень много" — можно просто оставить поле пустым.

Пояснения

Доверительная вероятность показывает, с какой вероятностью случайный ответ попадет в доверительный интервал. Для простоты можно понимать её как точность выборки. Как правило, используется 95%, но в условиях малых бюджетов и для небольших выборок, когда высокая точность не нужна, вероятностью можно пожертвовать и понизить её уровень до 90% и даже до 85% (главное не забыть учесть это в процессе анализа и в выводах). И наоборот, чем большую выборку может себе позволить исследователь, тем выше можно установить точность полученных данных.

Доверительный интервал можно понимать как погрешность, задает размах части кривой распределения по обе стороны от выбранной точки, куда могут попадать ответы.

Необходимы пояснения для тех, кто в первый раз сталкивается с понятиями доверительной вероятности и доверительного интервала. Например, выборка в 384 человека для генеральной совокупности более 500 000 человек (например, один из административных округов Москвы) означают доверительную вероятность 95% и доверительный интервал ±5%. То есть при проведении 100 исследований с такой выборкой (384 человека) в 95 процентов случаев получаемые ответы по законам статистики будут находиться в пределах ±5% от исходного.

Если еще упростить то, опросив 384 человка из полумиллиона и получив искомое значение "Х", можно утверждать, что 95% человек или 475 000 ответов попадут в интервал Х±5%, оставшиеся 25 000 ответов попадут "пальцем в небо", то есть за пределы полученного интервала.

Процент ответов . Применяемая формула предполагает, что на заданный вопрос существует два варианта ответа "да" или "нет", "белый" или "черный" и так далее. Чем более равноценны оба варианта ответов, чем ближе пропорция к 50/50, тем бОльшую выборку надо брать. Поэтому если это соотношение заранее неизвестно (а это как правило так и бывает до начала исследований), то надо ставить 50 %. По умолчанию именно такой вараинт и установлен в формуле калькулятора. Наоборот, проведя исследования и зная процент можно скорректировать доверительный интервал, полученный по факту.

Применяемые Формулы

Формулы расчета размера выборки, применяемые в калькуляторе.

Размер Выборки

SS =  
Z2 * (p) * (1-p)

C2

где:

Z = Z фактор (например 1,96 для 95% доверительного интервала)
p = процент интересующих респондентов или ответов,
в десятичной форме (0,5 по умолчанию)
c = доверительный интервал, в десятичной форме
(например, 0,04 = ±4%)

Корректировка для малой генеральной совокупности

SS

CSS =
1 +
ss-1

pop

где:

ss = размер выборки
css = скорректированная выборка
pop = генеральная совокупность