Предположим, что популяция, из которой мы предполагаем, что вы выбираете случайно, содержит пропорции промоторов, p 0 пассивов и p - 1 хулителей, с p 1 + p 0 + p - 1 = 1 . Чтобы смоделировать NPS, представьте, что вы заполняете большую шляпу с огромным количеством билетов (по одному на каждого члена вашего населения) с меткой + 1 для промоутеров, 0 для пассивов и - 1 для хулителей в заданных пропорциях, а затем рисуете n образецp1p0p−1p1+p0+p−1=1+10−1n из них наугад. NPS - это средняя стоимость билетов, которые были разыграны. Истинный NPS вычисляется как среднее значение всех билетов в шляпе: это ожидаемое значение (или ожидание ) шляпы.
Хорошей оценкой истинного NPS является образец NPS. Образец NPS также имеет ожидание. Это можно считать средним значением всех возможных выборочных НПВ. Это ожидание оказывается равным истинному NPS. Стандартная ошибка из образца NPS является мерой того , насколько выборочный NPS игровой обычно изменяется от одной случайной выборки и другого. К счастью, нам не нужно вычислять все возможные выборки, чтобы найти SE: его можно найти проще, вычислив стандартное отклонение билетов в шляпе и разделив на . (Небольшая корректировка может быть сделана, когда выборка составляет значительную долю населения, но это вряд ли понадобится здесь.)n−−√
Например, рассмотрит популяцию промоторов, р 0 = 1 / 3 пассивов, а р - 1 = 1 / 6 недоброжелателей. Истинный NPSp1=1/2p0=1/3p−1=1/6
NPS=1×1/2+0×1/3+−1×1/6=1/3.
Дисперсия поэтому
Var(NPS)=(1−NPS)2×p1+(0−NPS)2×p0+(−1−NPS)2×p−1=(1−1/3)2×1/2+(0−1/3)2×1/3+(−1−1/3)2×1/6=5/9.
Стандартное отклонение представляет собой квадратный корень из этого, примерно равна 0.75.
В образце, скажем, , вы бы поэтому ожидать наблюдения NPS около 1 / 3 = 33 % со стандартной погрешностью 0,75 / √3241/3=33около4,1%.0.75/324−−−√=4.1
На самом деле вы не знаете стандартное отклонение билетов в шапке, поэтому вы оцениваете его, используя вместо этого стандартное отклонение вашей выборки. При делении на квадратный корень размера выборки он оценивает стандартную ошибку NPS: эта оценка является пределом погрешности (MoE).
При условии, что вы наблюдаете значительное количество клиентов каждого типа (как правило, около 5 или более из каждого), распределение образца NPS будет близко к нормальному. Это подразумевает, что вы можете интерпретировать МО как обычно. В частности, примерно 2/3 времени, в течение которого выборочный NPS будет находиться в пределах одного МО с истинным NPS, и примерно в 19/20 времени (95%) выборочный NPS будет находиться в двух МО с истинным NPS. В этом примере, если допустимая погрешность действительно составляла 4,1%, мы имели бы 95% уверенности в том, что результат опроса (выборочный NPS) находится в пределах 8,2% от NPS населения.
У каждого опроса будет свой предел погрешности. Чтобы сравнить два таких результата, нужно учесть вероятность ошибки в каждом. Когда размеры обследования примерно одинаковы, стандартная ошибка их разности может быть найдена по теореме Пифагора: взять квадратный корень из суммы их квадратов. Например, если один год МО составляет 4,1%, а другой год - 3,5%, то приблизительная величина погрешности составляет около = 5,4% за разницу в этих двух результатах. В этом случае вы можете с 95% уверенностью заключить, чтоNPSнаселенияизменился от одного опроса к следующему при условии, что разница в результатах двух опроса составляет 10,8% или больше.3.52+4.12−−−−−−−−−√
При сравнении многих результатов опроса с течением времени могут помочь более сложные методы, потому что вам приходится справляться с множеством отдельных погрешностей. Когда пределы погрешности все довольно схожи, грубое правило заключается в том, чтобы рассматривать изменение трех или более МО как «существенное». В этом примере, если МЧ колеблются на уровне около 4%, то на ваше внимание должно обратить внимание изменение на 12% или более в течение нескольких опросов, и более мелкие изменения могут быть отклонены как ошибка обследования. Несмотря на это, анализ и практические правила, представленные здесь, обычно дают хорошее начало, когда думают о том, что могут означать различия между опросами.
001 / n--√ люди).
Вы также можете использовать оценку дисперсии для непрерывных переменных. На самом деле, я бы предпочел это по сравнению с оценкой дисперсии для случайной дискретной переменной, так как есть хорошо известная поправка для расчета выборочной дисперсии: https://en.wikipedia.org/wiki/Unbiased_esvaluation_of_standard_deviation Как другие отмечали, решение Whubers основан на формулах населения. Однако, поскольку вы проводите опрос, я почти уверен, что вы нарисовали выборку, поэтому я бы порекомендовал использовать объективную оценку (деление суммы квадратов на n-1, а не только на n). Конечно, для больших размеров выборки разница между смещенной и несмещенной оценкой практически отсутствует.
Я также рекомендовал бы использовать процедуру t-теста, если у вас средний размер выборки, вместо использования подхода z-счета: https://en.wikipedia.org/wiki/Student 's_t-test
@whuber: поскольку другие тоже об этом спрашивали: как можно рассчитать объективную оценочную выборку для дисперсии / sd для вашего метода случайных дискретных переменных? Я пытался найти его самостоятельно, но безуспешно. Благодарю.
источник
Вы можете потенциально использовать начальную загрузку, чтобы упростить ваши вычисления. В R код будет:
источник