По профессии я дизайнер программного обеспечения и работаю над проектом для клиента, и я хотел бы убедиться, что мой анализ является статистически обоснованным.
Подумайте над следующим: у нас есть n рекламных объявлений (n <10), и мы просто хотим знать, какое объявление работает лучше всего. Наш рекламный сервер будет случайным образом показывать одну из этих объявлений. Успех, если пользователь нажимает на объявление - наш сервер отслеживает это.
Дано: Доверительный интервал: 95%
Вопрос: Каков примерный размер выборки? (Сколько всего объявлений мы должны показывать), почему? (помни, я дурачок)
благодаря
anova
sample-size
t-test
rule-of-thumb
Джонатан
источник
источник
Ответы:
Вероятно, вам нужен тест Фишера . К сожалению, учитывая вероятную очень низкую частоту кликов и небольшой ожидаемый размер эффекта, вам потребуется огромное N, чтобы достичь желаемого доверительного интервала. Допустим, «истинный» рейтинг кликов вашего лучшего объявления составляет 0,11, а ваш второй лучший показатель - 0,1. Далее, допустим, вы хотите, чтобы вероятность того, что вы ошибочно отклонили нулевую гипотезу (что между двумя объявлениями нет разницы), была бы меньше, чем .20. Если это так, вам понадобится N порядка 10 000.
Как предположил комментатор, вам, скорее всего, не следует беспокоиться о десятипроцентной разнице в эффективности рекламы. При больших различиях необходимый размер образцов быстро уменьшается.
источник