Я - инженер-программист, желающий создать инструмент A / B-тестирования . У меня нет основательной статистики, но за последние несколько дней я немного читал.
Я следую методологии, описанной здесь, и суммирую соответствующие пункты ниже.
Этот инструмент позволит дизайнерам и экспертам по доменам настраивать веб-сайт для разделения трафика, получаемого по определенному URL-адресу, между двумя или более URL-адресами. Например, трафик, поступающий на http://example.com/hello1, можно разделить между http://example.com/hello1 и http://example.com/hello2 . Трафик будет равномерно распределен между целевыми URL-адресами, и будет сравниваться эффективность маркетинговых процессов на каждом из целевых URL-адресов.
В этом эксперименте размер выборки N
будет соответствовать посетителям. Тест будет измерять «конверсии», термин, описывающий, когда посетитель совершает определенное действие в процессе маркетинга. Конверсии выражены в процентах, и желательна более высокая конверсия. Это делает тест сравнения независимых пропорций. Инструмент должен легко использоваться для проведения тестов с безопасными результатами. Выбор подходящего значения N
важен.
В приведенной выше статье для анализа используется силовой анализ двух независимых пропорций N
. Этот метод требует, чтобы заранее знали коэффициент конверсии управления, а также указывали целевое желаемое улучшение конверсии. Он также определяет уровень значимости 95% и статистическую мощность 80%.
Вопросов:
- Это метод определения
N
звука? Если да, то каков самый безопасный способ определения коэффициента пересчета для контроля до начала теста? - Существуют ли надежные способы определения,
N
которые не требуют, чтобы кто-то заранее знал коэффициенты пересчета контроля? - Оправдана ли методика в связанной статье ? Если нет, есть ли какие-нибудь доступные и легко усваиваемые методы, на которые вы могли бы связать меня?
ИМХО, насколько это возможно, пост идет в правильном направлении. Тем не мение:
Предложенный метод неявно делает два предположения: базовый коэффициент конверсии и ожидаемое количество изменений. Размер выборки во многом зависит от того, насколько хорошо вы соответствуете этим предположениям. Я рекомендую вам рассчитать требуемые размеры выборки для нескольких комбинаций p1 и p2, которые вы считаете реалистичными. Это даст вам представление о том, насколько надежным является расчет размера выборки.
Таким образом, если фактический коэффициент конверсии составляет 9% вместо 10%, вам потребуется еще 2000 случаев для каждого сценария, чтобы определить коэффициент конверсии, превышающий базовый показатель на 10% для новой формы.
После завершения теста вы можете рассчитать доверительные интервалы для пропорций на основе ваших фактических наблюдений.
sig.level
источник
Вместо того, чтобы вычислять перекрывающиеся интервалы, вы вычисляете Z-показатель. Это проще реализовать алгоритмически, и вам помогут статистические библиотеки.
Посмотрите: https://onlinecourses.science.psu.edu/stat200/node/53
источник