Вопросы с тегом «sample-size»

12
Насколько большой должна быть выборка для данной методики и параметров оценки?

Существует ли эмпирическое правило или вообще какой-либо способ сказать, насколько большой должна быть выборка, чтобы оценить модель с заданным количеством параметров? Так, например, если я хочу оценить регрессию наименьших квадратов с 5 параметрами, насколько большой должна быть выборка? Имеет ли...

12
Определить размер выборки перед началом эксперимента или запустить эксперимент на неопределенный срок?

Я изучал статистику несколько лет назад и забыл все это, поэтому они могут показаться общими концептуальными вопросами, а не чем-то конкретным, но вот моя проблема. Я работаю на сайте электронной коммерции как UX Designer. У нас есть система A / B-тестирования, созданная много лет назад, и я...

12
Статистическая значимость разницы между расстояниями

У меня есть более 3000 векторов на двумерной сетке с приблизительно равномерным дискретным распределением. Некоторые пары векторов удовлетворяют определенному условию. Примечание: условие применимо только к парам векторов, а не к отдельным векторам. У меня есть список из примерно 1500 таких пар,...

12
Параметрический расчет размера выборки и непараметрический анализ

Мне любопытно узнать, есть ли у кого-нибудь конкретная ссылка (текстовая или журнальная статья), чтобы поддержать общепринятую в медицинской литературе практику расчета размера выборки с использованием параметрических методов (т. Е. Предполагающих нормальное распределение и определенную дисперсию...

12
Формула размера выборки для F-теста?

Мне интересно, есть ли формула размера выборки, такая как формула Лера, которая применима к F-тесту? Формула Лера для t-тестов имеет вид , где Δ - величина эффекта ( например, Δ = ( μ 1 - μ 2 ) / σ ). Это может быть обобщена на п = с / Δ 2 , где с является константой , которая зависит от скорости I...

12
Число 20 волшебство?

У меня есть ссылки, в которых рекомендуется учитывать размер выборки не менее 20 для распределения данных. Есть ли в этом смысл?

11
SurveyMonkey игнорирует тот факт, что вы получаете неслучайный образец?

SurveyMonkey имеет шаги и диаграмму, чтобы вы могли определить, какой размер выборки вам нужен для данного диапазона погрешности или доверительного интервала, исходя из размера вашей популяции. Размер выборки SurveyMonkey Эта диаграмма просто игнорирует тот факт, что вы не получите случайную...

11
Почему большой выбор K понижает мою оценку перекрестной проверки?

Играя с набором данных Boston Housing Dat и RandomForestRegressor(с параметрами по умолчанию) в scikit-learn, я заметил кое-что странное: средний балл перекрестной проверки уменьшился, когда я увеличил число сгибов выше 10. Моя стратегия перекрестной проверки была следующей: cv_met =...

11
R / mgcv: Почему тензорные продукты te () и ti () производят разные поверхности?

mgcvПакет Rимеет две функции для установки взаимодействия Тензор продукта: te()и ti(). Я понимаю основное разделение труда между ними (подгонка нелинейного взаимодействия против разложения этого взаимодействия на основные эффекты и взаимодействие). Чего я не понимаю, так это почему te(x1, x2)и...

11
Размер выборки, необходимый для определения, какой из набора рекламных объявлений имеет самый высокий рейтинг кликов.

По профессии я дизайнер программного обеспечения и работаю над проектом для клиента, и я хотел бы убедиться, что мой анализ является статистически обоснованным. Подумайте над следующим: у нас есть n рекламных объявлений (n <10), и мы просто хотим знать, какое объявление работает лучше всего. Наш...

11
Подходит ли начальная загрузка для этих непрерывных данных?

Я полный новичок :) Я делаю исследование с размером выборки 10 000 человек из примерно 745 000 человек. Каждый образец представляет «процентное сходство». Подавляющее большинство выборок составляет около 97% -98%, но некоторые составляют от 60% до 90%, то есть распределение сильно искажено. Около...

11
Расчет размера выборки для одномерной логистической регрессии

Как рассчитать размер выборки, необходимый для исследования, в котором когорта субъектов будет иметь одну непрерывную переменную, измеренную во время операции, а затем через два года они будут классифицированы как функциональный результат или результат с нарушением. Мы хотели бы посмотреть, могло...

11
Что означает, что исследование перегружено?

Что означает, что исследование перегружено? У меня сложилось впечатление, что это означает, что ваши размеры выборки настолько велики, что вы можете обнаружить мельчайшие размеры эффекта. Эти величины эффекта, возможно, настолько малы, что они более вероятны в результате незначительных отклонений в...

10
Как выбрать размеры набора для обучения, перекрестной проверки и тестирования для данных небольшого размера?

Предположим, у меня небольшой размер выборки, например, N = 100, и два класса. Как выбрать размеры обучения, перекрестной проверки и тестового набора для машинного обучения? Я бы интуитивно выбрал Размер тренировочного набора 50 Размер набора для перекрестной проверки 25, и Размер теста как 25. Но,...

10
Минимальный размер выборки на кластер в модели случайных эффектов

Существует ли рациональное число наблюдений на кластер в модели случайных эффектов? У меня размер выборки 1500 с 700 кластерами, смоделированными как обменный случайный эффект. У меня есть возможность объединить кластеры, чтобы построить меньше, но больше кластеров. Интересно, как я могу выбрать...

10
Является ли взвешивание, основанное на точности (т.е. обратная дисперсия), неотъемлемой частью мета-анализа?

Является ли основанное на точности взвешивание центральным для мета-анализа? Боренштейн и соавт. (2009) пишут, что для мета-анализа все, что необходимо, это то, что: Исследования сообщают о точечной оценке, которая может быть выражена одним числом. Дисперсия может быть вычислена для этой точечной...

10
Имеет ли смысл рассчитывать доверительные интервалы и проверять гипотезы, когда доступны данные по всей совокупности?

Имеет ли смысл рассчитывать доверительные интервалы и проверять гипотезы, когда доступны данные по всей совокупности? На мой взгляд, ответ - нет, поскольку мы можем точно рассчитать истинные значения параметров. Но тогда, какова максимальная доля данных от первоначального населения, которая...

10
Модель истории дискретного времени (выживания) в R

Я пытаюсь вписать модель с дискретным временем в R, но я не уверен, как это сделать. Я читал, что вы можете организовать зависимую переменную в разных строках, по одной для каждого временного наблюдения, и использовать glmфункцию со ссылкой logit или cloglog. В этом смысле, у меня есть три колонки:...

10
Как сделать репрезентативную выборку из большого общего набора данных?

Каковы статистические методы для создания выборочного набора, который является репрезентативным для всего населения (с известным уровнем достоверности)? Также, Как проверить, соответствует ли образец общему набору данных? Возможно ли это без разбора всего набора данных (который может быть...

10
Альтернативный воронкообразный график, без использования стандартной ошибки (SE)

Перед отправкой моего метаанализа я хочу создать воронкообразный график для проверки на неоднородность и смещение публикаций. У меня есть объединенный размер эффекта и размеры эффекта от каждого исследования, которые принимают значения от -1 до +1. У меня есть размеры выборки n1, n2 для пациентов и...