Вопросы с тегом «resampling»

10
Почему тесты гипотез на переделанных наборах данных слишком часто отклоняют нуль?

tl; dr: Начиная с набора данных, сгенерированного под нулевым значением, я повторно проанализировал случаи с заменой и провел проверку гипотезы для каждого повторно выбранного набора данных. Эти проверки гипотез отклоняют ноль более 5% времени. В приведенном ниже очень простом моделировании я...

10
Хороший текст для пересчета?

Может ли группа рекомендовать хороший вводный текст / ресурс по применяемым методам повторной выборки? В частности, меня интересуют альтернативы классическим параметрическим тестам (например, t-тестам, ANOVA, ANCOVA) для сравнения групп, когда такие предположения, как нормальность, явно нарушаются....

9
Передискретизация с категориальными переменными

Я хотел бы выполнить комбинацию передискретизации и недостаточной выборки, чтобы сбалансировать мой набор данных примерно с 4000 клиентами, разделенными на две группы, где доля одной из групп составляет примерно 15%. Я изучил SMOTE ( http://www.inside-r.org/packages/cran/DMwR/docs/SMOTE ) и ROSE (...

9
Можно ли использовать повторную выборку при начальной загрузке для вычисления доверительного интервала для дисперсии набора данных?

Я знаю, что если вы повторно отбираете данные из набора данных и каждый раз вычисляете среднее значение, эти средства будут следовать нормальному распределению (по CLT). Таким образом, вы можете рассчитать доверительный интервал по среднему значению набора данных, не делая никаких предположений о...

9
Размер образцов начальной загрузки

Я изучаю начальную загрузку как средство оценки дисперсии выборочной статистики. У меня есть одно основное сомнение. Цитата из http://web.stanford.edu/class/psych252/tutorials/doBootstrapPrimer.pdf : • Сколько наблюдений мы должны пересчитать? Хорошее предложение - оригинальный размер выборки. Как...

9
Какая модель глубокого обучения может классифицировать категории, которые не являются взаимоисключающими

Примеры: у меня есть предложение в должностной инструкции: «Старший инженер Java в Великобритании». Я хочу использовать модель глубокого обучения, чтобы предсказать ее как 2 категории: English и IT jobs. Если я использую традиционную классификационную модель, она может предсказать только 1 метку с...