Вопросы с тегом «sampling»

15
Какова интуиция за сменными образцами при нулевой гипотезе?

Тесты перестановки (также называемые тестом рандомизации, тестом повторной рандомизации или точным тестом) очень полезны и оказываются полезными, когда предположение о нормальном распределении, требуемое, например, t-testне выполняется, и когда преобразование значений путем ранжирования...

15
Какова процедура «начальной загрузки» (иначе говоря, «перекрестная проверка с повторной выборкой»)?

«Проверка правильности начальной загрузки» / «перекрестная проверка повторной выборки» является новой для меня, но обсуждалась путем ответа на этот вопрос . Я собираю, что это включает 2 типа данных: реальные данные и моделируемые данные, где данный набор моделируемых данных генерируется из...

15
Как я могу оценить уникальные числа случаев по случайной выборке данных?

Допустим, у меня есть большой набор значений которые иногда повторяются. Я хочу оценить общее количество уникальных значений в большом наборе.SSS Если я возьму случайную выборку значений и определю, что она содержит уникальные значения T u , могу ли я использовать это для оценки количества...

14
Управление ошибками с помощью GPS-маршрутов (теоретическая основа?)

Я ищу подходящую теоретическую базу или специальность, чтобы помочь мне разобраться, как справляться с ошибками, которые имеет система GPS - особенно при работе с маршрутами. По сути, я ищу требования к данным и любые алгоритмы, чтобы использовать, чтобы иметь возможность установить длину следа....

14
Известен ли этот метод пересчета временных рядов в литературе? У него есть имя?

Недавно я искал способы повторной выборки временных рядов таким образом, чтобы Приблизительно сохраняйте автокорреляцию длительных процессов памяти. Сохраните область наблюдений (например, пересчитанный временной ряд целых чисел все еще является временным рядом целых чисел). Может влиять только на...

14
Лучшие учебники по повторной выборке Bootstrap?

Я просто хотел спросить, какие, по вашему мнению, лучшие из доступных книг по начальной загрузке. Я имею в виду не только то, что написано его разработчиками. Не могли бы вы указать, какой учебник, по вашему мнению, лучше всего подходит для начальной загрузки и отвечает следующим критериям?...

14
Столкновение двух миров: использование ML для сложных данных обследования

Я поражен, казалось бы, легкой проблемой, но я не нашел подходящего решения уже несколько недель. У меня довольно много данных опроса / опроса (десятки тысяч респондентов, скажем, 50 тыс. На набор данных), полученных из чего-то, что, я надеюсь, называется комплексным опросом с весами,...

14
Как извлечь случайные выборки из непараметрического оценочного распределения?

У меня есть выборка из 100 точек, которые являются непрерывными и одномерными. Я оценил его непараметрическую плотность, используя методы ядра. Как я могу получить случайные выборки из этого предполагаемого...

14
Карет глмнет против cv.glmnet

Кажется, существует большая путаница при сравнении использования glmnetвнутри caretдля поиска оптимальной лямбды и использования cv.glmnetдля выполнения той же задачи. Было задано много вопросов, например: Модель классификации train.glmnet против cv.glmnet? Как правильно использовать glmnet с...

14
Почему (?) Статистическая выборка должна работать для политики (например, Gallup)?

Опросы, проводимые там (скажем, Gallup), показывают неимоверно низкое количество людей по сравнению с численностью населения (например, возможно, тысяча человек из сотен миллионов). Теперь для меня выборка населения как средство оценки статистики населения имеет смысл, когда у вас есть веские...

14
Выборка из дистрибутива фон Мизеса-Фишера в Python?

Я ищу простой способ выбрать из многомерного дистрибутива фон Мизеса-Фишера в Python. Я просмотрел модуль stats в scipy и numpy module, но нашел только одномерное распределение фон Мизеса. Есть ли код? Я еще не нашел. Очевидно, Вуд (1994) разработал алгоритм для выборки из распределения vMF по этой...

14
Могу ли я использовать моменты распространения для выборки распределения?

Я замечаю в статистике / методах машинного обучения, распределение часто аппроксимируется гауссианом, а затем этот гауссиан используется для выборки. Они начинают с вычисления первых двух моментов распределения и используют их для оценки μμ\mu и σ2σ2\sigma^2 . Затем они могут выбрать из этого...

13
Почему утверждается, что выборка часто является более точной, чем перепись?

Изучая курс выборки, я встречаю следующие два утверждения: 1) Ошибка выборки приводит к большей изменчивости, ошибки выборки приводят к смещению. 2) Из-за ошибки несэмплирования выборка часто является более точной, чем CENSUS. Я не знаю, как понять эти два утверждения. Какова основная логика для...

13
Почему начальная загрузка полезна?

Если все, что вы делаете, это повторная выборка из эмпирического распределения, почему бы просто не изучить эмпирическое распределение? Например, вместо того, чтобы изучать изменчивость путем повторной выборки, почему бы просто не определить количественно изменчивость по эмпирическому...

13
Последовательность Халтона против последовательности Соболя?

Из ответа на предыдущий вопрос я был направлен на последовательность Халтона для создания набора векторов, которые покрывали равномерное пространство выборки довольно равномерно. Но страница в Википедии упоминает, что более высокие простые числа часто очень сильно коррелируют в начале ряда. Это,...

13
Результаты оценок Монте-Карло, полученные с помощью выборки по важности

В течение прошлого года я довольно тесно работал над выборкой важных данных, и у меня есть несколько открытых вопросов, с которыми я надеялся получить некоторую помощь. Мой практический опыт работы со схемами выборки по важности заключался в том, что они могут иногда давать фантастические оценки с...

13
Оцените размер популяции по количеству повторных наблюдений

Скажем, у меня 50 миллионов уникальных вещей, и я беру 10 миллионов образцов (с заменой) ... Первый прикрепленный график показывает, сколько раз я выбираю одну и ту же "вещь", что относительно редко население больше, чем моя выборка. Однако, если моя популяция составляет всего 10 миллионов штук, и...

13
Опросы: Является ли 25% крупного представителя базы пользователей?

Мой работодатель в настоящее время проводит общекорпоративный опрос об отношении к офису, т.е. о настроениях. В прошлом они открывали опрос для всех областей бизнеса (допустим, 10 очень разных отделов) и всех сотрудников в них (в общей сложности 1000 сотрудников во всей компании). Количество...

13
Требуется ли центрирование при начальной загрузке образца?

Читая о том, как приблизить распределение выборки, я наткнулся на непараметрический метод начальной загрузки. По- видимому, можно аппроксимировать распределение распределения ˉ Х * п - ˉ Х п , где ˉ Х * п обозначает образец среднего значения выборки начальной загрузки.Икс¯N-...