Вопросы с тегом «bootstrap»

31
Когда верна оценка предвзятости?

Часто утверждается, что начальная загрузка может дать оценку смещения в оценщике. Если т является оценкой для некоторой статистики, и ~ т я являюсь бутстраповскими репликами (с I ∈ { 1 , ⋯ , N } ), то оценкой смещения начальной загрузки является б я ы т ≈ -t^t^\hat tt~it~i\tilde...

31
Это правда, что процентиль бутстрап никогда не должен использоваться?

В примечаниях MIT OpenCourseWare к 18.05 «Введение в вероятность и статистику», весна 2014 г. (в настоящее время доступно здесь ), говорится: Метод процентиля начальной загрузки привлекателен своей простотой. Однако это зависит от начального распределения основанного на том, что конкретный образец...

30
Рекомендация для рецензируемого журнала с открытым исходным кодом?

У меня есть рукопись по методу начальной загрузки для проверки гипотез одного среднего значения, и я хотел бы отправить ее для публикации, но у меня есть моральная дилемма. Я подписался на протест против Elsevier за их неэтичные методы ведения бизнеса, и чтение всего этого вопроса действительно...

30
Почему бы не сообщить о значении дистрибутива начальной загрузки?

Когда кто-то загружает параметр, чтобы получить стандартную ошибку, мы получаем распределение параметра. Почему мы не используем среднее значение этого распределения в качестве результата или оценки для параметра, который мы пытаемся получить? Разве распределение не должно приближаться к реальному?...

30
Существует ли надежный непараметрический доверительный интервал для среднего перекошенного распределения?

Очень искаженные распределения, такие как log-normal, не дают точных доверительных интервалов начальной загрузки. Вот пример, показывающий, что левая и правая области хвоста далеки от идеальных 0,025 независимо от того, какой метод начальной загрузки вы используете в R: require(boot) n <- 25 B...

29
Почему мой интервал начальной загрузки имеет ужасное покрытие?

Я хотел сделать демонстрацию класса, где я сравниваю интервал t с интервалом начальной загрузки и вычисляю вероятность охвата обоих. Я хотел, чтобы данные поступали из искаженного дистрибутива, поэтому я решил сгенерировать данные в exp(rnorm(10, 0, 2)) + 1виде выборки размером 10 из смещенного...

29
Насколько хорошо самозагрузка аппроксимирует выборочное распределение оценки?

Недавно изучив начальную загрузку, у меня возник концептуальный вопрос, который до сих пор меня удивляет: У вас есть население, и вы хотите знать атрибут населения, то есть , где я использую для представления населения. Это может означать, например, население. Обычно вы не можете получить все...

29
Интервал прогнозирования начальной загрузки

Существует ли какой-либо метод начальной загрузки для вычисления интервалов прогнозирования для точечных прогнозов, полученных, например, с помощью линейной регрессии или другого метода регрессии (k-ближайший сосед, деревья регрессии и т. Д.)? Почему-то я чувствую, что иногда предлагаемый способ...

28
Вычисление p-значения с помощью начальной загрузки с R

Я использую пакет «boot» для вычисления приблизительного 2-стороннего загрузочного p-значения, но результат слишком далек от p-значения при использовании t.test. Я не могу понять, что я сделал неправильно в моем коде R. Может кто-нибудь, пожалуйста, дайте мне подсказку для этого time =...

27
Могут ли степени свободы быть нецелым числом?

Когда я использую GAM, он дает мне остаточный DF, (последняя строка в коде). Что это значит? Выходя за рамки примера GAM, в общем, может ли число степеней свободы быть нецелым числом?26,626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data =...

27
Как построить 95% доверительный интервал разницы между медианами?

Моя проблема: параллельное групповое рандомизированное исследование с очень искаженным распределением первичного результата. Я не хочу предполагать нормальность и использовать 95% ДИ, основанные на норме (то есть, используя 1,96 X SE). Мне удобно выражать меру центральной тенденции как медиану, но...

26
Почему RANSAC не наиболее широко используется в статистике?

Исходя из области компьютерного зрения, я часто использовал метод RANSAC (Random Sample Consensus) для подгонки моделей к данным с большим количеством выбросов. Тем не менее, я никогда не видел, чтобы он использовался статистиками, и у меня всегда было впечатление, что его не считают «статистически...

25
Есть ли результат, который обеспечивает загрузку является действительным, если и только если статистика гладкая?

Во всем мы предполагаем, что наша статистика является функцией некоторых данных которые взяты из функции распределения ; Эмпирическая функция распределения нашей выборки - . Таким образом, - это статистика, рассматриваемая как случайная величина, а - это версия статистики для начальной загрузки. Мы...

24
Перекрестная проверка или начальная загрузка для оценки эффективности классификации?

Какой метод выборки является наиболее подходящим для оценки производительности классификатора на конкретном наборе данных и сравнения его с другими классификаторами? Перекрестная проверка кажется стандартной практикой, но я читал, что такие методы, как .632 начальной загрузки, являются лучшим...

24
Можно ли охарактеризовать многочлен (1 / n,…, 1 / n) как дискретный Дирихле (1, .., 1)?

Так что этот вопрос немного запутанный, но я добавлю красочные графики, чтобы восполнить это! Сначала предыстория, затем вопрос (ы). Задний план Скажем, у вас есть мерное полиномиальное распределение с равными вероятностями по категориям. Пусть - нормализованные значения ( ) из этого распределения,...

22
Как на самом деле работает самозагрузка в R?

Я изучал загрузочный пакет в R, и хотя я нашел несколько хороших учебников по его использованию, мне еще предстоит найти что-то, что точно описывает то, что происходит "за кулисами". Например, в этом примере руководство показывает, как использовать стандартные коэффициенты регрессии в качестве...

21
Два способа использования бутстрапа для оценки доверительного интервала коэффициентов в регрессии

Я применяю линейную модель к своим данным: yi=β0+β1xi+ϵi,ϵi∼N(0,σ2).yi=β0+β1xi+ϵi,ϵi∼N(0,σ2). y_{i}=\beta_{0}+\beta_{1}x_{i}+\epsilon_{i}, \quad\epsilon_{i} \sim N(0,\sigma^{2}). Я хотел бы оценить доверительный интервал (CI) коэффициентов ( , \ beta_ {1} ), используя метод начальной загрузки. Есть...

21
Bootstrapping vs Bayesian Bootstrapping концептуально?

У меня проблемы с пониманием, что такое байесовский процесс начальной загрузки, и чем он отличается от вашей обычной начальной загрузки. И если бы кто-то мог предложить интуитивно-концептуальный обзор и сравнение того и другого, это было бы здорово. Давайте возьмем пример. Скажем, у нас есть набор...

19
Использование стандартной ошибки дистрибутива начальной загрузки

(при необходимости игнорируйте код R, так как мой главный вопрос не зависит от языка) Если я хочу посмотреть на изменчивость простой статистики (например, среднее), я знаю, что могу сделать это с помощью теории, например: x = rnorm(50) # Estimate standard error from theory summary(lm(x~1)) # same...

19
Как я могу рассчитать доверительный интервал среднего значения в ненормально распределенной выборке?

Как я могу рассчитать доверительный интервал среднего значения в ненормально распределенной выборке? Я понимаю, что здесь часто используются методы начальной загрузки, но я открыт для других вариантов. В то время как я ищу непараметрическую опцию, если кто-то может убедить меня, что параметрическое...