Вопросы с тегом «bias»

18
Существует ли графическое представление компромисса смещения в линейной регрессии?

Я страдаю от затемнения. Мне представили следующую картину, чтобы продемонстрировать компромисс смещения дисперсии в контексте линейной регрессии: Я вижу, что ни одна из двух моделей не подходит - «простая» не оценивает сложность отношения XY, а «сложная» просто переобучается, в основном, выучивая...

18
Когда слово «уклон» был придуман для среднего

Когда слово «уклон» был придуман для среднего ?E[θ^−θ]E[θ^−θ]\mathbb{E}[\hat{\theta}-\theta] Причина, по которой я сейчас думаю об этом, заключается в том, что я, кажется, вспоминаю Джейнса в его тексте теории вероятностей , критикуя использование слова «смещение», использованного для описания...

17
Есть ли пример, где MLE дает необъективную оценку среднего значения?

Можете ли вы привести пример оценки MLE среднего значения, которое смещено? Я не ищу пример, который нарушает оценки MLE в целом, нарушая условия регулярности. Все примеры, которые я вижу в Интернете, относятся к расхождению, и я не могу найти ничего, связанного со средним значением. РЕДАКТИРОВАТЬ...

17
Опущенное переменное смещение в логистической регрессии по сравнению с пропущенным переменным смещением в обычной регрессии наименьших квадратов

У меня есть вопрос об опущенном переменном смещении в логистической и линейной регрессии. Скажем, я опускаю некоторые переменные из модели линейной регрессии. Сделайте вид, что эти пропущенные переменные не связаны с переменными, которые я включил в мою модель. Эти пропущенные переменные не смещают...

15
Вопрос о компромиссном отклонении

Я пытаюсь понять компромисс между отклонением оценки, отношением между отклонением оценки и отклонением модели, а также отношением между дисперсией оценки и дисперсией модели. Я пришел к этим выводам: Мы склонны переписывать данные, когда пренебрегаем смещением оценки, то есть когда мы стремимся...

15
Нужно ли включать «все соответствующие предикторы»?

Основное предположение об использовании регрессионных моделей для вывода заключается в том, что «все соответствующие предикторы» были включены в уравнение прогнозирования. Обоснование состоит в том, что отказ от включения важного фактического фактора приводит к смещенным коэффициентам и,...

15
Почему дерево решений имеет низкий уклон и высокую дисперсию?

Вопросов Зависит ли это от того, мелкое дерево или глубокое? Или мы можем сказать это независимо от глубины / уровня дерева? Почему уклон низкий и дисперсия высокая? Пожалуйста, объясните интуитивно и математически...

15
Случайная проблема с параметрами

Я всегда изо всех сил пытаюсь понять истинную суть проблемы случайных параметров. Я несколько раз читал, что оценки фиксированных эффектов нелинейных панельных моделей данных могут быть сильно смещены из-за «хорошо известной» проблемы побочных параметров. Когда я прошу дать четкое объяснение этой...

15
Высокая дисперсия перекрестной проверки по принципу «один-один-один»

Я читал снова и снова, что перекрестная проверка «Оставить один» имеет высокую дисперсию из-за большого перекрытия тренировочных сгибов. Однако я не понимаю, почему это так: не должны ли результаты перекрестной проверки быть очень стабильными (низкая дисперсия) именно потому, что тренировочные...

15
Минимизация смещения в объяснительном моделировании, почему? (Галита Шмуэли «Объяснять или предсказывать»)

Этот вопрос ссылается на статью Галита Шмуэли «Объяснить или предсказать» . В частности, в разделе 1.5 «Объяснения и предсказания различны» профессор Шмуэли пишет: При объяснительном моделировании основное внимание уделяется минимизации смещения для получения наиболее точного представления основной...

14
Предвзятость в выборе жюри?

Друг представляет клиента по апелляции после уголовного процесса, в ходе которого выясняется, что выбор присяжных был расистским. Жюри состояло из 30 человек в 4 расовых группах. Обвинение использовало императивные вызовы, чтобы исключить 10 из этих людей из пула. Количество людей и количество...

14
Для каких моделей смещение MLE падает быстрее, чем дисперсия?

Пусть θ будет оценка максимального правдоподобия истинного параметра некоторой модели. По мере увеличения числа точек данных ошибка обычно уменьшается как O (1 / \ sqrt n) . Используя неравенство треугольника и свойства ожидания, можно показать, что этот коэффициент ошибок подразумевает, что оба...

14
Какова объективная оценка R-квадрата населения?

Я заинтересован в получении объективной оценки в множественной линейной регрессии.R2R2R^2 Подумав, я могу подумать о двух разных значениях, которым может соответствовать несмещенная оценка .R2R2R^2 Из образца :R2R2R^2 R-квадрат , который можно было бы получить , если уравнение регрессии ,...

14
Интуитивное понимание разницы между последовательным и асимптотически непредвзятым

Я пытаюсь получить интуитивное понимание и почувствовать разницу и практическое различие между термином последовательный и асимптотически беспристрастный. Я знаю их математические / статистические определения, но я ищу что-то интуитивное. Мне, глядя на их индивидуальные определения, они кажутся...

14
Предоставляет ли ступенчатая регрессия необъективную оценку r-квадрата населения?

В психологии и других областях часто используется форма ступенчатой ​​регрессии, которая включает в себя следующее: Посмотрите на остальные предикторы (сначала их нет в модели) и определите предиктор, который приведет к наибольшему изменению r-квадрата; Если значение p изменения r-квадрата меньше,...

13
Почему Даниэль Уилкс (2011) говорит, что регресс основного компонента «будет предвзятым»?

В « Статистических методах в атмосферных науках» Дэниел Уилкс отмечает, что множественная линейная регрессия может привести к проблемам, если между предикторами существуют очень сильные корреляции (3-е издание, стр. 559-560): Патология, которая может возникнуть при множественной линейной регрессии,...

13
Смещение дисперсии

В разделе 3.2 Бишопа «Распознавание образов и машинное обучение» он обсуждает разложение смещения дисперсии, утверждая, что для квадрата функции потерь ожидаемая потеря может быть разложена на квадрат смещения (который описывает, насколько средние прогнозы далеки от истинных модель), дисперсионный...

13
Почему среднее арифметическое меньше среднего по логарифмически нормальному распределению?

Итак, у меня есть случайный процесс генерирования лог-нормально распределенных случайных величин . Вот соответствующая функция плотности вероятности:XXX Я хотел оценить распределение нескольких моментов этого исходного распределения, скажем, 1-го момента: среднее арифметическое. Для этого 10000 раз...

13
Почему неправильно останавливать тестирование A / B до достижения оптимального размера выборки?

Я отвечаю за представление результатов A / B-тестов (на разных сайтах) в моей компании. Мы запускаем тест в течение месяца, а затем регулярно проверяем p-значения до тех пор, пока не достигнем значимости (или откажемся, если значимость не будет достигнута после длительного выполнения теста), что я...