Вопросы с тегом «modeling»

14
Концепции, лежащие в основе моделей с фиксированными / случайными эффектами

Может ли кто-нибудь помочь мне понять модели с фиксированным / случайным эффектом? Вы можете либо объяснить по-своему, если вы переварили эти понятия, либо направить меня к ресурсу (книга, заметки, веб-сайт) с конкретным адресом (номер страницы, глава и т. Д.), Чтобы я мог изучить их без...

14
Учитывая две модели линейной регрессии, какая модель будет работать лучше?

Я взял курс машинного обучения в моем колледже. В одной из викторин был задан этот вопрос. Модель 1: y=θx+ϵy=θx+ϵ y = \theta x + \epsilon Модель 2: y=θx+θ2x+ϵy=θx+θ2x+ϵ y = \theta x + \theta^2 x + \epsilon Какая из вышеперечисленных моделей подойдет для данных лучше? (предположим, что данные могут...

14
Замена переменных на WoE (вес доказательств) в логистической регрессии

Это вопрос, касающийся практики или метода, которым следуют некоторые из моих коллег. При создании модели логистической регрессии я видел, как люди заменяли категориальные переменные (или непрерывные переменные, которые сгруппированы) на соответствующий вес доказательств (WoE). Предположительно это...

14
Объяснить корректировку модели на простом английском

Читая о методах и результатах статистического анализа, особенно в эпидемиологии, я очень часто слышу о корректировке или контроле моделей. Как бы вы объяснили не статистику цель этого? Как вы интерпретируете свои результаты после контроля определенной переменной? Небольшой проход в Stata или R, или...

14
Соотношения в регрессии, ака Вопросы о Кронмале

В последнее время вопросы случайного просмотра вызвали у меня воспоминания о том, что один из моих профессоров несколько лет назад предупреждал об использовании коэффициентов в регрессионных моделях. Так что я начал читать об этом, что привело к Кронмал 1993 года. Я хочу убедиться, что я правильно...

14
Модель для оценки плотности населения

База данных (население, площадь, форма) может быть использована для отображения плотности населения путем назначения постоянной величины населения / площади для каждой фигуры (которая является многоугольником, таким как блок переписи, участок, округ, штат и т. Д.). Однако популяции обычно не...

13
Является ли прогноз «золотым критерием» для оценки способности статистиков?

Я читал линейные модели Faraway из учебника с R (1-е издание) в прошлые выходные. У Faraway была глава под названием «Статистическая стратегия и модель неопределенности». Он описал (стр 158) , что он искусственно созданный некоторые данные , используя очень сложную модель, то он попросил своих...

13
Когда использовать несколько моделей для прогнозирования?

Это довольно общий вопрос: Как правило, я обнаружил, что использование нескольких различных моделей превосходит одну модель при попытке предсказать временной ряд из выборки. Есть ли хорошие статьи, которые демонстрируют, что комбинация моделей превзойдет одну модель? Есть ли лучшие практики по...

13
Параметры против скрытых переменных

Я спрашивал об этом раньше и действительно пытался определить, что делает параметр модели, а что скрытой переменной. Итак, глядя на различные темы по этой теме на этом сайте, основное различие выглядит следующим образом: Скрытые переменные не наблюдаются, но имеют связанное с ними распределение...

13
Коэффициенты пути - сравнение регрессии гребня, лассо и эластичной сетки

Я хотел бы сравнить модели, выбранные с ребристой, лассо и эластичной сеткой. На рисунке ниже показаны коэффициенты пути, используя все 3 метода: гребень (рис. A, альфа = 0), лассо (рис. B; альфа = 1) и эластичная сетка (рис. C; альфа = 0,5). Оптимальное решение зависит от выбранного значения...

13
LARS против координатного спуска для лассо

Каковы плюсы и минусы использования LARS [1] по сравнению с использованием координатного спуска для подбора L1-регуляризованной линейной регрессии? Я в основном заинтересован в аспектах производительности (мои проблемы, как правило, Nисчисляются сотнями тысяч и p<20). Однако, любые другие идеи...

13
AIC / BIC: для скольких параметров нужна перестановка?

Допустим, у меня проблема с выбором модели, и я пытаюсь использовать AIC или BIC для оценки моделей. Это просто для моделей, которые имеют некоторое число вещественных параметров.kkk Однако что, если одна из наших моделей (например, модель Мэллова ) имеет перестановку плюс некоторые...

13
Методы анализа соотношений

Я ищу советы и комментарии, которые касаются анализа соотношений и ставок. В области, в которой я работаю, анализ коэффициентов, в частности, широко распространен, но я прочитал несколько статей, которые предполагают, что это может быть проблематично, я думаю о: Кронмаль, Ричард А. 1993. Ложная...

13
Осложнения наличия очень маленькой выборки в модели структурного уравнения

Я использую модель структурного уравнения (SEM) в Amos 18. Я искал 100 участников для моего эксперимента (использовался свободно), которого, вероятно, было недостаточно для успешного проведения SEM. Мне неоднократно говорили, что SEM (наряду с EFA, CFA) является статистической процедурой "большой...

13
Аддитивная ошибка или мультипликативная ошибка?

Я относительно новичок в статистике и был бы признателен за помощь в понимании этого вопроса. В моей области есть широко используемая модель вида: пT= Pо( VT)αпTзнак равнопо(ВT)αP_t = P_o(V_t)^\alpha Когда люди подгоняют модель к данным, они обычно линеаризуют ее и соответствуют следующим журнал(...

13
Пакет GBM против Карет с использованием GBM

Я занимался настройкой модели caret, но затем перезапустил модель, используя gbmпакет. Насколько я понимаю, caretпакет использует gbmи вывод должен быть одинаковым. Тем не менее, только быстрый запуск теста data(iris)показывает несоответствие в модели около 5% с использованием RMSE и R ^ 2 в...

12
Точный критерий Фишера и гипергеометрическое распределение

Я хотел лучше понять точный критерий Фишера, поэтому я разработал следующий пример игрушки, где f и m соответствуют мужской и женской части, а n и y соответствуют «потреблению соды», например: > soda_gender f m n 0 5 y 5 0 Очевидно, это резкое упрощение, но я не хотел, чтобы контекст мешал....

12
Моделирование, когда зависимая переменная имеет «отсечение»

Заранее извиняюсь, если какая-либо терминология, которую я использую, неверна. Я бы приветствовал любое исправление. Если то, что я называю «отсечкой», носит другое имя, дайте мне знать, и я смогу обновить вопрос. Интересующая меня ситуация такова: у вас есть независимые переменные и одна зависимая...

12
Критерии выбора «лучшей» модели в скрытой марковской модели

У меня есть набор данных временного ряда, к которому я пытаюсь подогнать скрытую марковскую модель (HMM), чтобы оценить количество скрытых состояний в данных. Мой псевдокод для этого следующий: for( i in 2 : max_number_of_states ){ ... calculate HMM with i states ... optimal_number_of_states =...

12
Параметрическое моделирование дисперсии данных счета

Я хочу смоделировать некоторые данные, но я не уверен, какой тип модели я могу использовать. У меня есть данные подсчета, и я хочу модель, которая даст параметрические оценки как среднего значения, так и дисперсии данных. То есть у меня есть различные прогностические факторы, и я хочу определить,...