Вопросы с тегом «spss»

14
Интерпретация расхождений между R и SPSS с помощью исследовательского факторного анализа

Я аспирант в области компьютерных наук. Я проводил некоторый исследовательский анализ факторов для исследовательского проекта. Мои коллеги (которые возглавляют проект) используют SPSS, а я предпочитаю использовать R. Это не имело значения, пока мы не обнаружили существенное расхождение между двумя...

13
Множественное вменение для пропущенных значений

Я хотел бы использовать вменение для замены отсутствующих значений в моем наборе данных при определенных ограничениях. Например, я бы хотел, чтобы вмененная переменная x1была больше или равна сумме двух других моих переменных, скажем, x2и x3. Я также хочу x3быть вмененным либо 0или, >= 14и я...

13
Поэтапная логистическая регрессия и выборка

Я подгоняю пошаговую логистическую регрессию к набору данных в SPSS. В этой процедуре я подгоняю свою модель к случайному подмножеству, которое составляет ок. 60% от общей выборки, что составляет около 330 случаев. Что мне показалось интересным, так это то, что каждый раз, когда я повторно выбираю...

12
Лучшая классификация дефолта в логистической регрессии

Полное раскрытие: это домашнее задание. Я включил ссылку на набор данных ( http://www.bertelsen.ca/R/logistic-regression.sav ) Моя цель - максимально повысить прогноз неплательщиков кредитов в этом наборе данных. Каждая модель, которую я придумала до сих пор, предсказывает> 90% неплательщиков,...

12
Критерии выбора «лучшей» модели в скрытой марковской модели

У меня есть набор данных временного ряда, к которому я пытаюсь подогнать скрытую марковскую модель (HMM), чтобы оценить количество скрытых состояний в данных. Мой псевдокод для этого следующий: for( i in 2 : max_number_of_states ){ ... calculate HMM with i states ... optimal_number_of_states =...

12
Могу ли я использовать множественную регрессию, когда у меня смешаны категориальные и непрерывные предикторы?

Похоже, вы можете использовать кодирование для одной категориальной переменной, но у меня есть две категориальные и одна непрерывная переменная предиктора. Могу ли я использовать множественную регрессию для этого в SPSS и если да, то как?...

11
Отображение обычных данных - средние, средние и средние ранги

У меня есть некоторые порядковые данные, которые обычно не распространяются, поэтому я решил провести непараметрическое тестирование, используя U-критерий Манна-Уитни. Я смотрю на различия между группами по семи баллам - эти баллы равны 0, 1, 2 или 3 для каждого предмета. Мне сложно понять, как...

11
Как справиться с отсутствующими значениями, чтобы подготовить данные для выбора функции с помощью LASSO?

Моя ситуация: небольшой размер выборки: 116 двоичная переменная результата длинный список объясняющих переменных: 44 объясняющие переменные не исходили из головы; их выбор был основан на литературе. В большинстве случаев в выборке и в большинстве переменных отсутствуют значения. Подход к выбору...

11
Как получить объединенные p-значения в тестах, выполненных в нескольких вмененных наборах данных?

Используя Amelia в R, я получил несколько вмененных наборов данных. После этого я выполнил повторный тест в SPSS. Теперь я хочу объединить результаты испытаний. Я знаю, что могу использовать правила Рубина (реализованные через любой пакет множественного вменения в R) для объединения средств и...

11
Сравнение коэффициентов логистической регрессии по моделям?

Я разработал модель logit для применения к шести различным наборам данных поперечного сечения. Я пытаюсь выяснить, есть ли изменения в существенном влиянии данной независимой переменной (IV) на зависимую переменную (DV), контролирующую другие объяснения в разное время и во времени. Мои вопросы: Как...

11
Как найти показатель корреляции между двумя номинальными переменными?

Был проведен опрос, когда люди выбрали то, что они используют, чтобы представить своего смайлика, и въехали в страну происхождения. Я перекодировал текстовые ответы в числовые. Какую форму анализа следует использовать (предпочтительно в SPSS), чтобы проверить уровень корреляции между тем, откуда...

11
Должен ли я сообщать о незначительных результатах?

Я провел тест Крускала Уоллиса, и для некоторых вопросов значение p не является значимым. Могу ли я сообщить об этом таким же образом, как если бы он был значительным, указав df, тестовую статистику и p-значение? Таким образом, было бы что-то вроде этого, был проведен тест Крускала Уоллиса, но было...

10
Различия в определении куртоза и их интерпретация

Недавно я понял, что существуют различия в значениях эксцесса, предоставляемых SPSS и Stata. См. Http://www.ats.ucla.edu/stat/mult_pkg/faq/general/kurtosis.htm. Насколько я понимаю, интерпретация одного и того же будет другой. Любой совет, как с этим бороться?...

10
Как мне включить инновационный выброс при наблюдении 48 в мою модель ARIMA?

Я работаю над набором данных. После использования некоторых методов идентификации моделей я разработал модель ARIMA (0,2,1). Я использовал detectIOфункцию в пакете TSAв R, чтобы обнаружить инновационный выброс (IO) на 48-м наблюдении за моим исходным набором данных. Как включить этот выброс в мою...

10
Модель истории дискретного времени (выживания) в R

Я пытаюсь вписать модель с дискретным временем в R, но я не уверен, как это сделать. Я читал, что вы можете организовать зависимую переменную в разных строках, по одной для каждого временного наблюдения, и использовать glmфункцию со ссылкой logit или cloglog. В этом смысле, у меня есть три колонки:...

10
Допустимо ли иметь только два (или менее) элемента (переменных), загруженных фактором факторного анализа?

У меня есть набор из 20 переменных, которые я проанализировал с помощью факторного анализа в SPSS. Для целей исследования мне необходимо разработать 6 факторов. SPSS показал, что 8 переменных (из 20) были загружены с низким весом или были загружены одинаково по нескольким факторам, поэтому я удалил...

10
Как работать с недвоичными категориальными переменными в логистической регрессии (SPSS)

Я должен сделать бинарную логистическую регрессию с большим количеством независимых переменных. Большинство из них являются двоичными, но некоторые из категориальных переменных имеют более двух уровней. Как лучше всего справиться с такими переменными? Например, для переменной с тремя возможными...

10
R линейная регрессия категориальной переменной «скрытое» значение

Это всего лишь пример, с которым я сталкивался несколько раз, поэтому у меня нет примеров данных. Запуск модели линейной регрессии в R: a.lm = lm(Y ~ x1 + x2) x1является непрерывной переменной x2является категориальным и имеет три значения, например, «Низкий», «Средний» и «Высокий». Однако вывод,...

10
Как правильно обрабатывать несколько точек данных по каждому предмету

В настоящее время я спорю с кем-то о том, как правильно обрабатывать данные с несколькими измерениями для каждого субъекта. В этом случае данные были собраны для каждого субъекта в течение короткого времени для различных условий в каждом субъекте. Все измерения объединяют одну и ту же переменную,...