Вопросы с тегом «spss»

SPSS - это статистический программный пакет. Используйте этот тег для любого вопроса по теме, который (а) включает SPSS либо в качестве критической части вопроса, либо ожидаемого ответа, и (б) не только о том, как использовать SPSS.

355
Python как инструмент статистики

Многие люди используют основной инструмент, такой как Excel или другую электронную таблицу, SPSS, Stata или R, для своих статистических нужд. Они могут обратиться к какому-то конкретному пакету для очень особых нужд, но многое можно сделать с помощью простой электронной таблицы или пакета общей...

78
Пример: регрессия LASSO с использованием glmnet для двоичного результата

Я начинаю баловаться с использованием glmnetс LASSO регрессией , где мой результат представляет интерес дихотомический. Я создал небольшой фрейм данных ниже: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91,...

78
Когда R в квадрате отрицательный?

Насколько я понимаю, не может быть отрицательным, поскольку это квадрат R. Однако я запустил простую линейную регрессию в SPSS с одной независимой переменной и зависимой переменной. Мой вывод SPSS дает мне отрицательное значение для . Если бы я должен был вычислить это вручную из R, то был бы...

63
За PCA следует ротация (например, varimax), все еще PCA?

Я пытался воспроизвести некоторые исследования (с использованием PCA) из SPSS в R. По моему опыту, principal() функция из пакета psychбыла единственной функцией, которая приблизилась (или, если моя память мне не изменяет), чтобы соответствовать выводу. Чтобы соответствовать тем же результатам, что...

46
Почему «статистически значимо» недостаточно?

Я завершил анализ данных и получил «статистически значимые результаты», что соответствует моей гипотезе. Однако студент-статистик сказал мне, что это преждевременный вывод. Почему? Что-нибудь еще нужно было включить в мой...

46
Интерпретация логарифмически преобразованного предиктора и / или ответа

Мне интересно, имеет ли это значение при интерпретации того, являются ли логически преобразованными только зависимые, как зависимые, так и независимые, или только независимые переменные. Рассмотрим случай log(DV) = Intercept + B1*IV + Error Я могу интерпретировать IV как процентное увеличение, но...

34
Почему существует разница между ручным вычислением 95-процентного доверительного интервала и использованием функции confint () в R?

Дорогие, я заметил нечто странное, что не могу объяснить, не так ли? В итоге: ручной подход к вычислению доверительного интервала в модели логистической регрессии и функция R confint()дают разные результаты. Я проходил Прикладную логистическую регрессию Хосмера и Лемешоу (2-е издание). В 3-й главе...

30
Выполнение анализа основных компонентов или факторного анализа двоичных данных

У меня есть набор данных с большим количеством ответов Да / Нет. Могу ли я использовать основные компоненты (PCA) или любой другой анализ сокращения данных (такой как факторный анализ) для данных этого типа? Посоветуйте, пожалуйста, как мне это сделать, используя...

29
Точный тест Фишера в таблицах непредвиденных обстоятельств больше 2х2

Меня учили применять точный тест Фишера только в таблицах непредвиденных обстоятельств, которые были 2x2. Вопросов: Сам Фишер когда-либо предполагал, что этот тест будет использоваться в таблицах размером более 2х2 (мне известно о том, как он разработал этот тест, пытаясь угадать, может ли пожилая...

29
Как работать с иерархическими / вложенными данными в машинном обучении

Я объясню мою проблему на примере. Предположим, вы хотите предсказать доход человека с учетом некоторых атрибутов: {Возраст, Пол, Страна, Регион, Город}. У вас есть тренировочный набор данных, как так train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4,...

29
Лучшие методы извлечения факторов в факторном анализе

SPSS предлагает несколько методов извлечения факторов: Основные компоненты (что вовсе не факторный анализ) Невзвешенные наименьшие квадраты Обобщенные наименьшие квадраты Максимальная вероятность Основная ось Альфа-факторинг Имиджевый факторинг Не обращая внимания на первый метод, который не...

28
Вычисление повторяемости эффектов по модели Лмера

Я только что наткнулся на эту статью , в которой описывается, как вычислить повторяемость (или надежность, или внутриклассовую корреляцию) измерения с помощью моделирования смешанных эффектов. Код R будет: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc =...

27
Разница между биномиальной, отрицательной биномиальной и пуассоновской регрессией

Я ищу некоторую информацию о разнице между биномиальной, отрицательной биномиальной и пуассоновской регрессией и для каких ситуаций эти регрессии лучше всего подходят. Могу ли я выполнить какие-либо тесты в SPSS, чтобы определить, какая из этих регрессий лучше всего подходит для моей ситуации?...

23
CHAID против CRT (или CART)

Я выполняю классификацию дерева решений с использованием SPSS для набора данных, содержащего около 20 предикторов (категориальных с несколькими категориями). CHAID (автоматическое обнаружение взаимодействия по критерию хи-квадрат) и CRT / CART (деревья классификации и регрессии) дают мне разные...

22
Как кластеризовать временные ряды?

У меня вопрос по кластерному анализу. Есть 3000 компаний, которые должны быть сгруппированы в соответствии с их потреблением энергии в течение 5 лет. Каждая компания имеет значения для каждого часа в течение 5 лет. Я хотел бы выяснить, имеют ли некоторые компании одинаковую структуру в зависимости...

20
Каковы правильные значения для точности и отзыва в крайних случаях?

Точность определяется как: p = true positives / (true positives + false positives) Является ли это исправить , что, как true positivesи false positivesподход 0, точность приближается к 1? Тот же вопрос для отзыва: r = true positives / (true positives + false negatives) В настоящее время я выполняю...

20
Методы расчета факторных оценок и что такое матрица «коэффициентов оценки» в PCA или факторный анализ?

Насколько я понимаю, в PCA, основанном на корреляциях, мы получаем фактор (= основной компонент в данном случае) нагрузки, которые являются ничем иным, как корреляцией между переменными и факторами. Теперь, когда мне нужно сгенерировать факторные оценки в SPSS, я могу напрямую получить факторные...

19
Визуализация ответов Лайкерта с использованием R или SPSS

У меня есть 82 респондента в 2 группах (43 в группе A и 39 в группе B), которые завершили опрос по 65 вопросов Лайкерта, каждый в диапазоне от 1 до 5 (полностью согласен - категорически не согласен). Поэтому у меня есть фрейм данных с 66 столбцами (1 для каждого вопроса + 1, указывающий на...

15
Мое распределение нормальное; Тест Колмогорова-Смирнова не согласен

У меня проблема с нормальностью некоторых данных, которые у меня есть: я выполнил тест Колмогорова, который говорит, что он ненормален с p = .0000, я не понимаю: асимметрия моего распределения = -. 497, и эксцесс = -0,024 Вот график моего распространения, который выглядит очень нормально ... (У...