Вопросы с тегом «survey»

Относится к инструменту, используемому для сбора выборки из совокупности. Обследование часто относится к отбору человеческих популяций и в основном проводится путем анкетирования или опроса людей. Выборка лиц для обследований стратифицированных популяций может потребовать более сложной выборки, чем простая случайная, для получения более точных оценок параметров популяции. Дизайн выборки и анализ данных обследования относятся к «Методологии обследования».

78
Пример: регрессия LASSO с использованием glmnet для двоичного результата

Я начинаю баловаться с использованием glmnetс LASSO регрессией , где мой результат представляет интерес дихотомический. Я создал небольшой фрейм данных ниже: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91,...

29
Как работать с иерархическими / вложенными данными в машинном обучении

Я объясню мою проблему на примере. Предположим, вы хотите предсказать доход человека с учетом некоторых атрибутов: {Возраст, Пол, Страна, Регион, Город}. У вас есть тренировочный набор данных, как так train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4,...

28
Вычисление повторяемости эффектов по модели Лмера

Я только что наткнулся на эту статью , в которой описывается, как вычислить повторяемость (или надежность, или внутриклассовую корреляцию) измерения с помощью моделирования смешанных эффектов. Код R будет: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc =...

21
Как спроецировать новый вектор на пространство PCA?

После выполнения анализа главных компонентов (PCA) я хочу спроецировать новый вектор на пространство PCA (т.е. найти его координаты в системе координат PCA). Я рассчитал PCA на языке R, используя prcomp. Теперь я должен быть в состоянии умножить свой вектор на матрицу вращения PCA. Должны ли...

18
использование весов в svyglm vs glm

Я хотел бы знать, как обработка веса отличается между svyglmиglm Я использую twangпакет в R для создания оценок склонности, которые затем используются в качестве весов, как показано ниже (этот код взят из twangдокументации): library(twang) library(survey) set.seed(1) data(lalonde) ps.lalonde <-...

16
Как рассчитать среднюю продолжительность приверженности вегетарианству, когда у нас есть только данные опросов о текущих вегетарианцах?

Была обследована случайная выборка населения. Их спросили, придерживаются ли они вегетарианской диеты. Если они ответили «да», их также попросили указать, как долго они питались вегетарианской диетой без перерыва. Я хочу использовать эти данные для расчета средней продолжительности приверженности...

13
Опросы: Является ли 25% крупного представителя базы пользователей?

Мой работодатель в настоящее время проводит общекорпоративный опрос об отношении к офису, т.е. о настроениях. В прошлом они открывали опрос для всех областей бизнеса (допустим, 10 очень разных отделов) и всех сотрудников в них (в общей сложности 1000 сотрудников во всей компании). Количество...

13
Почему утверждается, что выборка часто является более точной, чем перепись?

Изучая курс выборки, я встречаю следующие два утверждения: 1) Ошибка выборки приводит к большей изменчивости, ошибки выборки приводят к смещению. 2) Из-за ошибки несэмплирования выборка часто является более точной, чем CENSUS. Я не знаю, как понять эти два утверждения. Какова основная логика для...

13
Как относиться к нелогичным ответам на опрос

Я представил опрос для образца художников. Один из вопросов состоял в том, чтобы указать процентную долю дохода, полученную от: художественной деятельности, государственной поддержки, частной пенсии, деятельности, не связанной с искусством. Около 65% респондентов ответили так, что сумма процентов...

12
Проверка анкет

Я разрабатываю анкету для своей диссертации. Я нахожусь в процессе проверки анкеты. Я применил альфа-тест Кронбаха к исходной выборочной группе. Ответы на вопросник в масштабе Лайкерта; Может ли кто-нибудь предложить какие-либо дополнительные тесты, чтобы применить, чтобы помочь проверить его...

12
Выявление бесполезных вопросов из анкеты

Я разрабатываю анкету. Для повышения его надежности и достоверности я хочу использовать статистические методы. Я хочу исключить вопросы, ответы на которые всегда одинаковы. Это означает, что почти все участники дали одинаковые ответы на эти вопросы. Теперь мои вопросы: Какой технический термин для...

11
SurveyMonkey игнорирует тот факт, что вы получаете неслучайный образец?

SurveyMonkey имеет шаги и диаграмму, чтобы вы могли определить, какой размер выборки вам нужен для данного диапазона погрешности или доверительного интервала, исходя из размера вашей популяции. Размер выборки SurveyMonkey Эта диаграмма просто игнорирует тот факт, что вы не получите случайную...

11
Как лучше всего визуализировать эффекты категорий и их распространенность в логистической регрессии?

Мне нужно представить информацию об основных предикторах голосов кандидата, используя данные опроса общественного мнения. Я выполнил логистическую регрессию, используя все переменные, которые меня интересуют, но я не могу найти хороший способ представить эту информацию. Мой клиент заботится не...

11
Перекрестная проверка после LASSO в данных комплексного опроса

Я пытаюсь сделать выбор модели для некоторых кандидатов-предикторов, используя LASSO с непрерывным результатом. Цель состоит в том, чтобы выбрать оптимальную модель с наилучшими показателями прогнозирования, что обычно может быть выполнено путем перекрестной проверки в K-кратном порядке после...

11
Как границы погрешности связаны с доверительными интервалами?

Может кто-нибудь сказать мне разницу между краями ошибки и доверительными интервалами? В Интернете я вижу, как эти два значения взаимозаменяемы. Правильно ли сказать, «Доверительные интервалы показаны как 1,96 и отображаются на графиках в виде полей...

11
Есть ли сайт, на котором можно опубликовать свой опрос, чтобы я мог получить выборку представителя населения?

Это только для моего старшего школьного проекта, поэтому он не должен быть идеальным. Я делаю проект по глобальному потеплению, и я хочу опросить людей на предмет их мнений. Я знаю, что если я воспользуюсь удобной выборкой моих одноклассников, у меня будет много предубеждений. Мне было интересно,...

10
Как интерпретировать этот биплот PCA, исходя из опроса, в каких областях люди заинтересованы?

История вопроса: я спросил у сотен участников моего опроса, насколько они заинтересованы в выбранных областях (по пятибалльной шкале Лайкерта, где 1 обозначает «неинтересно», а 5 - «заинтересовано»). Затем я попробовал PCA. Картинка ниже представляет собой проекцию первых двух основных компонентов....

10
Модель истории дискретного времени (выживания) в R

Я пытаюсь вписать модель с дискретным временем в R, но я не уверен, как это сделать. Я читал, что вы можете организовать зависимую переменную в разных строках, по одной для каждого временного наблюдения, и использовать glmфункцию со ссылкой logit или cloglog. В этом смысле, у меня есть три колонки:...

10
R линейная регрессия категориальной переменной «скрытое» значение

Это всего лишь пример, с которым я сталкивался несколько раз, поэтому у меня нет примеров данных. Запуск модели линейной регрессии в R: a.lm = lm(Y ~ x1 + x2) x1является непрерывной переменной x2является категориальным и имеет три значения, например, «Низкий», «Средний» и «Высокий». Однако вывод,...

9
EFA однозначно поддерживает однофакторное измерение, внутренне непротиворечивое, но CFA плохо подходит?

Я исследую психометрические свойства меры самоотчета из 10 пунктов. У меня около 400 дел в двух независимых выборках. Элементы выполнены по 4-балльной шкале Лайкерта. EFA явно поддерживает однофакторное решение (например, первое собственное значение больше 6, все остальные меньше 1), и альфа...