У нас 100 участников в двух группах, в каждой группе. Мы использовали оценку способности базового функционирования в 4 момента времени. Оценка состоит из 6 вопросов, каждый из которых набрал 0–5 баллов. У нас нет индивидуальных баллов по каждому вопросу, только общие баллы от 0 до 30. Более высокие баллы указывают на лучшее функционирование. Проблема в том, что оценка является очень базовой и имеет значительный потолочный эффект. Результаты очень негативно искажены. Большинство участников набрали около 30 баллов, особенно в 3 периода наблюдения. Вполне вероятно, что не все участники, набравшие максимальные баллы, по-настоящему равны в своих возможностях: некоторые участники набрали около 30 баллов, а другие с легкостью набрали 30 баллов, и если бы это было возможно, результаты были бы намного выше, поэтому данные цензура сверху.
Я хочу сравнить две группы и время, но, очевидно, это очень сложно, учитывая характер результатов. Любые преобразования не имеют значения. Мне сообщили, что модель Tobit лучше всего подходит для этой оценки, и я могу провести анализ в R, используя примеры из статьи Арне Хеннингена, Оценка регрессионных моделей с цензурой в R с использованием пакета censReg .
Однако у меня есть только базовые знания в области статистики, и я нашел информацию о модели Тобита довольно сложной. Мне нужно уметь объяснить эту модель простым языком, и я не могу найти простой язык, пояснения, что на самом деле делает модель Tobit и как. Может кто-нибудь объяснить модель Тобита или указать мне направление для удобочитаемой ссылки без сложных статистических и математических объяснений?
Очень благодарен за любую помощь
источник
В выпуске «Американского социологического обозрения» за 1983 г. есть статья Берк (3-й выпуск) - так я узнал о цензуре. Объяснение касается именно предвзятости выбора, но абсолютно соответствует вашей проблеме. Смещение выбора, как говорит Берк, - это просто цензура в процессе отбора образцов, в вашем случае цензура является результатом нечувствительного инструмента. Есть несколько хороших графиков, которые показывают, как именно вы можете ожидать, что ваша линия регрессии будет смещена, когда Y по-разному подвергается цензуре. В целом статья логична и понятна, а не математична (да, я отношусь к ним как к отдельному, предпочитая первое). Тобит обсуждается как одно из решений проблемы.
В более общем смысле, похоже, что «Тобит» - это правильный инструмент для работы. По сути, это работает путем оценки вероятности подвергнуться цензуре и последующего включения ее в уравнение, прогнозирующее оценку. Есть еще один подход, предложенный Хекманом, использующий соотношение пробита и обратного фрезерования, который в основном одно и то же, но позволяет вам иметь разные переменные, предсказывающие вероятность цензуры и оценки в тесте - очевидно, что это не будет подходящим для ситуации, которую вы иметь.
Еще одна рекомендация - вы можете рассмотреть иерархическую модель тобита, в которой наблюдения вложены в отдельных лиц. Это будет правильно учитывать тенденцию ошибок, связанных с людьми. Или, если вы не используете иерархическую модель, по крайней мере, обязательно скорректируйте ваши стандартные ошибки для кластеризации наблюдений внутри отдельных людей. Я знаю, что все это может быть сделано в Stata, и я уверен, что R со всей его универсальностью может сделать это тоже ... но как заядлый пользователь Stata, я не могу дать вам никаких советов о том, как это сделать в R.
источник