контекст
Я читал о теории ответа предметов, и я нахожу ее увлекательной. Я верю, что понимаю основы, но мне интересно, как применять статистические методы, связанные с этой областью. Ниже приведены две статьи, похожие на те области, в которых я хотел бы применить ITR:
Второе - это то, что я бы хотел расширить на данный момент.
Я скачал бесплатную программу под названием jMetrik, и она, кажется, работает отлично. Я думаю, что это может быть слишком основным, насколько IRT идет, но я не уверен.
Я знаю, что «лучший» способ, вероятно, будет включать изучение R; Тем не менее, я не знаю, смогу ли я сэкономить время, чтобы справиться с этой кривой обучения. Обратите внимание, что у нас есть определенное финансирование для покупки программного обеспечения, но, как я вижу, там, похоже, нет хороших программ IRT.
Вопросов
- Что вы думаете об эффективности jMetrik?
- Как бы вы посоветовали мне перейти на IRT?
- Каковы лучшие программы для применения IRT?
- Кто-нибудь из вас регулярно использует IRT? Если да, то как?
источник
Ответы:
Как хороший стартер для IRT, я всегда рекомендую прочесть наглядное руководство по теории отклика предметов .
Обзор доступного программного обеспечения можно найти на www.rasch.org .
Исходя из своего опыта, я обнаружил, что команды Stata Raschtest (и связанные с ними) очень удобны в большинстве случаев, когда кто-то заинтересован в подборе однопараметрической модели. Для более сложного дизайна можно прибегнуть к GLLAMM ; есть хороший рабочий пример, основанный на книге Де Бека и Уилсона « Объяснительные предметы и модели ответов» (Springer, 2004).
Что касается R, в частности, существует множество пакетов, которые стали доступны в течение последних пяти лет, см., Например, соответствующее представление задач CRAN . Большинство из них обсуждаются в специальном выпуске в журнале статистического программного обеспечения (т. 20, 2007). Как обсуждалось в другом ответе, ltm и eRm позволяют соответствовать широкому диапазону моделей IRT. Поскольку они полагаются на другой метод оценки -
ltm
использовали маржинальный подход, в то время какeRm
используют условный подход - выбор одного или другого в основном зависит от модели, которую вы хотите подогнать (eRm
не подходит для двух- или трехпараметрических моделей) и цели измерения, которой вы руководствуетесь: условная оценка параметров личности обладает некоторыми хорошими психометрическими свойствами, в то время как маргинальный подход позволяет легко переключиться на модель со смешанными эффектами, как обсуждалось в следующих двух статьях. :Существуют также некоторые возможности для подгонки моделей Rasch с использованием методов MCMC, см., Например, пакет MCMCpack (или WinBUGS / JAGS , но см. Код BUGS для теории ответа на вопрос , JSS (2010) 36).
У меня нет опыта работы с SAS для моделирования IRT, поэтому я предоставлю это тому, кто более разбирается в программировании SAS.
Другое специализированное программное обеспечение (в основном используемое в образовательной оценке) включает в себя: RUMM, Conquest, Winsteps, BILOG / MULTILOG, Mplus (не цитируя список, уже доступный в википедии ). Ни один из них не является бесплатным, но для некоторых из них предлагается ограниченная по времени демонстрационная версия. Я нашел jMetrik очень ограниченным, когда попробовал его (год назад), и все функции уже доступны в R. Аналогично, ConstructMap может быть безопасно заменен на lme4 , как показано в раздаточном материале, связанном выше. Я должен также упомянуть
mdltm
(Модели многомерных дискретных скрытых признаков) для смешанных моделей Раша, автором фон Давье и соавторами, которые, как предполагается, сопровождают книгуМодели Rasch с многомерным распределением и распределением смеси (Springer, 2007).источник
ex5.5
примера в Mplus и R / LTM, я получил ок. те же результаты. Однако следует ожидать некоторых изменений в зависимости от используемого программного обеспечения. Обычно то, что я обнаружил, связано с выбором параметризации (logit / probit), будь то ( элементов, лиц) или который моделируется, и метод оценки (предельное и условное правдоподобие), а также для моделей с 2+ параметрами независимо от того, центрированы ли пороги или нет. i = 1 , … , k p = 1 , … , n β i - θ pНа первый вопрос, у меня нет никакой информации о jMetrick.
При применении IRT (как и в случае любой другой статистической процедуры) первым шагом является использование его с максимально возможным количеством различных типов данных. Есть кривая обучения, но я считаю, что это того стоит.
Важной особенностью IRT является различие между моделями Rasch и IRT. Они были разработаны разными людьми для разных целей. При этом, модели IRT являются расширенным набором моделей Rasch.
Модели Rasch - это модели с одним параметром - они предполагают, что все элементы вопросника одинаково предсказывают скрытую черту.
Модели IRT, однако, представляют собой две модели параметров, которые позволяют различным вопросам отличаться способностью предоставлять информацию о способностях участников.
Кроме того, есть три модели параметров, которые похожи на модели IRT, за исключением того, что они позволяют использовать параметр угадывания, чтобы учесть способность участников случайно получить правильный ответ (это больше касается способности, чем личностных тестов).
Кроме того, существует многомерный IRT, который оценивает множественные скрытые способности одновременно. Я не знаю много об этом, но это область, которую я намерен узнать больше.
Существует также различие между дихотомическими и политомными методами IRT. Дихотомические модели IRT - это модели, используемые в тестах способностей, которые дают правильный и неправильный ответ. Модели Polytomous IRT используются в личностных тестах, где есть несколько ответов, которые одинаково правильны (в том смысле, что нет правильного ответа).
Я лично использую R для теории ответа предмета. Я использовал два основных пакета,
eRm
которые соответствуют только моделям Rasch, иltm
которые соответствуют моделям теории отклика элемента (модели с двумя и тремя параметрами). Оба имеют похожую функциональность, и оба предоставляют больше процедур для дихотомических моделей IRT. Я не знаю, является ли R «лучшим» для IRT, он не имеет всего множества доступных моделей IRT, но он, безусловно, является наиболее расширяемым, поскольку можно относительно легко программировать эти модели.Я использую IRT почти исключительно для политомных моделей, в R. Обычно я начинаю с непараметрических методов IRT (предусмотренных в пакете
mokken
), чтобы проверить предположения, а затем приступаю к модели rasch, добавляя больше сложности, как требуется, чтобы получить хорошее соответствие.Для многомерного IRT существует пакет `mirt ', который предоставляет эту функциональность. Я не использовал его, поэтому я не могу комментировать.
Если вы установите эти пакеты в R и вызовете функцию 'vignette ("packagename"), то вы должны получить несколько полезных виньеток (определенно для
eRm
иmokken
, возможно, для других), которые могут оказаться полезными для вас (в зависимости от вашего уровня математическая сложность).Наконец, есть много хороших книг, доступных для моделей Rasch и irt. Теория ответа предмета для психологов часто используется (хотя мне не нравился стиль), и далее в цепочке технической сложности есть два чрезвычайно полных и полезных учебника - Справочник по современной теории отклика предмета и модели Раша: Основы, Недавние Разработки и приложения .
Надеюсь, это поможет.
источник
jMetrik более мощный, чем вы думаете. Он предназначен для оперативной работы, когда исследователям необходимо несколько процедур в единой унифицированной среде. В настоящее время вы можете оценить параметры IRT для моделей Rasch, частичного кредитования и рейтинговой шкалы. Это также позволяет связывать шкалу IRT с помощью Stocking-Lord, Haebara и других методов. Поскольку он включает в себя интегрированную базу данных, результаты оценки IRT могут использоваться при масштабировании связей без необходимости изменения формы файлов данных. Кроме того, весь вывод может быть сохранен в базе данных для использования с другими методами в jMetrik или внешних программах, таких как R.
Вы также можете запустить его с помощью сценариев вместо графического интерфейса. Например, следующий код будет (а) импортировать данные в базу данных, (б) оценивать элементы с помощью ключа ответа, (в) оценивать параметры модели Раша и (г) экспортировать данные в виде файла CSV. Вы можете использовать конечный выходной файл в качестве входных данных для R для дальнейшего анализа, или вы можете использовать R для непосредственного подключения к базе данных jMetrik и работы с результатами.
Программное обеспечение все еще находится на ранней стадии разработки. В настоящее время я добавляю исследовательский факторный анализ и более продвинутые модели реагирования на предметы. В отличие от многих других программ IRT, jMetrik является открытым исходным кодом. все процедуры измерения используют библиотеку психометрии, которая в настоящее время доступна на GitHub, https://github.com/meyerjp3/psychometrics . Любой, кто заинтересован в содействии, приветствуется.
источник
У вас есть довольно широкий список вопросов, но он весьма актуален для многих исследователей!
Я настоятельно рекомендую вам идти вперед в IRT, но только если ваша ситуация соответствует требованиям. Например, он хорошо согласуется с типами тестов, которые вы используете, и, вероятно, самое главное, что у вас есть необходимые размеры выборки. Для дихотомических данных с множественным выбором я рекомендую модель 3PL (аргумент Rasch «объективного измерения» поразительно неубедителен), а 500-1000 - это, как правило, минимальный размер выборки. Дихотомические данные без догадок, такие как психологические опросы, в которых ответы Y / N на утверждения хорошо работают с 2PL. Если у вас есть рейтинговая шкала или частичные кредитные данные, существуют политомные модели, разработанные специально для этих ситуаций.
ИМХО, лучшая программа для применения IRT - это Xcalibre. Он относительно удобен для пользователя (простой графический интерфейс, а также пакетный тип командной строки, если вам это нужно по какой-то причине) и обеспечивает очень удобочитаемый вывод (отчеты MS Word с обширными таблицами и рисунками). Я рекомендую не использовать R по противоположным причинам. Недостаток, конечно, в том, что он не бесплатный, но вы, как говорится, получаете то, за что платите. Полное описание, пример вывода и бесплатная пробная версия доступны на сайте www.assess.com .
источник
В то же время вышла новая книга Фрэнка Бейкера, Бейкера Фрэнка Б., Сок-Хо Кима. Основы теории отклика предметов с использованием международной публикации R. Springer (2017) . Он не использует пакеты R, но предлагает фрагменты.
(Переполненный) список пакетов R для IRT с кратким описанием доступен на CRAN .
источник