«Фиктивная переменная» и «индикаторная переменная» представляют собой часто используемые термины меток для описания принадлежности к категории с кодированием 0/1; обычно 0: не член категории, 1: член категории.
26.11.2014 быстрый поиск на scholar.google.com (с заключенными в кавычки) показывает, что «фиктивная переменная» используется примерно в 318 000 статей, а «индикаторная переменная» используется примерно в 112 000 статей. Термин «фиктивная переменная» также имеет значение в нестатистической математике « связанной переменной », что, вероятно, способствует более широкому использованию «фиктивной переменной» в индексированных статьях.
Мои тематически связанные вопросы:
- Всегда ли эти термины являются синонимами (в статистике)?
- Есть либо из этих терминов никогда не благоугодно применительно к другим видам категориальных кодирования (например , эффект кодирования , Helmert кодирования и т.д. )?
- Какие статистические или дисциплинарные причины предпочитают один термин другому?
male
значения1
или0
. Если есть категориальная переменная с более чем 2 категориями, которая затем расширяется в индикаторные переменные для членства на каждом уровне, я бы использовал «фиктивные переменные» для описания этого набора индикаторных переменных.sex
.male
, где 1 означает «истина» (в данном случае «мужчина»), а «0» означает «ложь» (в данном случае «женщина»). Если я использую имя переменной,sex
мне придется искать, как я кодировал эту переменную каждый раз, когда возвращаюсь к этому набору данных.Ответы:
Я бы сказал, что «фиктивная переменная» является более общим способом ссылки на (одну из) числовую переменную (и), которая представляет (вместе представляет) категориальный предиктор; поэтому термин применяется также к тем, которые используются в кодировании Гельмерта и эффектов † . Это в основном из-за общего использования «пустышка», чтобы означать «замену». «Индикаторная переменная» Я имею в виду индикаторные функции ‡ - так что они могут быть только одним или нулем, чтобы указывать на наличие или отсутствие какого-либо свойства; Таким образом , этот термин относится только к тем , которые используются в справочнике уровня кодирования ※ . Конечно , некоторые люди используют «фиктивное кодирование» означают «эталонный уровень кодирования»; по-видимому, они имеют более ограниченное определение «фиктивных переменных» или, во всяком случае, должны иметь.
† А если не называть эти «пустышки», что бы вы их называете?
※ Или, как указал @gung, уровень означает кодирование.
источник
источник