В статистическом моделировании: две культуры Лев Брейман пишет
В настоящее время применяется практика проверки соответствия модели данных с помощью тестов соответствия и анализа остаточных данных. Однажды, несколько лет назад, я поставил задачу симулированной регрессии в семи измерениях с контролируемой степенью нелинейности. Стандартные тесты на пригодность к приему не отклоняли линейность, пока нелинейность не была экстремальной.
Брейман не дает подробностей своего моделирования. Он ссылается на статью, которая, по его словам, дает теоретическое обоснование его наблюдения, но статья не опубликована.
Кто-нибудь видел опубликованный результат моделирования или теоретическую статью, подтверждающую утверждение Бримана?
regression
goodness-of-fit
Джон Д. Кук
источник
источник
Ответы:
Я создал симуляцию, которая отвечала бы описанию Бреймана, и нашел только очевидное: результат зависит от контекста и того, что подразумевается под «экстремальным».
Можно сказать очень много, но позвольте мне ограничиться одним примером, который проводится с помощью легко модифицируемого
R
кода, который заинтересованные читатели могут использовать в своих собственных исследованиях. Этот код начинается с настройки матрицы проектирования, состоящей из приблизительно равномерно распределенных независимых значений, которые приблизительно ортогональны (чтобы мы не сталкивались с проблемами мультиколлинеарности). Он вычисляет одиночное квадратичное (то есть нелинейное) взаимодействие между первыми двумя переменными: это только один из многих видов «нелинейностей», которые можно изучить, но, по крайней мере, это распространенная, хорошо понятая. Затем он стандартизирует все так, чтобы коэффициенты были сопоставимы:Для базовой модели OLS (без нелинейности) необходимо указать некоторые коэффициенты и стандартное отклонение остаточной ошибки. Вот набор единичных коэффициентов и сопоставимый SD:
Вместо того, чтобы просмотреть все выходные данные, давайте посмотрим на эти данные, используя выходные данные
plot
команды:Трассы низких значений в нижнем треугольнике показывают, по существу, отсутствие линейных отношений между взаимодействие (
x.12
) и зависимой переменной (y
) и скромные линейные отношения между другими переменными иy
. Результаты OLS подтверждают это; взаимодействие едва ли значимо:Я возьму p-значение члена взаимодействия как критерий нелинейности: когда это p-значение достаточно низкое (вы можете выбрать, насколько низко), мы обнаружим нелинейность.
(Здесь есть тонкость в том, что именно мы ищем. На практике нам может потребоваться изучить все 7 * 6/2 = 21 возможных таких квадратичных взаимодействий, а также, возможно, еще 7 квадратичных терминов, вместо того, чтобы сосредоточиться на одном термине как это сделано здесь. Мы хотели бы сделать исправление для этих 28 взаимосвязанных тестов. Я не делаю здесь этого явного исправления, потому что вместо этого я отображаю смоделированное распределение р-значений. Вы можете прочитать показатели обнаружения непосредственно из гистограммы в конце на основе ваших порогов значимости.)
Но давайте не будем делать этот анализ только один раз; давайте делать это много раз, генерируя новые значения
y
в каждой итерации в соответствии с той же моделью и той же самой матрицей проекта. Для этого мы используем функцию для выполнения одной итерации и возвращаем p-значение члена взаимодействия:Я предпочитаю представлять результаты моделирования в виде гистограмм значений p, варьирующих стандартизированный коэффициент
gamma
члена взаимодействия. Сначала гистограммы:Теперь, чтобы сделать работу. На 1000 попыток на моделирование уходит несколько секунд (и четыре независимых моделирования, начиная с заданного значения члена взаимодействия и последовательно удваивая его каждый раз):
Результаты:
x
sd
beta
gamma
x
sd
beta
sd
Короче говоря, симуляция, подобная этой, может доказать, что вам нравится, если вы просто настроите ее и интерпретируете правильно. Это говорит о том, что отдельный статистик должен проводить свои собственные исследования, подходящие для конкретных проблем, с которыми они сталкиваются, чтобы прийти к личному и глубокому пониманию возможностей и недостатков используемых ими процедур.
источник
R
и всегда ценю такие указатели.Не уверен, что это дает окончательный ответ на вопрос, но я бы посмотрел на это . Особенно пункт 2. См. Также обсуждение в приложении А2 документа .
источник