Значение «дизайн» в матрице дизайна?

13

В линейной регрессии Y=Xβ , почему X называется проектной матрицей? Может ли X быть спроектирован или сконструирован произвольно до некоторой степени, как в искусстве?

Тим
источник
3
Происхождение этого термина довольно старое, и я верю, что оно восходит к истокам логической статистики в анализе экспериментов; в частности, я думаю, что это относится к тому, как X-матрица связана с фактическим планом эксперимента (конкретные настройки значений ). Если я смогу найти конкретную ссылку, я отправлю ответ. x
Glen_b
@Glen_b: Спасибо! Имеет ли «дизайн» какое-то отношение к выбору преобразования для входной переменной, чтобы выходная переменная была также линейной в преобразованной входной переменной? Например, дизайн матрицы в полиномиальной регрессии?
Тим
2
При создании эксперимента вы определяете значения . X
whuber

Ответы:

15

Чтобы привести пример в соответствии с ответом @ neverKnowsBest, учтите, что в факторных экспериментах есть 3 фактора, каждый из которых рассматривается как категориальные переменные с 2 уровнями, и каждая возможная комбинация уровней факторов тестируется в каждой репликации. Если бы эксперимент проводился только один раз (без репликации), этот дизайн потребовал бы 2 3 = 8 прогонов. Прогоны могут быть описаны следующей матрицей 8x3: [ 0 0 0 1 0 0 0 1 0 1 1 0 0 0 1 1 0 1 0 1 1 12323=8 где строки представляют прогоны, а столбцы представляют уровни факторов: [ A B C ]. (Первый столбец представляет уровень фактора A, второй столбец B и третий столбец C). Это называетсяМатрица проектирования,потому что она описывает дизайн эксперимента. Первый прогон собирается на «низком» уровне всех факторов, второй прогон - на «высоком» уровне фактора A и «низком» уровне факторов B и C и т. Д.

[000100010110001101011111]
[ABC],

[1000111011000011101001011110100010011001110101001011001011111111]
[IABCABACBCABC].

Цитирование

Монтгомери, Д. (2009). Дизайн и анализ экспериментов, 7-е издание. John Wiley & Sons Inc.

tjnel
источник
9

Икссодержащий уровни факторов, на которых мы проводим эксперимент, и матрицу модели (также записывается какИксно на самом деле это функция матрицы дизайна), содержащая такие вещи, как столбец из всех 1 (представляющий элемент перехвата), а также произведения и полномочия столбцов матрицы дизайна (представляющие такие вещи, как термины взаимодействия и полиномиальной модели). Я бы позвонилИкс в Yзнак равноИксβ матрица модели.

Проектирование экспериментов фокусируется на том, как построить матрицу проектирования и матрицу модели, поскольку это происходит до сбора данных. Если данные уже собраны, то дизайн будет сделан из камня, но вы все равно сможете изменить матрицу модели. Иногда спроектированный эксперимент будет иметь в матрице дизайна определенные фиксированные столбцы, называемые ковариатами которые не могут контролировать, но вы можете наблюдать.

Есть некоторые вещи, которые могут произойти в зависимости от вашего выбора модели и дизайна ... некоторые параметры могут стать трудными для оценки (большие расхождения в оценке), или вы не сможете оценить определенные параметры вообще. Я бы сказал, что выбор подходящей модели включает в себя некоторые элементы искусства, и, конечно же, есть искусство создавать эксперименты.

никогда не знает лучше
источник
2
Это очень полезно, но здесь есть сноска на «ковариату». Некоторые люди используют этот термин гораздо шире для любого вида предиктора или независимой переменной. (Естественно, существует много других синонимов.)
Ник Кокс
(+1) Очень приятно за ваш первый вклад - добро пожаловать на наш сайт!
whuber
2

Это называется матрица дизайна, потому что столбцы матрицы Иксоснованы на дизайне модели. Я не верюИкс может быть создан произвольно в том смысле, что, как только модель будет определена, матрица проекта (как правило, одна колонка в Икс для каждого βВы пытаетесь оценить). Тем не менее, поскольку построение модели можно считать искусством, я полагаю, что и построение матрицы дизайна.


источник
2

Иксэто просто ваши данные (минус переменная ответа). Я считаю, что это называется матрицей дизайна, потому что она определяет «дизайн» вашей модели (через обучение).

Может ли Х быть спроектирован или сконструирован произвольно до некоторой степени, как в искусстве?

По сути, этот вопрос сводится к тому, «можете ли вы построить модель, подготовленную на основе полученных данных», на что, очевидно, ответ «да». Например, вот один из способов построить произвольную матрицу дизайна (в действительности вектор дизайна), которая даст модель с предопределенным наклоном и перехватом:

design_mat=function(b, a){
  X = runif(100)
  Y = a*X + b
  data.frame(X,Y)
}

df = design_mat(-5, 12.3)

(lm(Y~X, data=df))

Call:
lm(formula = Y ~ X, data = df)

Coefficients:
(Intercept)            X  
       -5.0         12.3  

В моем примере я «сконструировал» ответ из случайных проектных данных для иллюстративных целей, но вы могли бы также легко сконструировать матрицу дизайна из случайного ответа, используя Иксзнак равноY-бa,

Дэвид Маркс
источник