Я делаю презентацию о примерочных линиях. У меня есть простая линейная функция, . Я пытаюсь получить разбросанные точки данных, которые я могу поместить в график рассеяния, чтобы моя линия лучше соответствовала тому же уравнению.
Я хотел бы изучить эту технику в R или Excel - в зависимости от того, что проще.
r
regression
least-squares
excel
Райан Чейз
источник
источник
Ответы:
Выберите любой если хотя бы два из них отличаются. Установите и slope и определите(xi) β0 β1
Это подходит идеально. Не меняя подгонку, вы можете изменить на , добавив к нему любой вектор ошибок при условии, что он ортогонален как вектору и вектору констант . Простой способ получить такую ошибку - выбрать любой вектор и позволить быть остатками при регрессии против . В приведенном ниже коде генерируется как набор независимых случайных нормальных значений со средним и общим стандартным отклонением.y0 y=y0+ε ε=(εi) x=(xi) (1,1,…,1) e ε e x e 0e ε e x e 0
Кроме того, вы даже можете предварительно выбрать количество разброса, возможно, указав, какой должен быть . Позволяя , измените масштаб этих остатков, чтобы иметь дисперсиюR2 τ2=var(yi)=β21var(xi)
Этот метод является полностью общим: все возможные примеры (для данного набора ) могут быть созданы таким образом.xi
Примеры
Анскомб квартет
Мы можем легко воспроизвести квартет Анскомба из четырех качественно различных двумерных наборов данных, имеющих одинаковую описательную статистику (через второй порядок).
Код удивительно прост и гибок.
Выходные данные дают описательную статистику второго порядка для данных для каждого набора данных. Все четыре строки идентичны. Вы можете легко создать больше примеров, изменив (x-координаты) и (шаблоны ошибок) в самом начале.(x,y)
x
e
Симуляторы
Этаy β=(β0,β1) R2 0≤R2≤1 x
R
функция генерирует векторы соответствии со спецификациями и (с ), учитывая набор значений .(Нетрудно перенести это в Excel - но это немного больно.)
В качестве примера его использования, вот четыре моделирования данных с использованием общего набора значений, ( то есть , отсекаемые и наклон ) и .(x,y) 60 x β=(1,−1/2) 1 −1/2 R2=0.5
Выполнив,R2 xi
summary(fit)
вы можете проверить, что оценочные коэффициенты точно такие, как указано, и кратное является предполагаемым значением. Другие статистические данные, такие как значение р-регрессии, могут быть скорректированы путем изменения значений .источник