В настоящее время я работаю над тем, как преобразовать два разных значения фосфора друг в друга.
Фон
Существует множество (экстракционных) методов измерения содержания фосфора в почве. В разных странах применяются разные методы, поэтому для сравнения коэффициента рождаемости в разных странах необходимо рассчитать значение P-критерия x на основе значения P-критерия y и наоборот. Поэтому ответ и ковариата являются взаимозаменяемыми.
Количество P в экстрагенте 1 = P_CAL в [мг / 100 г почвы]
Количество P в экстрагенте 2 = P_DL в [мг / 100 г почвы]
Чтобы установить такое «уравнение трансформации», содержание Р в 136 пробах почвы было проанализировано с использованием экстрактов CAL и DL. Также были измерены дополнительные параметры, такие как pH почвы, общий органический углерод, общий азот, глина и карбонат. Цель состоит в том, чтобы вывести простую модель регрессии. На втором этапе также несколько моделей.
Чтобы дать обзор данных, я покажу вам две диаграммы рассеяния с простой линией регрессии (OLS).
Вопросов:
Насколько я понимаю, регрессия Деминга подходит, если переменная respone (y) и объяснительная (x) имеют ошибки (измерения) и являются взаимозаменяемыми. Регрессия Деминга предполагает, что коэффициент дисперсии известен. Поскольку у меня нет сведений о точности измерений извлечения P, есть ли другой способ определить коэффициент дисперсии? Какая разница здесь подразумевается? Я полагаю, это не рассчитывается var(DL_P)/var(CAL_P)
?
Q1: Как определить коэффициент дисперсии для деминг регрессии?
Частным случаем регрессии Деминга является ортогональная регрессия. Предполагается, что коэффициент дисперсии = 1.
Q2: Есть ли способ диагностировать, является ли предположение δ = 1 «примерно» правильным или если (ложное) предположение влечет за собой большие ошибки прогнозирования?
Если я предполагаю, что δ = 1, то ортогональная регрессия дает следующий (округленный) результат
library(MethComp)
deming <- Deming(y=P_CAL, x=P_DL, vr=1)
Перехват: 0,75; Наклон: 0,71; сигма P_DL: 3,17; сигма P_CAL: 3,17
Построение линии регрессии Деминга на вышеприведенных графиках показывает, что регрессия Деминга очень близка к а) регрессии CAL-P = f (DL-P), но очень отличается от b) DL-P = f (CAL-P) уравнение.
Q3: правильно ли, что в ортогональной регрессии CAL-P = f (DL-P) и DL-P = f (CAL-P) выражаются одним и тем же уравнением? Если нет, как я могу получить правильные уравнения для обоих? Что мне здесь не хватает?
Из-за свойств обоих экстракционных растворов, значения DL-P, как правило, примерно на 25% выше, чем значения CAL-P, поэтому CAL-P = f (DL-P) должен иметь более высокий наклон, чем DL-P = f (CAL -П). Однако это не выражается в регрессии Деминга, когда имеется только один наклон. Что оставляет меня с моим последним вопросом.
В4: Является ли регрессия Деминга правильным подходом для моей цели?
источник
Ответы:
Чтобы решить часть ваших проблем здесь: регрессия Деминга, по- видимому , плохо вписывается в панель B графика, но это потому, что график неверен. Быстрый способ оценить, правильно ли это было сделано, - посмотреть на значения X & Y вдоль линии регрессии Деминга. Для любого значения DL-P на панели A оно должно иметь соответствующее значение CAL-P, идентичное на обеих панелях (НЕ верно для OLS и принципиальной разницы между ними). Но на этих графиках, где DL-P = 20, CAL-P на панели A составляет ~ 15, а на панели B ~ 27.
Ошибка, по-видимому, заключается в том, что линия регрессии Деминга была проведена простым обменом членами CAL-P и DL-P в уравнении. Уравнение для панели A:
Переупорядочение, это подразумевает, что уравнение для панели B должно быть:
И не:
источник