Я оцениваю два (2) хладагента (газа), которые использовались в одной и той же системе охлаждения. У меня есть данные о температуре всасывания ( ), температуре конденсации ( ) и силе тока ( ) для оценки. Есть два (2) набора данных; 1-й хладагент ( ) и 2-й хладагент ( ). Я использую линейную, многомерную ( & ), полиномиальную модель 3-го порядка для регрессионного анализа. Я хотел бы определить, насколько меньше / больше сила тока (или какая-то аналогичная метрика в сравнении производительности) в среднем, в процентах, расходуется вторым хладагентом.D Y R 1 R 2 S D
Моя первая мысль была:
- Определите модель для использования:
- Получите коэффициенты ( ) из базовых данных ( ).R 1
- Используя эти коэффициенты, для каждого & в наборе данных рассчитайте каждое ожидаемое усиление усилителя ( ) и затем усредните.D R 2 Y
- Сравните среднее значение с фактическим средним усилителя ( ) данных . Y2R2
Однако, поскольку второй хладагент имеет немного отличающиеся тепловые свойства, и в систему охлаждения были внесены небольшие изменения (регулировка TXV и перегрева), я не верю, что этот «метод сравнения базовой линии» является точным.
Моей следующей мыслью было сделать два (2) отдельных регрессионных анализа:
и затем, для температуры насыщенного всасывания ( ), сравните коэффициенты ( против ) следующим образом: a 1 b 1 % изменение = b 1 - a 1
Однако, опять же, эти коэффициенты должны быть взвешены по-разному. Поэтому результаты будут искажены.
Я полагаю, что мог бы использовать z-тест, чтобы определить, как по-разному взвешиваются коэффициенты, но я не уверен, что полностью понимаю смысл вывода: . Но это все равно не дало бы мне метрики производительности, которая является главной целью.
Ответы:
Из закона идеального газа здесь , , предполагая пропорциональную модель. Убедитесь, что ваши устройства находятся в абсолютной температуре. Запрос о пропорциональном результате подразумевает модель пропорциональной ошибки. Рассмотрим, возможно, , тогда для множественной линейной регрессии можно использовать , взяв логарифмы значений Y, D и S, так что тогда это выглядит как , где индексы означают «логарифм». Теперь это может работать лучше, чем линейная модель, которую вы используете, и тогда ответы относятся к типу относительной ошибки.пВ= n R T Y= ДбSс пер( Y) = ln( а ) + б лн( D ) + c ln( S) YL= аL+ B DL+ с SL L
Чтобы проверить, какой тип модели использовать, попробуйте один и проверьте, являются ли остатки гомоскедастичными. Если это не так, то у вас есть предвзятая модель , затем сделайте что-то еще, например смоделируйте логарифмы, как указано выше, одну или несколько обратных величин данных x или y, квадратные корни, возведение в квадрат, возведение в степень и т. Д., Пока остатки не станут гомоскедастическими. Если модель не может дать гомоскедастические остатки, используйте множественную линейную регрессию Тейла с цензурой, если это необходимо.
Как обычно данные распределяются по оси y, не требуется, но выбросы могут и часто заметно искажают результаты параметра регрессии. Если гомоскедастичность не может быть найдена, то обычные наименьшие квадраты не должны использоваться, и необходимо выполнить какой-либо другой тип регрессии, например, взвешенную регрессию, регрессию Тейла, наименьшие квадраты в x, регрессию Деминга и так далее. Кроме того, ошибки не должны быть последовательно коррелированы.
Значение вывода: , может или не может быть уместным. Это предполагает, что полная дисперсия является суммой двух независимых дисперсий. Иными словами, независимость - это ортогональность (перпендикулярность) на графике . Таким образом, полная изменчивость (дисперсия) затем следует теореме Пифагора, , что может иметь или не иметь место для ваших данных. Если это так, то -статистика - это относительное расстояние, т. Е. Разность средних (расстояние), деленная на пифагорейскую, вектор АКА, сложение стандартной ошибки (SE), которые делятся на стандартные отклонения (SD) отZ= ( а1- б1) / SЕ2a1+ SЕ2б1)-----------√ х , у ЧАС= + А2+ O2-------√ Z N−−√ где SE - это сами расстояния. Деление одного расстояния на другое затем нормализует их, т. Е. Разница в средних значениях делится на общую (стандартную) ошибку, которая затем имеет форму, позволяющую применить ND (0,1) для нахождения вероятности.
Теперь, что произойдет, если меры не являются независимыми, и как можно проверить это? Из геометрии вы можете помнить, что треугольники, которые не являются прямоугольными, добавляют свои стороны как , если нет освежить свою память здесь . То есть, когда между осями есть что-то отличное от угла в 90 градусов, мы должны включить, что это за угол, при расчете общего расстояния. Сначала вспомним, что такое корреляция, стандартизированная ковариация. Это для общего расстояния и корреляции становитсяσ T ρ A , B σ 2 T = σ 2 A + σ 2 B - 2 σ A σ B B ρ A , БC2=A2+B2−2ABcos(θ),θ=∠(A,B) σT ρA,B σ2T=σ2A+σ2B−2σAσBρA,B , Другими словами, если ваши стандартные отклонения коррелированы (например, попарно), они не являются независимыми.
источник