Регрессия на единичном диске, начиная с «равномерно расположенных» выборок

9

Мне нужно решить сложную проблему регрессии на диске устройства. Оригинальный вопрос вызвал некоторые интересные комментарии, но, к сожалению, ответов нет. Тем временем я узнал кое-что еще об этой проблеме, поэтому я постараюсь разбить исходную проблему на подзадачи и посмотреть, повезет ли мне в этот раз.

У меня 40 датчиков температуры, регулярно расположенных в узком кольце внутри диска устройства: введите описание изображения здесь

Эти датчики получают температуру во времени. Однако, поскольку изменение во времени намного меньше, чем изменение в пространстве, давайте упростим проблему, игнорируя изменчивость во времени, и предположим, что каждый датчик дает мне только среднее время. Это означает, что у меня есть 40 образцов (по одному на каждый датчик), и у меня нет повторных образцов.

Я хотел бы построить регрессионную поверхность из данных датчика. Регрессия преследует две цели:T=f(ρ,θ)+ϵ

  1. Мне нужно оценить профиль средней радиальной температуры . С помощью линейной регрессии я уже оцениваю поверхность, которая является средней температурой поверхности, поэтому мне нужно только интегрировать мою поверхность относительно , верно? Если я использую полиномы для регрессии, этот шаг должен быть простым.Tmean=g1(ρ)+ϵθ
  2. Мне нужно оценить профиль радиальной температуры , чтобы в каждой радиальной позиции .T95=g2(ρ)+ϵP(T(ρ)<T95(ρ))=.95

Учитывая эти две цели, какую технику я должен использовать для регрессии на диске устройства? Конечно, гауссовские процессы обычно используются для пространственной регрессии. Однако определение хорошего ядра для единичного диска не является тривиальным, поэтому я хотел бы сохранить простоту и использовать полиномы, если только вы не чувствуете, что это проигрышная стратегия. Я читал о полиномах Зернике . Полиномы Зернике, по-видимому, подходят для регрессии на единичном диске, поскольку они периодические в .θ

Как только модель выбрана, мне нужно выбрать процедуру оценки. Поскольку это проблема пространственной регрессии, ошибки в разных местах должны коррелироваться. Обычные наименьшие квадраты предполагают некоррелированные ошибки, поэтому я предполагаю, что обобщенные наименьшие квадраты были бы более подходящими. GLS кажется относительно распространенным статистическим методом, учитывая, что glsв стандартном распределении R есть функция. Однако я никогда не использовал GLS, и у меня есть сомнения. Например, как я могу оценить ковариационную матрицу? Разработанный пример, даже с несколькими датчиками, был бы великолепен.

PS Я решил использовать полиномы Зернике и GLS, потому что мне кажется, что здесь логично. Однако я не эксперт, и если вы чувствуете, что я иду в неправильном направлении, не стесняйтесь использовать совершенно другой подход.

DeltaIV
источник
На фигуре показан двигатель с идеальной радиальной симметрией. Но связано ли положение осей с какой-либо физической характеристикой двигателя, или это действительно произвольно? Во втором случае переменная будет иметь только значение по отношению к конкретному движку. θ
Ив

Ответы:

2

Я думаю, что вы на правильном пути, думая о чем-то вроде полиномов Зернике. Как отмечено в ответе jwimberly, это пример системы ортогональных базисных функций на диске. Я не знаком с полиномами Цернике, но многие другие семейства ортогональных функций (включая функции Бесселя) естественным образом возникают в классической математической физике как собственные функции для некоторых уравнений с частными производными (на момент написания этой статьи анимация в верхней части этой ссылки даже показывает пример вибрирующей головки барабана).

Два вопроса приходят мне в голову. Во-первых, если все, что вам нужно, это радиальный профиль ( усредненный), то какое ограничение на пространственный паттерн вам нужно? Во-вторых, какие виды изменчивости встречаются в пространственно-временных данных?θ

Что касается первого вопроса, то на ум приходят две проблемы. Из-за полярных координат область поддержки для каждого датчика имеет тенденцию с . Вторым вопросом будет возможность наложения псевдонимов , по сути, неправильное выравнивание ваших датчиков относительно фазы шаблона (для использования аналогии Фурье / Бесселя). Обратите внимание, что псевдонимы, вероятно, будут основной неопределенностью в ограничении пиковых температур (т. ).rT95

С точки зрения этого второго вопроса, изменчивость данных может фактически помочь с любыми проблемами сглаживания, по существу позволяя любое несоответствие усреднить по различным измерениям. (При условии отсутствия систематического смещения ... но это будет проблемой для любого метода, например, без физической модели, чтобы дать больше информации).

Таким образом, одной из возможностей будет определение ваших пространственных ортогональных функций исключительно в местах расположения датчиков. Эти «эмпирические ортогональные функции» могут быть вычислены с помощью PCA на вашей пространственно-временной матрице данных. (Возможно, вы могли бы использовать некоторые весовые коэффициенты для учета областей поддержки переменных датчиков, но, учитывая равномерную полярную сетку и целевые значения радиальных средних, это может не потребоваться.)

Обратите внимание , что если есть какое - либо данные физическое моделирование , доступная для «ожидаемых» вариаций температуры, доступный на плотную сетке пространственно - временной расчетной, то та же самая процедура PCA может быть применена к этой информации для получения ортогональных функций. (Это обычно называется « Правильное ортогональное разложение » в технике, где оно используется для сокращения модели, например, дорогая модель вычислительной гидродинамики может быть перегнана для использования в дальнейшей деятельности по проектированию.)

Последний комментарий: если вы взвесите данные датчика по области поддержки (то есть по размеру полярной ячейки), это будет тип диагональной ковариации в рамках GLS . (Это больше относится к вашей проблеме прогнозирования, хотя взвешенный PCA будет тесно связан.)

Надеюсь, это поможет!

Обновление: ваша новая схема распределения датчиков, на мой взгляд, сильно меняет ситуацию. Если вы хотите оценить температуру внутри диска, вам потребуется гораздо более информативная информация, чем просто «набор ортогональных функций на единичном диске». В данных датчика слишком мало информации.

Если вы действительно хотите оценить пространственное изменение температуры на диске, единственный разумный способ, который я вижу, - это рассматривать проблему как проблему усвоения данных . Здесь вам необходимо как минимум ограничить параметрическую форму пространственного распределения, основываясь на некоторых физических соображениях (это может быть из моделирования или из связанных данных в системах с аналогичной динамикой).

Я не знаю вашего конкретного применения, но если это что-то вроде этого , то я бы предположил, что есть обширная техническая литература, на которую вы могли бы опираться, чтобы выбрать соответствующие предыдущие ограничения. (Для такого рода детального знания предметной области, это, вероятно, не лучший сайт StackExchange, о котором можно спросить.)

GeoMatt22
источник
Впечатляющий ответ! Нужно время, чтобы переварить это. Вы задаете два вопроса: я не уверен, что понимаю первый («сколько ограничений на пространственную схему вам нужно?»). Я подумал, что использование данных со всех 40 датчиков будет лучше, чем просто усреднение по окружному направлению и тогда примерка ... ты говоришь, что это не обязательно правда? Что касается второго («какие виды изменчивости встречаются в пространственно-временных данных»), в следующие один или два дня я проанализирую первый движок (у меня их на самом деле 5!), Но это будет темой будущий вопрос ...) ctd ...
DeltaIV
... ctd, я нормализую данные и посмотрю, что я смогу опубликовать на общедоступном сайте. Некоторые пространственные модели и некоторые временные ряды ... Я думаю, они должны дать вам представление о том, что вы спрашиваете.
DeltaIV
1
На мой первый вопрос: если ваша конечная цель состоит в том, чтобы «предсказать результаты датчиков для нового двигателя» (исходя из вашего другого вопроса), то вам действительно нужна какая-либо информация от «между датчиками»? Мой комментарий по ступенчатости был пример того , почему вы бы нужна такая информация, если , например не надежно измерена на датчиках. T95
GeoMatt22
1
КСТАТИ, если это проблема проектирования, и есть связанные моделирования типа CFD, то это значительно больше информации, чем подразумевается текущим вопросом. (Например, подход к проблеме как к ассимиляции данных может использовать разные подходы.)
GeoMatt22
Ваш ответ заставляет меня задуматься: существует ли какой-либо 2-мерный эквивалент дискретного преобразования Фурье вместо регрессии? Например, взять интеграл точек данных, умноженный на n-ю функцию Бесселя (соответствующим образом измененный), и затем получить ортогональное разложение? Беспокойство здесь будет заключаться в том, чтобы: 1) найти соответствующую дискретизированную функцию, возможно, в том же направлении, что и ваш ответ, и 2) будет ли она слишком чувствительной к небольшому количеству точек выборки, а декомпозиция будет опираться на более сложные члены более высокого порядка ,
Jwimberley
2

Подобные Церну полиномы не кажутся плохим выбором, поскольку в них уже есть зависимость и и ортогональность. Однако, поскольку вы изучаете температуру, возможно, более подходящим и более известным выбором будут функции Бесселя . Они возникают при изучении теплового потока в цилиндрических объектах / системах координат, и поэтому есть шанс, что они физически более уместны. N-я функция Бесселя дала бы радиальную зависимость, связанную с соответствующей тригонометрической функцией для полярной зависимости; Вы можете найти подробности во многих учебниках по физике и PDE.rθ

jwimberley
источник
(+1) Хорошая связь с уравнением теплопроводности в полярных координатах. Еще один, возможно, стоит упомянуть, что для гауссовых процессов, которые я обычно знаю, на прямоугольных сетках ковариационная матрица циркулянтна, и практически используются БПФ. Таким образом, функции Бесселя были бы вероятным кандидатом для подобного подхода на полярной сетке.
GeoMatt22
Интересное предложение! Однако я измеряю температуру в рабочей жидкости, а не в твердой части двигателя. Таким образом, меня интересует проблема конвекции, а не проблема проводимости. Функции Бесселя, безусловно, являются решениями уравнения теплопроводности (Фурье), но я не думаю, что они тоже являются решением уравнения теплопроводности, поскольку конвекция зависит от поля потока жидкости. Во всяком случае, я мог по крайней мере проверить их против Zernike. Как насчет GLS? Не могли бы вы добавить что-нибудь по этой части вопроса?
DeltaIV
@DeltaIV Я не слишком знаком с GLS, но один вопрос - почему вы ожидаете, что ошибки будут коррелироваться в разных пространственных точках? Я согласен, что реальные колебания будут коррелироваться между точками, но я думаю, что ошибки (то есть неопределенность в показаниях датчика) не будут коррелированными. Возможно, для регрессии колебания считаются ошибками? Однако я подумываю добавить что-нибудь о штрафных санкциях. Какой бы базис вы ни использовали, у вас есть только конечное число точек выборки, и вы можете найти какую-то функцию соответствия Бесселя очень высокого порядка, поэтому предпочтение следует отдавать терминам самого низкого порядка.
jwimberley
@DeltaIV Еще раз о флуктуациях, которые привели бы к корреляции между пространственными точками: ваш объект должен получить карту температуры, не так ли? Разве вы не хотите видеть, какие колебания происходят? И может ли статистическая модель даже объяснить их, поскольку флуктуации будут обусловлены динамикой жидкости и будут сложными в пространстве и времени? (
Связано
Галерея чат создан .
DeltaIV