Я работаю с большим набором данных акселерометра, собранных несколькими датчиками, которые носят многие люди. К сожалению, здесь никто не знает технических характеристик устройств, и я не думаю, что они когда-либо были откалиброваны. У меня нет много информации об устройствах. Я работаю над магистерской диссертацией, акселерометры были заимствованы из другого университета, и в целом ситуация была немного прозрачной. Итак, предварительная обработка на борту устройства? Понятия не имею.
Что я знаю, так это то, что это трехосные акселерометры с частотой дискретизации 20 Гц; цифровой и предположительно MEMS. Меня интересует невербальное поведение и жесты, которые, по моим источникам, должны в основном производить активность в диапазоне 0,3-3,5 Гц.
Нормализация данных кажется совершенно необходимой, но я не уверен, что использовать. Очень большая часть данных близка к остальным значениям (необработанные значения ~ 1000 от силы тяжести), но есть некоторые крайности, например, до 8000 в некоторых журналах или даже 29000 в других. Смотрите изображение ниже . Я думаю, что это делает плохой идеей деление на max или stdev для нормализации.
Какой обычный подход в таком случае? Разделить на медиану? Процентиль значение? Что-то другое?
Как побочный вопрос, я также не уверен, должен ли я обрезать крайние значения ..
Спасибо за любой совет!
Изменить : вот график около 16 минут данных (20000 выборок), чтобы дать вам представление о том, как данные обычно распределяются.
Ответы:
Необработанные сигналы, которые вы показываете выше, кажутся нефильтрованными и некалиброванными. Надлежащая фильтрация и калибровка с некоторым отклонением артефактов фактически нормализуют данные. Стандартный подход с данными акселерометра заключается в следующем:
Желательно выполнить отклонение артефакта на данных инерциального датчика. Я был бы обеспокоен тем, что вы не знаете происхождение данных, и поэтому вы не можете гарантировать, что датчики были правильно и последовательно прикреплены (с точки зрения ориентации и физического размещения) ко всем объектам. Если датчики не были прикреплены правильно, вы можете получить много артефактов в сигналах, так как датчик может двигаться относительно сегмента тела. Точно так же, если датчики были ориентированы по-разному (в том, как они были расположены) на разных предметах, данные будет трудно сравнивать по предметам.
Учитывая размер выбросов, о которых вы сообщаете, они, вероятно, являются артефактами. Такие артефакты почти наверняка искажают любые расчеты калибровки (хотя их влияние будет уменьшено соответствующей фильтрацией), и поэтому калибровку следует выполнять после отклонения артефакта.
Простой порог может хорошо работать для начальной процедуры отклонения артефакта, то есть удалить (или заменить
NaN
) все образцы выше определенного эмпирического порога. Более сложные методы будут адаптивно рассчитывать этот порог, используя среднее значение или скользящее окно.В зависимости от местоположения датчика вы также можете скорректировать влияние силы тяжести на сигналы ускорения, хотя детальное понимание осей и позиционирования датчика здесь имеет решающее значение. Метод Мо-Нильсона ( Р. Мо-Нильсен, Новый метод оценки двигательного контроля в походке в реальных условиях окружающей среды. Часть 1. Инструмент, Клиническая биомеханика, том 13, выпуски 4–5, июнь – июль 1998 г., Стр. 320-327 ) является наиболее часто используемым и хорошо работает для инерционных датчиков, установленных на нижней части спины.
Хорошим местом для начала изучения данных для распознавания жестов было бы разбить отфильтрованные, откалиброванные данные на эпохи (например, 10 с) и рассчитать количество функций для каждой эпохи и связать их с метками, которые у вас есть для данных, я могу ' не дают более конкретных советов, не зная больше о наборе данных и связанных ярлыках.
Надеюсь это поможет.
источник