Я тестирую датчики положения дроссельной заслонки (TPS), которые продает мой бизнес, и печатаю график реакции напряжения на вращение вала дроссельной заслонки. TPS - это датчик вращения с диапазоном 90 °, а выходной сигнал подобен потенциометру с полным открытием, равным 5 В (или входным значением датчика), и начальным открытием, являющимся некоторым значением в диапазоне от 0 до 0,5 В. Я построил испытательный стенд с контроллером PIC32 для измерения напряжения каждые 0,75 °, и черная линия соединяет эти измерения.
Один из моих продуктов имеет тенденцию создавать локализованные отклонения с малой амплитудой от идеальной линии (и под ней). Этот вопрос о моем алгоритме количественной оценки этих локализованных «провалов»; Что такое хорошее название или описание для процесса измерения провалов? (полное объяснение приведено ниже). На приведенном ниже рисунке провал происходит в левой трети графика и представляет собой предельный случай, если я пропущу или не выполню эту часть:
Поэтому я построил детектор провала ( стековый поток по алгоритму ), чтобы измерить мое внутреннее чувство. Сначала я думал, что измеряю «площадь». Этот график основан на распечатке выше и моей попытке объяснить алгоритм графически. Между 13 и 31 пробой длится 13 проб:
Тестовые данные поступают в массив, и я создаю другой массив для «подъема» из одной точки данных в другую, которую я называю . Я использую библиотеку, чтобы получить среднее и стандартное отклонение для .д е л т ы
Анализ массива представлен на графике ниже, где наклон снят с графика выше. Первоначально я думал об этом как о «нормализации» или «унификации» данных, так как ось х - это равные шаги, и теперь я работаю исключительно с ростом между точками данных. Исследуя этот вопрос, я вспомнил, что это производная, исходных данных.д у
Я иду через чтобы найти последовательности, где есть 5 или более смежных отрицательных значений. Синие столбцы - это ряд точек данных, которые находятся ниже среднего значения всех . Значения синих полос:д е л т ы
Они составляют , которые представляют площадь (или интеграл). Моя первая мысль: «Я просто интегрировал производную», что должно означать, что я получаю исходные данные, хотя я уверен, что для этого есть термин.
Зеленая линия - это среднее значение этих «значений ниже среднего», полученных путем деления площади на длину провала:
Во время тестирования 100+ деталей я решил, что допустимы провалы со средним значением зеленой линии менее . Стандартное отклонение, рассчитанное по всему набору данных, не было достаточно строгим тестом для этих провалов, так как без достаточной общей площади они все еще находились в пределах, установленных мною для хороших деталей. Я наблюдательно выбрал стандартное отклонение чтобы быть самым высоким, которое я позволил бы.
Установка предела для стандартного отклонения, достаточно строгого для выхода из строя этой части, будет в таком случае настолько строгой, чтобы выходить из строя частей, которые в противном случае выглядят великолепно. У меня также есть детектор всплеска, который не выполняет часть, если таковые имеются .
После Calc 1 прошло уже почти 20 лет, поэтому, пожалуйста, будьте осторожны со мной, но это похоже на то, когда профессор использовал исчисление и уравнение смещения, чтобы объяснить, как в гонках конкурент с меньшим ускорением, который поддерживает более высокую скорость на поворотах, может обыграть другого участник, имеющий большее ускорение к следующему повороту: если пройти предыдущий поворот быстрее, более высокая начальная скорость означает, что площадь под его скоростью (смещение) больше.
Чтобы перевести это на мой вопрос, я чувствую, что моя зеленая линия была бы как ускорение, вторая производная от исходных данных.
Я посетил Википедию, чтобы перечитать основы исчисления и определения производных и интегральных , выучил правильный термин для сложения площади под кривой с помощью дискретных измерений как Числовая интеграция . Гораздо больше гуглят в среднем по интегралу, и меня ведут к теме нелинейности и цифровой обработки сигналов. Усреднение интеграла представляется популярной метрикой для количественной оценки данных .
Есть ли термин для среднего интеграла? ( , зеленая линия)?
... или для использования его для оценки данных?
источник
Ответы:
Прежде всего, это отличное описание вашего проекта и проблемы. И я большой поклонник вашей домашней измерительной системы, которая очень крутая ... так почему же важно, что вы называете "усреднением интегралов"?
Если вы заинтересованы в более широком позиционировании своей работы, то, что вы хотели бы сделать, часто называют обнаружением аномалий . В простейшем случае он включает сравнение значения во временном ряду со стандартным отклонением предыдущих значений. Правило будет тогда, если где является значением в ряд, - это стандартное отклонение всех предыдущих значений между значениями и и
Если я правильно понял, вы ищете способ автоматизировать тестирование ваших устройств, то есть объявить устройство исправным / неисправным после того, как оно выполнило весь тест (нарисовал всю диагональ). В этом случае просто рассмотрите приведенные выше формулы как сравнение со стандартным отклонением всех значений.x[n]
Есть также другие правила, которые вы можете рассмотреть с целью классификации устройства как неисправного:
Конечно, вы можете найти больше правил и объединить их, используя логическую логику, но я думаю, что вы можете продвинуться далеко вперед с тремя вышеупомянутыми.
И последнее, но не менее важное: после того, как вы его настроите, вам нужно будет протестировать классификатор (классификатор - это система / модель, отображающая входные данные в класс, в вашем случае данные каждого устройства, либо «хорошие», либо « неисправна "). Создайте набор тестирования, вручную пометив производительность каждого устройства. Затем посмотрите на ROC , который в основном говорит вам смещение между тем, сколько устройств ваша система правильно выбирает из возвращенных, по отношению к тому, сколько неисправных устройств она поднимает.
источник