Я сравниваю два устройства контроля температуры, оба из которых предназначены для поддержания температуры тела на уровне точно 37 градусов у анестезированных пациентов. Аппараты были установлены на 500 пациентов, составляющих две группы. Группа A (400 пациентов) - Устройство 1, Группа B (100 пациентов) - Устройство 2. Температура каждого пациента измерялась один раз в час в течение 36 часов, что дало мне 18000 точек данных в двух группах. Мне нужно определить, какое устройство более точно контролирует температуру тела пациента в течение 36 часов. Я построил линейные графики, соединяющие средние значения в каждой временной точке с квартильными столбиками, и визуально кажется, что есть разница. Как я должен анализировать свои данные, чтобы доказать статистическую разницу?
10
Ответы:
Первое, о чем вам нужно подумать, это то, что означает (количественно) иметь «хорошую точность» в таком устройстве. Я бы предположил, что в медицинском контексте цель состоит в том, чтобы избежать отклонений температуры, которые попадают в опасный диапазон для пациента, поэтому «хорошая точность», вероятно, приведет к избежанию опасно низких или высоких температур. Это означает, что вы будете искать метрику, которая сильно штрафует большие отклонения от вашей оптимальной температуры 37 C. Ввиду этого, измерение, основанное на колебаниях средних температур, будет плохой мерой точность, тогда как меры, которые выделяют большие отклонения, будут лучше.о
Когда вы формулируете этот тип метрики, вы неявно принимаете «штрафную функцию», которая штрафует температуры, которые отклоняются от желаемой температуры. Одним из вариантов будет измерение «точности» по меньшей дисперсии вокруг желаемой температуры (рассматривая это как фиксированное среднее значение для расчета дисперсии). Дисперсия штрафуется квадратной ошибкой, что дает разумное наказание за большие отклонения. Другим вариантом будет наказание более строго (например, ошибка в кубе). Другой вариант заключается в том, чтобы просто измерить количество времени, в течение которого у каждого устройства пациент находится за пределами температурного диапазона, который является медицински безопасным. В любом случае все, что вы выберете, должно отражать опасность отклонения от желаемой температуры.
После того, как вы определили, что составляет метрику «хорошей точности», вы собираетесь сформулировать своего рода «тест гетероскедастичности», сформулированный в более широком смысле, позволяющий использовать любую меру точности, которую вы используете. Я не уверен, что согласен с тем, что Уабер прокомментировал для автокорреляции. Это действительно зависит от вашей формулировки потери - в конце концов, пребывание в высокотемпературном диапазоне в течение длительного периода времени может быть самой опасной вещью, поэтому, если вы вернетесь к учету автокорреляции, вы можете закончить до неспособности оштрафовать очень опасные результаты в достаточной степени.
источник
Это проверка гомоскедастичности. А поскольку это временные ряды, подходящим выбором является критерий Брейша-Пэгана , а не F-критерий. Этот тест отвечает только на вопрос равенства точности между двумя устройствами. Уровень точности является еще одним способом мышления дисперсии.
[Правка: изменил тест на правильный, учитывая зависимость от времени]
источник
Если вас интересует, насколько хорошо устройства поддерживают температуру 37C, вы можете:
Данные, естественно, поддаются повторным мерам лечения. Рассматривая внутригрупповые испытания как кластеры, вы уменьшите вероятность ошибочно оцененного доверительного интервала вокруг воздействия устройства. Кроме того, вы можете проверить влияние времени между обоими устройствами или как взаимодействие с устройством, чтобы убедиться, что поддержание температуры во времени было хорошим. Поиск способа визуализировать все это имеет ключевое значение и может предложить один подход по сравнению с другим. Что-то вроде:
источник