Я не могу найти окончательный ответ на мой вопрос.
Мои данные состоят из нескольких графиков с измеренными средними значениями от 0,27 до 0,57. В моем случае все значения данных положительные, но само измерение основано на соотношении значений отражательной способности, которое может варьироваться от -1 до +1. Графики представляют значения NDVI , удаленного индикатора растительности "продуктивность".
Мое намерение состояло в том, чтобы сравнить изменчивость значений на каждом графике, но, поскольку каждый график имеет различное среднее значение, я выбрал CV, чтобы измерить относительную дисперсию значений NDVI на график.
Из того, что я понимаю, взятие CV этих графиков не является кошерным, потому что каждый график может иметь как положительные, так и отрицательные значения. Почему в таких случаях нецелесообразно использовать резюме? Какими могут быть жизнеспособные альтернативы (например, аналогичный критерий относительной дисперсии, преобразования данных и т. Д.)?
источник
Ответы:
Подумайте о том, что такое резюме: отношение стандартного отклонения к значению. Но если переменная может иметь положительные и отрицательные значения, среднее значение может быть очень близко к 0; таким образом, CV больше не делает то, что должен делать: то есть дает представление о том, насколько велик sd по сравнению со средним значением.
РЕДАКТИРОВАТЬ: В комментарии я сказал, что если вы могли бы разумно добавить константу в переменную, CV не годится. Вот пример:
х2 - это просто х + 10. Я думаю, что интуитивно понятно, что они одинаково переменны; но резюме отличается.
Реальный пример этого может быть, если x - это температура в градусах C, а x2 - это температура в градусах K (хотя можно утверждать, что K - это правильный масштаб, поскольку он имеет определенный 0).
источник
Я думаю о них как о разных моделях вариаций. Существуют статистические модели, в которых CV постоянно. Где эти работы, можно сообщить резюме. Существуют модели, в которых стандартное отклонение является степенной функцией среднего значения. Существуют модели, в которых стандартное отклонение является постоянным. Как правило, модель с постоянным CV является лучшим начальным предположением, чем модель с постоянным SD, для переменных масштаба. Вы можете предположить, почему это так, возможно, основываясь на распространенности мультипликативных, а не аддитивных взаимодействий.
Постоянно-CV моделирование часто связано с логарифмическим преобразованием. (Важным исключением является неотрицательный ответ, который иногда равен нулю.) Есть несколько способов взглянуть на это. Во-первых, если CV является постоянным, то log являются обычным стабилизирующим дисперсию преобразованием. В качестве альтернативы, если ваша модель ошибок логнормальна с константой SD в логарифмическом масштабе, то CV представляет собой простое преобразование этой SD. CV примерно равно логарифмическому SD, когда оба малы.
Два способа применения методов статистики 101, таких как стандартное отклонение, относятся к данным так, как вы их получили, или (особенно, если это шкала отношений) к их журналам. Вы делаете лучшее первое предположение, что можете, зная, что природа может быть более сложной и что дальнейшее изучение может быть в порядке. Примите во внимание то, что люди ранее сочли продуктивным с вашими данными.
Вот случай, когда это важно. Химические концентрации иногда суммируются с помощью CV или моделируются в логарифмическом масштабе. Однако pH является логарифмической концентрацией.
источник