Использование децибел в статистике

11

Я работаю над проектом, который включает чтение меток RFID и сравнение уровня сигнала, который читатель видит при изменении конфигурации антенны (количество антенн, положение и т. Д.). Как часть проекта, мне нужно сравнить настройки, чтобы увидеть, какие из них наиболее эффективны.

В идеале я мог бы выполнить либо непарный t-тест, либо ANOVA между двумя положениями антенны (или MANOVA между несколькими). Однако, поскольку ответ выражен в децибелах, которые являются логарифмическими, я задаюсь вопросом, как лучше всего это сделать?

Было бы лучше преобразовать результаты в линейную шкалу и затем сравнить, используя один из методов, которые я упомянул, или я должен использовать децибелы, как они есть, с другим статистическим тестом, чтобы сравнить их?

Брайан Трумэн
источник
2
Взял на себя свободу редактирования тегов. Математическая статистика на практике является бесполезным тегом. Логарифмический ряд относится к чему-то совершенно другому с дискретным ответом.
Ник Кокс
1
Поскольку вы используете тесты, предполагающие распределение по Гауссу, если распределение ответов является «более гауссовым» в дБ, чем в линейном масштабе (т. Е. Исходные данные приблизительно логарифмически нормальны), имеет смысл оставаться в логарифмическом масштабе.
Лука Сити
@NickCox, я думаю, mathematical-statisticsпрекрасно работает при запросе доказательства, соответствующий тег является синонимом предыдущего тега.
Ричард Харди
Возможно, мне следовало сказать «бесполезная метка для такого рода вопроса».
Ник Кокс

Ответы:

5

Преобразование зависит от того, в каком масштабе вы хотите сделать вывод.

Как правило, дисперсия функции не равна функции дисперсии x . Поскольку σ 2 f ( x )f ( σ 2 x ) преобразовывает x с помощью f , затем выполняет статистический вывод (проверки гипотезы или доверительные интервалы) для f ( x ) , а затем обратное преобразование - f - 1 - результаты этого вывода применять к x недопустимо (поскольку и статистика теста, и CI требуют оценки дисперсии).xxσf(x)2f(σx2)xff(x)f1x

Базирование CI на преобразованных переменных + обратное преобразование создает интервалы без номинальных вероятностей покрытия, поэтому обратно преобразованное доверие к оценке, основанной на , не является доверительным отношением к оценке, основанной на x .f(x)x

Аналогичным образом, выводы о нетрансформированных переменных, основанные на проверках гипотез о преобразованных переменных, означают, что любое из следующего может быть верным, например, когда делаются выводы о на основе некоторой группирующей переменной y :xy

  1. значительно различается по y , но f ( x ) существенно не отличается по y .xyf(x)y

  2. xyf(x)y

  3. xyf(x)y

  4. xyf(x)y

f(x)yxy

Таким образом, вопрос о том, следует ли преобразовывать эти дБ, зависит от того, заботитесь ли вы о дБ или о возведенных в степень дБ.

Alexis
источник
14

Строго говоря, нам нужно видеть ваши данные, чтобы иметь какой-либо шанс дать четкий совет, но об этом можно догадаться.

Как вы говорите, децибелы уже в логарифмическом масштабе. Это может означать, по ряду физических и статистических причин, что они вполне могут вести себя хорошо, будучи приблизительно аддитивными, гомоскедастичными и симметрично распределенными в зависимости от предикторов. Но вы можете дать физический или технический аргумент о том, как должен изменяться отклик при изменении переменных проекта.

t

Подобные рассуждения обычно применимы к другим «предварительно преобразованным» логарифмическим шкалам, таким как pH или шкала Рихтера.

PS: Понятия не имею, что такое RFID-метки.

Ник Кокс
источник
4
RFID-метки - это радиочастотные идентификационные метки ... те элементы в вашем паспорте, библиотечных материалах, сколотых кредитных картах и ​​т. Д., Которые делают возможным идентификацию на основе токенов по беспроводной сети.
Алексис
2
Случайно кажущийся отрицательный голос там. У меня нет особых оснований для жалоб, так как у меня есть несколько голосов за небольшую работу, и это не очень хороший ответ. (Я мог бы написать лучше, учитывая некоторые данные.) Но отрицательное голосование бесполезно: без объяснения причин нет возможности изменить чье-либо мнение!
Ник Кокс
3
Я точно знаю? Я действительно желаю, чтобы избиратели оставляли конструктивные отзывы.
Алексис
3

Что ж, единственный способ окончательно ответить на этот вопрос - посмотреть на некоторые данные в децибелах - есть ли простое распределение (например, распределение Гаусса), которое является хорошей моделью для этого? Или экспонента данных лучший кандидат? Я предполагаю, что неэкспоненциальные данные более близки к гауссовским, и поэтому, чтобы сделать любой последующий анализ более простым, вы должны использовать это, но я позволю вам судить об этом.

Я не согласен с вашим предложенным анализом, который заключается в применении критерия значимости для данных наблюдений из разных экспериментов (а именно, из разных положений антенн). От рассмотрения физики этого должно быть некоторое различие, возможно незначительное, возможно существенное. Но априори есть некоторая разница, поэтому при достаточно большом наборе данных вы должны отвергнуть нулевую гипотезу о никакой разнице. Таким образом, результат теста значимости состоит только в том, чтобы заключить: «у вас есть / у вас нет большого набора данных». Это не кажется очень полезным.

Более полезным было бы количественно определить разницу между различными положениями антенны и, возможно, также принять во внимание затраты и выгоды, чтобы решить, какое положение выбрать. Количественные различия иногда называют «анализом величины эффекта»; поиск в Интернете для этого должен привести к появлению некоторых ресурсов. Затраты и выгоды подпадают под заголовок теории полезности и теории принятия решений; снова поиск найдет некоторые ресурсы.

Роберт Додье
источник
2

(Логарифмическая) шкала децибел полезна, поскольку мощность сигнала часто может быть описана (переменным) рядом (или диапазоном флюидов) умножений.

  • 110
  • 1100
  • 11000
  • и т.п.

P[mW]=P0(110)L[cm]

Это проще, если вы выражаете логарифм мощности сигнала в виде линейной функции (которая, если хотите, требует определенного определения абсолютной шкалы, в данном случае 0 дБ относится к 1 мВт)

P[dB]=10(log(P0[mW])L[cm])

Всякий раз, когда у вас есть процесс, который является мультипликативным, как:

XeY

Y

YN(μ,σ2)

Xlog(X)


Я ожидаю, что ваш термин ошибки будет таким же мультипликативным . То есть: уровень сигнала будет суммой многих нормальных распределенных членов ошибки (например, колебаний температуры усилителя, атмосферных условий и т. Д.), Которые встречаются в показателе степени выражения для уровня сигнала.

yi=exi+ϵi
Секст Эмпирик
источник