Являются ли эти формулы для преобразования P, LSD, MSD, HSD, CI в SE точной или завышенной / консервативной оценкой ?

11

Фон

Я провожу метаанализ, который включает ранее опубликованные данные. Часто о различиях между обработками сообщают с помощью значений Р, наименее значимых различий (ЛСД) и других статистических данных, но они не дают прямой оценки дисперсии.

В контексте модели, которую я использую, переоценка дисперсии в порядке.

проблема

Вот список преобразований в где (Saville 2003), который я рассматриваю, обратная связь приветствуется; ниже я предполагаю, что поэтому и переменные обычно распределяются, если не указано иное:S E = SE α=0,051- α / 2=0,975SE=MSE/n α=0.051α/2=0.975

Вопросы:

  1. заданные , и средства обработки иn ˉ X 1 ˉ X 2 S E = ˉ X 1 - ˉ X 2PnX¯1X¯2

    SЕзнак равноИкс¯1-Икс¯2T(1-п2,2N-2)2/N
  2. заданный LSD (Розенберг 2004) , , , где - количество блоков, и по умолчанию для RCBD n b b n = b S E = L S DαNббNзнак равноб

    SЕзнак равноLSDT(0,975,N)2бN
  3. учитывая MSD (минимальная значимая разница) (Wang 2000) , , , df =α 2 n - 2 S E = M S DNα2N-2

    SЕзнак равноMSDT(0,975,2N-2)2
  4. с доверительным интервалом 95% (Saville 2003) (измеряется от среднего до верхнего или нижнего доверительного интервала ), иn S E = C IαN

    SЕзнак равноСяT(α/2,N)
  5. учитывая HSD Тьюки, , где - это «статистика диапазона измерений»,q S E = H S DNQ

    SЕзнак равноЧАСSDQ(0,975,N)

Функция R для инкапсуляции этих уравнений:

  1. Пример данных:

    data <- data.frame(Y=rep(1,5), 
                       stat=rep(1,5), 
                       n=rep(4,5), 
                       statname=c('SD', 'MSE', 'LSD', 'HSD', 'MSD') 
    
  2. Пример использования:

    transformstats(data)    
    
  3. transformstatsФункция:

    transformstats <- function(data) {
      ## Transformation of stats to SE
      ## transform SD to SE
      if ("SD" %in% data$statname) {
        sdi <- which(data$statname == "SD")
        data$stat[sdi] <- data$stat[sdi] / sqrt(data$n[sdi])
        data$statname[sdi] <- "SE"
          }
      ## transform MSE to SE
      if ("MSE" %in% data$statname) {
        msei <- which(data$statname == "MSE")
        data$stat[msei] <- sqrt (data$stat[msei]/data$n[msei])
        data$statname[msei] <- "SE"
      }
      ## 95%CI measured from mean to upper or lower CI
      ## SE = CI/t
      if ("95%CI" %in% data$statname) {
        cii <- which(data$statname == '95%CI')
        data$stat[cii] <- data$stat[cii]/qt(0.975,data$n[cii])
        data$statname[cii] <- "SE"
      }
      ## Fisher's Least Significant Difference (LSD)
      ## conservatively assume no within block replication
      if ("LSD" %in% data$statname) {
        lsdi <- which(data$statname == "LSD")
        data$stat[lsdi] <- data$stat[lsdi] / (qt(0.975,data$n[lsdi]) * sqrt( (2 * data$n[lsdi])))
        data$statname[lsdi] <- "SE"
      }
      ## Tukey's Honestly Significant Difference (HSD),
      ## conservatively assuming 3 groups being tested so df =2
      if ("HSD" %in% data$statname) {
        hsdi <- which(data$statname == "HSD" & data$n > 1)
        data$stat[hsdi] <- data$stat[hsdi] / (qtukey(0.975, data$n[lsdi], df = 2))
        data$statname[hsdi] <- "SE"
      }              
      ## MSD Minimum Squared Difference
      ## MSD = t_{\alpha/2, 2n-2}*SD*sqrt(2/n)
      ## SE  = MSD*n/(t*sqrt(2))
      if ("MSD" %in% data$statname) {
        msdi <- which(data$statname == "MSD")
        data$stat[msdi] <- data$stat[msdi] * data$n[msdi] / (qt(0.975,2*data$n[lsdi]-2)*sqrt(2))
        data$statname[msdi] <- "SE"
      }
      if (FALSE %in% c('SE','none') %in% data$statname) {
        print(paste(trait, ': ERROR!!! data contains untransformed statistics'))
      }
      return(data)
    }
    

Рекомендации

Saville 2003Can J. Exptl Psych. (PDF)

Розенберг и др. 2004 (ссылка)

Ван и соавт. 2000 Env. Tox. и Chem. 19 (1): 113-117 (ссылка)

Дэвид
источник
Я не уверен, что большинство CI действительно вычисляются через t-значения или, вернее, через z-значения. Однако при больших ns (> 30) это не должно иметь большого значения.
Хенрик,
@ Генрик для малых , t-статистика подходит, и, как вы сказали, при увеличении t приближается к Z. См. Также math.stackexchange.com/q/23246/3733нNN
Дэвид ЛеБауэр,

Ответы:

7

Ваше уравнение ЛСД выглядит хорошо. Если вы хотите вернуться к дисперсии и у вас есть сводная статистика, которая говорит что-то об изменчивости или значимости эффекта, то вы почти всегда можете вернуться к дисперсии - вам просто нужно знать формулу. Например, в вашем уравнении для ЛСД, которое вы хотите найти для MSE, MSE = (LSD / t _) ^ 2/2 * b

Джон
источник
Для MSD, если MSD = t_ {alpha, 2n-2} * sd sqrt (2 / n), является ли SE = MSD n / (t_ {alpha, n} * sqrt (2)) правильным?
Дэвид Лебауэр
7

Я могу только согласиться с Джоном. Кроме того, возможно, эта статья Дэвида Савилла поможет вам с некоторой формулой для пересчета мер изменчивости из LSD и др .:
Saville DJ (2003). Основные статистические данные и несоответствие нескольких процедур сравнения. Канадский журнал экспериментальной психологии, 57, 167–175

ОБНОВЛЕНИЕ:
Если вы ищете больше формул для преобразования между различными величинами эффекта, книги по метаанализу должны предоставить много из них. Тем не менее, я не эксперт в этой области и не могу рекомендовать его.
Но я помню, что книга Розенталя и Рознова когда-то помогла с какой-то формулой:
Основы поведенческих исследований: методы и анализ данных.
Кроме того, я услышал много хорошего о формулах в этой книге Розенталя, Роснова и Рубина (хотя Я никогда не использовал его):
Контрасты и размеры эффектов в поведенческих исследованиях: корреляционный подход (вы обязательно должны попробовать его, если есть в ближайшей библиотеке).

Если этого недостаточно, возможно, задайте еще один вопрос по литературе для преобразования величин эффекта для метаанализа. Возможно, у кого-то больше в мета-анализе есть более обоснованные рекомендации.

Хенрик
источник
0

Вы можете попробовать R пакет compute.es . Существует несколько функций для получения оценок размера эффекта и дисперсии размера эффекта.

user3752
источник
это хороший пакет, который вы написали, но я заинтересован в оценке выборки SE, и эти функции, по-видимому, дают оценки дисперсии для размеров эффекта мета-анализа, в то время как я хотел бы вывести дисперсию совокупности (например, масштабировать до исходные данные). Не могли бы вы привести пример того, как функции в compute.esпакете можно использовать для воспроизведения уравнений и функций, которые я написал выше?
Дэвид Лебауэр