Как рассчитать доверительные интервалы для объединенных нечетных отношений в метаанализе?

9

У меня есть два набора данных из общих исследований генома ассоциации. Единственной доступной информацией являются нечетные отношения и их доверительные интервалы (95%) для каждого генотипированного SNP. Я хочу создать лесной участок, сравнивая эти два коэффициента, но я не могу найти способ рассчитать комбинированные доверительные интервалы для визуализации суммарных эффектов. Я использовал программу PLINK для выполнения мета-анализа с использованием фиксированных эффектов, но программа не показала эти доверительные интервалы.

  • Как я могу рассчитать такие доверительные интервалы?

Доступные данные:

  • Нечетные соотношения для каждого исследования,
  • 95% доверительные интервалы и
  • Стандартные ошибки.
BIBB
источник

Ответы:

10

В большинстве мета-анализа отношений шансов стандартные ошибки основаны на журнале отношений шансов . Итак, вы случайно не знаете, как были оценены ваши (и какой показатель они отражают? или )? Учитывая, что основаны на , объединенная стандартная ошибка (в модели с фиксированным эффектом) может быть легко вычислена. Сначала давайте вычислим весовые коэффициенты для каждого размера эффекта: . Во-вторых, объединенная стандартная ошибка: . Кроме того, пусть л о г ( О Р я ) ы е я О Р л о г ( О Р ) с е я л о г ( О Р я ) ш я = 1sеяLог(Оря)sеяОрLог(Ор)sеяLог(Оря) ыеFEM=весязнак равно1sея2sеFЕMзнак равно1ΣвесLог(ОрFЕM)быть общим эффектом (модель с фиксированным эффектом). Затем 95-процентный доверительный интервал («объединенный») равен .Lог(ОрFЕM)±1,96sеFЕM

Обновить

Поскольку BIBB любезно предоставил данные, я могу провести «полный» метаанализ в R.

library(meta)
or <- c(0.75, 0.85)
se <- c(0.0937, 0.1029)
logor <- log(or)
(or.fem <- metagen(logor, se, sm = "OR"))

> (or.fem <- metagen(logor, se, sm = "OR"))
    OR            95%-CI %W(fixed) %W(random)
1 0.75  [0.6242; 0.9012]     54.67      54.67
2 0.85  [0.6948; 1.0399]     45.33      45.33

Number of trials combined: 2 

                         OR           95%-CI       z  p.value
Fixed effect model   0.7938  [0.693; 0.9092] -3.3335   0.0009
Random effects model 0.7938  [0.693; 0.9092] -3.3335   0.0009

Quantifying heterogeneity:
tau^2 < 0.0001; H = 1; I^2 = 0%

Test of heterogeneity:
    Q d.f.  p.value
 0.81    1   0.3685

Method: Inverse variance method

Ссылки

См., Например, Lipsey / Wilson (2001: 114)

Бернд Вайс
источник
Большое спасибо за Ваш ответ. Стандартные ошибки основаны на натуральном логарифме ИЛИ Ln (ORi). Сначала я вычисляю веса для SE1 (0,0937) = 10,67 и для SE2 (0,1029) = 9,71. Таким образом, вычисленная SE в соответствии с FEM равна = 0,2215. Объединенное ИЛИ для этих SNP составляет = 0,7645, поэтому 95% доверительные интервалы равны = (0,515-1,228). Правильно ли я? Если да, то я волнуюсь, потому что, когда я сравниваю все результаты на лесных участках, комбинированные интервалы слишком велики по сравнению с оригиналами в каждом исследовании = исследование 1 = 95% ДИ (0,63-0,91) ИЛИ = 0,75, исследование 2 95% ДИ (0,69-1,04) ИЛИ = 0,85. Это все хорошо? Спасибо
BIBB
Нет, к сожалению нет. Обратите внимание, что моя формула для была неправильной, это не . Как видите, «объединенный» 95% ДИ составляет [0,693; 0,9092]. Мне также интересно, почему ваше объединенное ИЛИ отличается (0,7645 против 0,7938). Извините, мне нужно идти, но я вернусь к нему завтра ...вес1/(sе2)1/sе
Бернд Вайс
Спасибо большое !!!, этот результат более последовательный, чем мой. Объединенное ИЛИ, которое я вам даю, было в выводе PLINK ... теперь я очень обеспокоен всеми результатами моего мета-анализа ... Я бы лучше использовал R.
BIBB
Я включил ссылку на книгу Липси / Уилсона «Практический метаанализ» (см. Список литературы). Я немного обеспокоен тем, что PLINK и мои результаты отличаются. Вы знаете, какую методологию мета-анализа они используют? Вы также должны принять во внимание, что я абсолютно не имею понятия об «исследованиях геномных ассоциаций».
Бернд Вайс
Спасибо за решение, мне интересно, могу ли я применить метод мета-анализа к моей проблеме. Что я делаю, так это симулирую регрессию, вызывая некоторый шум. Я запускаю анализ n раз (скажем, n равно 500) и получаю n OR и CI. Вот ссылка на вопрос: stats.stackexchange.com/questions/206042/… . Таким образом, я могу реализовать функцию «метаген», вызывающую каждое логическое ИЛИ и стандартную ошибку. n
Предвзято
3

На самом деле, вы можете использовать программное обеспечение, такое как METAL, которое специально разработано для метаанализа в контексте GWA.

журнал(ИЛИ)пZ

Метод Бернда еще точнее.

Помните, что меня больше беспокоит направление эффекта, так как похоже, что у вас есть только сводные статистические данные по каждому исследованию, но нет уверенности, что это за аллель ИЛИ. Если вы не знаете, что это сделано на том же аллеле.

Кристиан

genotepes
источник
0

Это комментарий (не хватает реп. Баллов). Если вы знаете размер выборки (#cases и #controls) в каждом исследовании и отношение шансов для SNP, вы можете восстановить таблицу 2x2 case / control по a / b (где a и b - два аллеля) для каждое из двух исследований. Затем вы можете просто добавить эти значения, чтобы получить таблицу для мета-исследования, и использовать ее для вычисления комбинированного отношения шансов и доверительных интервалов.

Или цук
источник
Спасибо за ваш ответ. К сожалению, у меня нет частот или количества аллелей, авторы не показывали эти данные, они просто указали SNP ID, OR и доверительные интервалы (95%). Я просто извлекал значение SE из каждого исследования, но теперь не объединяю их (SE или CI) !!!! Помогите!!
BIBB
О, вы правы - здесь нужна еще одна степень свободы. Обычно авторы приводят аллель freq. (иногда похоронен в оп. информации.). Если нет, вы можете найти его из внешнего источника, такого как HAPMAP (при условии, что GWAS был сделан для аналогичного населения). Другая идея: сам доверительный интервал может сказать вам аллель частоты. При прочих равных условиях (размер выборки и ИЛИ), SNP с низкой частотой аллеля. иметь меньше носителей в обеих группах, следовательно, более широкий доверительный интервал. Вы можете попробовать разные частоты аллелей, рассчитать доверительный интервал для каждого и получить частоту аллелей. соответствует тому, что было сообщено
или Zuk
Я постараюсь это сделать, но пока мне интересно, как PLINK может вычислять объединенное ИЛИ только с такими параметрами: идентификатор SNP, отношение шансов ИЛИ (или БЕТА и т. Д.) И стандартная ошибка SE ИЛИ (или пользователя определено поле веса). Вы можете понять, что PLINK не просил аллельные частоты ... так что есть способ сделать это ...
BIBB
0

Вот код для получения КИ для мета-анализа, как в PLINK:

getCI = function(mn1, se1, method){
    remov = c(0, NA)
    mn    = mn1[! mn1 %in% remov]
    se    = se1[! mn1 %in% remov]
    vars  <- se^2
    vwts  <- 1/vars

    fixedsumm <- sum(vwts * mn)/sum(vwts)
    Q         <- sum(((mn - fixedsumm)^2)/vars)
    df        <- length(mn) - 1
    tau2      <- max(0, (Q - df)/(sum(vwts) - sum(vwts^2)/sum(vwts)) )

    if (method == "fixed"){ wt <- 1/vars } else { wt <- 1/(vars + tau2) }

    summ <- sum(wt * mn)/sum(wt)
    if (method == "fixed") 
         varsum <- sum(wt * wt * vars)/(sum(wt)^2)
    else varsum <- sum(wt * wt * (vars + tau2))/(sum(wt)^2)

    summtest   <- summ/sqrt(varsum)
    df         <- length(vars) - 1
    se.summary <- sqrt(varsum)
    pval       = 1 - pchisq(summtest^2,1)
    pvalhet    = 1 - pchisq(Q, df)
    L95        = summ - 1.96*se.summary
    U95        = summ + 1.96*se.summary
    # out = c(round(c(summ,L95,U95),2), format(pval,scientific=TRUE), pvalhet)   
    # c("OR","L95","U95","p","ph")
    # return(out)

    out = c(paste(round(summ,3), ' [', round(L95,3), ', ', round(U95,3), ']', sep=""),
            format(pval, scientific=TRUE), round(pvalhet,3))
    # c("OR","L95","U95","p","ph")
    return(out)
}

Вызов функции R:

getCI(log(plinkORs), plinkSEs)
Панкай
источник