Предположим, что у одного есть две независимые выборки из одной и той же совокупности, и для двух выборок использовались разные методы для получения точечной оценки и доверительных интервалов. В тривиальных случаях разумный человек просто объединяет две выборки и использует один метод для проведения анализа, но давайте пока предположим, что необходимо использовать другой метод из-за ограничения одной из выборок, такого как отсутствующие данные. Эти два отдельных анализа позволили бы получить независимые, одинаково действительные оценки для интересующего населения атрибута. Интуитивно я думаю, что должен быть способ правильно объединить эти две оценки, как с точки зрения точечной оценки, так и доверительного интервала, что приведет к лучшей процедуре оценки. У меня вопрос, что должно быть лучшим способом сделать это? Я могу представить какое-то взвешенное среднее значение в соответствии с информацией / размером выборки в каждой выборке, но как насчет доверительных интервалов?
источник
Для меня это очень похоже на метаанализ . Ваше предположение, что выборки принадлежат одной и той же популяции, означает, что вы можете использовать метаанализ с фиксированным эффектом (а не метаанализ со случайными эффектами). Общий метод обратной дисперсии принимает набор независимых оценок и их отклонений в качестве входных данных, поэтому не требует полных данных и работает, даже если для разных выборок использовались разные оценки. Затем объединенная оценка представляет собой средневзвешенное значение отдельных оценок, взвешивающее каждую оценку обратно пропорционально ее дисперсии. Дисперсия комбинированной оценки является обратной величиной суммы весов (обратных дисперсий).
Вы хотите работать в масштабе, где выборочное распределение оценки является приблизительно нормальным, или, по крайней мере, в масштабе, в котором доверительные интервалы являются приблизительно симметричными, поэтому логарифмически преобразованная шкала является обычной для оценок отношения (отношения риска, отношения шансов, скорость отношения ...). В других случаях было бы полезно стабилизирующее дисперсию преобразование , например преобразование квадратного корня для данных Пуассона, преобразование квадратного корня арксинуса для биномиальных данных и т. Д.
источник
Это мало чем отличается от стратифицированного образца. Таким образом, объединение выборок для точечной оценки и стандартной ошибки кажется разумным подходом. Две выборки будут взвешены по пропорции выборки.
источник
См. Статью: К. М. Скотт, X. Лу, С. М. Кавано, Дж. С. Лю, Оптимальные методы оценки кинетических изотопных эффектов при различных формах уравнения перегонки Рэлея, Geochimica et Cosmochimica Acta, том 68, выпуск 3, 1 февраля 2004 года, страницы 433- 442, ISSN 0016-7037, http://dx.doi.org/10.1016/S0016-7037(03)00459-9 . ( http://www.sciencedirect.com/science/article/pii/S0016703703004599 )
источник