Я анализирую распределение сетевых задержек. Среднее время загрузки (U) составляет 0,5 с. Среднее время загрузки (D) составляет 2 с. Тем не менее, среднее общее время (для каждой точки данных, T = U + D) составляет 4 с.
Какие выводы можно сделать, зная, что медиана суммы намного больше, чем сумма медиан аддендов?
Просто из любопытства к статистике, что бы это значило, если бы этот вопрос заменил медиану на среднюю?
random-variable
median
summations
Дэвид Фокс
источник
источник
Ответы:
Очень просто построить отдельные примеры, где такие вещи происходят, но это также часто встречается в непрерывных ситуациях.
Например, это может произойти с асимметричными непрерывными распределениями - с тяжелым правым хвостом медианы могут быть и маленькими, но медиана суммы «подтянута», потому что есть хороший шанс, что один из двух будет большим, и значение выше Медиана, как правило, будет намного выше, делая медиану суммы больше, чем сумма медиан.
Вот явный пример: возьмите . ТогдаX1иX2имеют медиануlog(2)≈0,693,поэтому сумма медиан составляет менее1,4, ноX1+X2∼Гамма(2,1), медиана которыхравна≈1,687(на самом деле-W-1(-1Икс1, X2~н.о.р.Exp( 1 ) Икс1 Икс2 журнал( 2 ) ≈ 0,693 1.4 Икс1+ X2∼ Гамма( 2 , 1 ) ≈ 1.678 по Вольфраму Альфе)- W- 1( - 12 е) - 1
источник