У меня есть среднемесячное значение и стандартное отклонение, соответствующее этому среднему. Сейчас я вычисляю среднегодовое значение как сумму среднемесячных значений, как я могу представить стандартное отклонение для суммированного среднего значения?
Например, учитывая выход из ветровой электростанции:
Month MWh StdDev
January 927 333
February 1234 250
March 1032 301
April 876 204
May 865 165
June 750 263
July 780 280
August 690 98
September 730 76
October 821 240
November 803 178
December 850 250
Можно сказать, что в среднем году ветроэлектростанция производит 10 358 МВтч, но каково стандартное отклонение, соответствующее этой цифре?
[ASK QUESTION]
вверху и задайте его там, и мы поможем вам должным образом. Поскольку вы новичок здесь, вы можете принять участие в нашем туре , который содержит информацию для новых пользователей.Ответы:
Краткий ответ: Вы усредняете отклонения ; затем вы можете взять квадратный корень, чтобы получить среднее стандартное отклонение .
пример
И тогда среднее стандартное отклонение составляет
sqrt(53,964) = 232
Из суммы нормально распределенных случайных величин :
И из нормального распределения суммы Wolfram Alpha :
Для ваших данных:
10,358 MWh
647,564
804.71 ( sqrt(647564) )
Итак, чтобы ответить на ваш вопрос:
Вы суммируете их квадратично:
Концептуально вы суммируете отклонения, а затем берете квадратный корень, чтобы получить стандартное отклонение.
Потому что я был любопытным, я хотел бы знать , среднемесячную среднюю мощность, а его стандартное отклонение . Через индукцию нам нужно 12 нормальных распределений, которые:
10,358
647,564
Это будет 12 среднемесячных распределений:
10,358/12 = 863.16
647,564/12 = 53,963.6
sqrt(53963.6) = 232.3
Мы можем проверить наши среднемесячные распределения, сложив их 12 раз, чтобы убедиться, что они равны годовому распределению:
863.16*12 = 10358 = 10,358
( правильно )53963.6*12 = 647564 = 647,564
( правильно )Изменить : я переместил короткую, в точку, ответить наверх. Потому что я должен был сделать это еще раз сегодня, но хотел перепроверить , что я в среднем на отклонения .
источник
Это старый вопрос, но принятый ответ на самом деле не является правильным или полным. Пользователь хочет рассчитать стандартное отклонение за 12-месячные данные, где среднее значение и стандартное отклонение уже рассчитаны за каждый месяц. Предполагая, что количество выборок в каждом месяце одинаково, можно рассчитать среднее значение выборки и дисперсию за год по данным каждого месяца. Для простоты предположим, что у нас есть два набора данных:
с известными значениями среднего значения выборки и выборочной дисперсии, , , , .μx μy σ2x σ2y
Теперь мы хотим рассчитать те же оценки для
Учтите, что , рассчитываются как:μx σ2x
Чтобы оценить среднее значение и дисперсию по всему набору, нам нужно рассчитать:
Таким образом, если у вас есть дисперсия по каждому подмножеству, и вы хотите дисперсию по всему подмножеству, то вы можете усреднить дисперсии каждого подмножества, если все они имеют одинаковое среднее значение. В противном случае вам нужно добавить среднюю дисперсию каждого подмножества.
Скажем, в течение первой половины года мы производим ровно 1000 МВтч в день, а во второй половине - 2000 МВтч в день. Тогда среднее значение и дисперсия производства энергии в первой и второй половине равны 1000 и 2000 для среднего значения, а дисперсия равна 0 для обеих половин. Теперь есть две разные вещи, которые могут нас заинтересовать:
1- Мы хотим рассчитать дисперсию производства энергии за весь год : затем, усредняя две дисперсии, мы получим ноль, что неверно, поскольку энергия в день в течение всего года не является постоянной. В этом случае нам нужно добавить дисперсию всех средств из каждого подмножества. Математически в этом случае интересующей нас случайной величиной является производство энергии в день. У нас есть выборочная статистика по подмножествам, и мы хотим рассчитать выборочную статистику за более длительное время.
2- Мы хотим рассчитать дисперсию производства энергии в год: Другими словами, нас интересует, как сильно меняется производство энергии от года к году. В этом случае усреднение дисперсии приводит к правильному ответу, который равен 0, поскольку в каждом году мы производим в среднем ровно 1500 МВт. Математически в этом случае интересующей случайной величиной является среднее значение выработки энергии за день, где усреднение производится за весь год.
источник
Я полагаю, что вас действительно может заинтересовать стандартная ошибка, а не стандартное отклонение.
Стандартная ошибка среднего значения (SEM) - это стандартное отклонение оценки среднего значения выборки для среднего значения по населению, и это даст вам оценку того, насколько хороша ваша годовая оценка МВтч.
Это очень легко вычислить: если вы использовали выборок для получения ваших среднемесячных значений MWh и стандартных отклонений, вы просто вычислили бы стандартное отклонение, как предложило @IanBoyd, и нормализовали его по общему размеру вашей выборки. То естьs = √n
источник
Я хотел бы еще раз подчеркнуть неправильность в части принятого ответа. Формулировка вопроса приводит к путанице.
В вопросе есть Average и StdDev каждого месяца, но неясно, какое подмножество используется. Это среднее значение для одной ветряной турбины всей фермы или среднесуточное значение для всей фермы? Если это среднесуточное значение за каждый месяц, вы не можете сложить среднемесячное значение, чтобы получить среднегодовое значение, поскольку они не имеют одинакового знаменателя. Если это среднее значение за единицу, вопрос должен
Вместо
Более того, стандартное отклонение или дисперсия - это сравнение с собственным средним значением набора. Он не содержит никакой информации относительно среднего значения всего набора.
Изображение не обязательно очень правильное, но оно передает общую идею. Давайте представим выход 1 ветровой электростанции, как на картинке. Как вы можете видеть, «локальная» дисперсия не имеет ничего общего с «глобальной» дисперсией, независимо от того, как вы ее добавляете или умножаете. Вы не можете предсказать дисперсию года, используя дисперсию 2 полугодия. Таким образом, в принятом ответе, хотя подсчет суммы верен, деление на 12 для получения месячного числа ничего не значит. , Из трех разделов первый и последний раздел неверны, второй - правильно.
Опять же, это очень неправильное приложение, пожалуйста, не следуйте ему, иначе это может привести к неприятностям. Просто рассчитанный для всего этого, используя общий годовой / месячный выход каждой единицы в качестве точек данных, в зависимости от того, хотите ли вы годовой или месячный номер, это должен быть правильный ответ. Вы, вероятно, хотите что-то подобное. Это мои случайно сгенерированные числа. Если у вас есть данные, ответом будет ячейка O2.
источник