Когда я не могу заменить случайную величину на ее среднее значение?

10

Частое упрощение в моделировании и симуляции заключается в замене случайной величины ее средним значением.

Когда это упрощение приведет к неправильному выводу?

Анкит Гоял
источник
2
Есть ли «Var» стоять переменный или дисперсию или Value At Risk ?
Генри
3
Было бы интересно запустить сервис, который оплачивает подписку Netflix своих участников. Мы будем взимать только , гдехслучайнымвыбирается в области[-100,100], так, я знаю, бесплатно Netflix! Позже мы предложим некоторым клиентам возможность вместо этого заплатитьx2USD|Икс| USDмоNTчасИкс[-100,100] . Икс2 USDмоNTчас
Nat
3
Ну, в очень простом случае, если мы доведем это до крайности, мы можем потерять почти всю информацию, которая нам небезразлична. Рассмотрим регрессию Y на X, где мы заменили Y и X на их среднее значение. Любая информация о склоне теперь потеряна.
Дейсон
1
Вы спрашиваете о замене пропущенных значений, или вы спрашиваете о замене случайной переменной в определенном контексте (например, создание прогнозов на основе модели случайных эффектов)?
IWS

Ответы:

20

Если вы замените отсутствующее значение какой-либо точечной оценкой, вы проигнорируете всю его изменчивость. Таким образом, вы не будете распространять всю оригинальную изменчивость на вашу модель. Ваши оценки параметров будут иметь слишком низкую s. Если вы сделаете вывод, ваши значения p будут смещены на низкое значение. Ваш s будет слишком узким. Если вы делаете прогноз, s будет слишком узким.

В целом: вы будете слишком уверены в своих выводах.

Стефан Коласса
источник
2
Хороший ответ! Подумайте так: случайная величина имеет распределение. Его можно свернуть налево, направо. Я могу быть бимодальным и т. Д. Сокращая переменную до ее среднего значения, вы удаляете всю эту дополнительную информацию (неопределенность) и заменяете распределение (интервалы) оценкой по одной точке.
одиннадцать долларов
1
Если вы замените отсутствующее значение некоторой точечной оценкой, вы также предположите, что данные отсутствуют случайным образом. Среднее значение случайной величины может не совпадать со средним значением данных, если они отсутствуют.
Нил Г
@NeilG извините, но я не могу сказать, что замена отсутствующего значения его средним значением не означает, что данные пропущены случайно. Тем более что - несколько запутанная - терминология вокруг отсутствующих данных рассматривает «случайное отсутствие» как данные, которые случайным образом отсутствуют, условно для других, но известных данных ( en.wikipedia.org/wiki/Missing_data ). ИМО, то, как данные заменяются, ничего не говорит о причинах этого. Это обоснование должно быть явным и привести к надлежащему способу обработки недостающих данных. Тем не менее, я полностью согласен с ответом Стефана.
IWS
@IWS Это нормально, что показатели пропущенности зависят от наблюдаемых данных. Пропуск случайным образом означает, что показатели пропущенных зависят от ненаблюдаемых данных. Если вы замените переменную условным средним значением, при котором она наблюдается, это может не совпадать с ее безусловным средним значением, если только данные отсутствуют случайным образом.
Нил Г
@NeilG Разве вы не имеете в виду «пропал совершенно случайно», когда вы пишете «пропал случайно» в последнем предложении вашего последнего комментария? Если так, мы согласны, но я просто придираюсь к терминологии. (см. вики-страницу, которую я поместил в своем комментарии выше, меня всегда учили, читали и использовали эту терминологию)
IWS
13

В дополнение к баллам Стефана:

  • Практически в любом приложении, где вас интересуют нелинейные функции случайной величины, замена среднего значения обычно приводит к смещению и, возможно, противоречивым результатам. Средняя скорость и средняя масса частицы, как правило, не будут соответствовать средней кинетической энергии, потому что энергия масштабируется с V ^ 2.
  • Среднее значение может даже не быть возможным исходом для случайной величины. Если моими возможными исходами являются 0 «пациент умирает» и 1 «пациент живет», вероятно, не имеет смысла иметь модель, которая описывает пациента как 0,1 «в основном мертвый, но слегка живой».
Джеффри Брент
источник
1
Обязательно: youtube.com/watch?v=xbE8E1ez97M
Алексис
1
@ Алексис но конечно!
Джеффри Брент
0

Пример из реальной жизни (связанный с двумя полученными вами ответами) на финансовых рынках. Цена опциона основана на вероятности того, что цена актива станет выше (или ниже) данного уровня.

Например, цена опциона на покупку актива по цене 100, когда ожидаемая стоимость актива равна 80. Если вы подставите случайную переменную (цену актива) в ее среднее значение, вы получите цену, равную нулю (как вы никогда не получите 100 активов, которые стоят 80). Когда вы принимаете во внимание стохастичность актива (и это правильный способ сделать это), вы получаете положительную цену, так как есть некоторая вероятность того, что цена актива превысит 100.

Хуан Игнасио Хиль
источник