Это сообщение в статье Reuter от 25.02.2019 в настоящее время во всех новостях:
Свидетельство того, что искусственное глобальное потепление поражает «золотой стандарт»
[Ученые] сказали, что уверенность в том, что человеческая деятельность поднимает тепло на поверхности Земли, достигла уровня «пять сигм», статистический показатель означает, что существует только один шанс на миллион, что сигнал появится, если бы нет потепления.
Я считаю, что это относится к этой статье «Празднование годовщины трех ключевых событий в науке об изменении климата», в которой содержится сюжет, схематически показанный ниже (Это эскиз, потому что я не смог найти изображение с открытым исходным кодом для оригинала, аналогичного бесплатные изображения находятся здесь ). Другая статья из той же исследовательской группы, которая, кажется, является более оригинальным источником, находится здесь (но она использует значение 1% вместо ).
На графике представлены результаты измерений трех разных исследовательских групп: систем дистанционного зондирования, Центра прикладных исследований и исследований спутников и Университета Алабамы в Хантсвилле.
График отображает три растущие кривые отношения сигнал / шум в зависимости от длины тренда.
Так что ученые каким-то образом измерили антропогенный сигнал глобального потепления (или изменения климата?) На уровне , что, по-видимому, является научным стандартом доказательств .
Для меня такой граф, который имеет высокий уровень абстракции, вызывает много вопросов † и вообще я задаюсь вопросом о том, «Как они это сделали?» , Как объяснить этот эксперимент простыми словами (но не настолько абстрактно), а также объяснить значение уровня 5 σ ?
Я задаю этот вопрос здесь, потому что я не хочу дискуссии о климате. Вместо этого я хочу получить ответы относительно статистического содержания и особенно прояснить значение такого утверждения, которое использует / утверждает .
Что такое нулевая гипотеза? Как они организовали эксперимент, чтобы получитьантропогенныйсигнал? Каковразмерэффектасигнала? Это всего лишь небольшой сигнал, и мы измеряем его только сейчас, потому что шум уменьшается или сигнал увеличивается? Какие предположения сделаны для создания статистической модели, с помощью которой они определяют пересечение порога 5 сигм (независимость, случайные эффекты и т. Д.)? Почему три кривые для разных исследовательских групп различны, имеют ли они разные шумы или имеют разные сигналы, и в случае последних, что это означает в отношении интерпретации вероятности и внешней достоверности?
источник
Ответы:
Это не всегда о статистическом тестировании. Это также может быть о теории информации.
Термин 5σ - это то, что он говорит: отношение «сигнал» к «шуму». При проверке гипотез мы имеем оценку параметра распределения и стандартную ошибку оценки. Первый - это «сигнал», второй - «шум», а отношение статистики и ее стандартной ошибки - это z-статистика, t-статистика, F-статистика, как вы ее называете.
Тем не менее отношение сигнал / шум полезно везде, где мы получаем / воспринимаем некоторую информацию через некоторый шум. Как объясняет приведенная ссылка
В нашем случае «сигнал» - это измеренное фактическое изменение температуры некоторых слоев атмосферы, а «шум» - это предсказание изменения по сравнению с моделированием без известных антропогенных воздействий. Так получилось, что эти симуляции предсказывали более или менее стационарную температуру с определенным стандартным отклонением σ.
Теперь вернемся к статистике. Все тестовые статистические данные (z, t, F) являются отношениями оценки к ее стандартной ошибке. Поэтому, когда мы, статистики, слышим о чем-то вроде S / N, мы думаем о z-статистике и наделяем ее вероятностью. Климатологи, очевидно, этого не делают (нигде в статье не упоминается вероятность ). Они просто обнаруживают, что изменение примерно в три-восемь раз больше, чем ожидалось, отношение сигнал / шум составляет от 3 до 8.
В статье сообщается, что они провели два вида моделирования: одно с известными антропогенными воздействиями, включенными в модель, и другие с исключенными известными антропогенными воздействиями. Первое моделирование было похоже на измеренные фактические спутниковые данные, а второе было далеко. Если это возможно или нет, они не говорят и, очевидно, не волнует.
Чтобы ответить на другие вопросы. Они не ставили никаких экспериментов, они делали симуляции в соответствии со своими моделями. Таким образом, нет явной нулевой гипотезы, кроме очевидной, что изменение похоже на ожидаемое (S / N равно 1).
Размер эффекта сигнала - это разница между фактическими данными и моделированием. Это сигнал в 5 раз больше ожидаемого (в пять раз больше обычной изменчивости температур). Кажется, что шум уменьшается из-за количества и, возможно, точности измерений.
Вопреки нашим ожиданиям от «настоящих ученых», не существует статистической модели, о которой мы могли бы говорить, поэтому вопрос о сделанных предположениях является бессмысленным. Единственное предположение состоит в том, что их модели позволяют им предсказывать климат. Это так же верно, как если бы сказать, что модели, используемые для прогнозов погоды, являются надежными.
Есть намного больше, чем три кривых. Это результаты моделирования от разных моделей. Они просто должны быть разными. И да, есть разные шумы. Сигнал, насколько он различен, представляет собой разные наборы измерений, которые имеют свою погрешность измерения, а также должны быть разными. Что это значит в отношении интерпретации? Вероятностная интерпретация S / N не очень хорошая. Однако внешняя достоверность результатов является обоснованной. Они просто утверждают, что изменения климата в период с 1979 по 2011 год сопоставимы с моделированием, когда учитываются известные антропогенные воздействия, и примерно в пять раз превышают те, которые рассчитываются путем моделирования, когда известные антропогенные факторы исключаются из модели.
Так что остался один вопрос. Если климатологи попросят статистиков составить модель, что это будет? На мой взгляд, что-то в линии броуновского движения.
источник
Предостережение: я НЕ эксперт по климатологии, это не моя область. Пожалуйста, имейте это в виду. Исправления приветствуются.
Рисунок, на который вы ссылаетесь, взят из недавней статьи Santer et al. 2019, Празднование годовщины трех ключевых событий в науке изменения климата от Изменения Природы . Это не исследовательская работа, а краткий комментарий. Эта фигура является упрощенным обновлением аналогичной фигуры из более ранней научной статьи тех же авторов, Santer et al. 2018, Влияние человека на сезонный цикл тропосферной температуры . Вот фигура 2019 года:
И вот фигура 2018 года; панель А соответствует фигуре 2019 года:
Здесь я попытаюсь объяснить статистический анализ этого последнего рисунка (все четыре панели). Наука бумага открытый доступ и вполне читаемый; статистические данные, как обычно, скрыты в дополнительных материалах. Прежде чем обсуждать статистику как таковую, необходимо сказать несколько слов о данных наблюдений и используемых здесь симуляциях (климатических моделях).
1. Данные
Аббревиатуры RSS, UAH и STAR относятся к реконструкциям тропосферной температуры по спутниковым измерениям. Тропосферная температура контролируется с 1979 года с помощью метеорологических спутников: см. Википедию по измерениям температуры в МГУ . К сожалению, спутники не измеряют температуру напрямую; они измеряют что-то еще, из чего можно вывести температуру. Кроме того, известно, что они страдают от различных временных смещений и проблем калибровки. Это затрудняет восстановление фактической температуры. Несколько исследовательских групп проводят эту реконструкцию, следуя несколько другим методологиям и получая несколько разные конечные результаты. RSS, UAH и STAR являются этими реконструкциями. Процитирую Википедию,
Существует много споров о том, какая реконструкция является более надежной. Каждая группа время от времени обновляет свои алгоритмы, изменяя весь восстановленный временной ряд. Вот почему, например, RSS v3.3 отличается от RSS v4.0 на приведенном выше рисунке. В целом, AFAIK общепризнанно, что оценки глобальной приземной температуры более точны, чем спутниковые измерения. В любом случае, что имеет значение для этого вопроса, это то, что существует несколько доступных оценок пространственно разрешенной тропосферной температуры с 1979 года по настоящее время, то есть как функция широты, долготы и времени.
2. Модели
Существуют различные климатические модели, которые можно использовать для моделирования температуры тропосферы (также в зависимости от широты, долготы и времени). Эти модели принимают в качестве входных данных концентрацию CO2, вулканическую активность, солнечное излучение, концентрацию аэрозолей и различные другие внешние воздействия, а в качестве выходных - температуру. Эти модели можно запускать в течение одного и того же периода времени (с 1979 года по настоящее время) с использованием фактических измеренных внешних воздействий. Затем результаты могут быть усреднены, чтобы получить среднее значение модели.
Можно также запустить эти модели, не вводя антропогенные факторы (парниковые газы, аэрозоли и т. Д.), Чтобы получить представление о неантропогенных модельных прогнозах. Обратите внимание, что все другие факторы (солнечные / вулканические / и т. Д.) Колеблются вокруг их средних значений, поэтому выходные данные неантропогенной модели являются стационарными по построению. Другими словами, модели не позволяют климату изменяться естественным образом без какой-либо конкретной внешней причины.
4. Некоторые комментарии
Первый отпечаток пальца (панель А), ИМХО, самый тривиальный. Это просто означает, что наблюдаемые температуры монотонно растут, а температуры по нулевой гипотезе - нет. Я не думаю, что нужен весь этот сложный механизм, чтобы сделать такой вывод. Временные ряды глобальной средней нижней тропосферной температуры (вариант RSS) выглядят так :
и, очевидно, здесь есть очень существенная тенденция. Я не думаю, что нужны модели, чтобы это увидеть.
источник