Свидетельство того, что искусственное глобальное потепление поражает «золотой стандарт»: как они это сделали?

Это сообщение в статье Reuter от 25.02.2019 в настоящее время во всех новостях:

Свидетельство того, что искусственное глобальное потепление поражает «золотой стандарт»

[Ученые] сказали, что уверенность в том, что человеческая деятельность поднимает тепло на поверхности Земли, достигла уровня «пять сигм», статистический показатель означает, что существует только один шанс на миллион, что сигнал появится, если бы нет потепления.

Я считаю, что это относится к этой статье «Празднование годовщины трех ключевых событий в науке об изменении климата», в которой содержится сюжет, схематически показанный ниже (Это эскиз, потому что я не смог найти изображение с открытым исходным кодом для оригинала, аналогичного бесплатные изображения находятся здесь ). Другая статья из той же исследовательской группы, которая, кажется, является более оригинальным источником, находится здесь (но она использует значение 1% вместо $5\sigma$ ).

На графике представлены результаты измерений трех разных исследовательских групп: систем дистанционного зондирования, Центра прикладных исследований и исследований спутников и Университета Алабамы в Хантсвилле.

График отображает три растущие кривые отношения сигнал / шум в зависимости от длины тренда.

Так что ученые каким-то образом измерили антропогенный сигнал глобального потепления (или изменения климата?) На уровне $5\sigma$ , что, по-видимому, является научным стандартом доказательств .

Для меня такой граф, который имеет высокий уровень абстракции, вызывает много вопросов и вообще я задаюсь вопросом о том, «Как они это сделали?» , Как объяснить этот эксперимент простыми словами (но не настолько абстрактно), а также объяснить значение уровня ? $^{\dagger}$ $5\sigma$

Я задаю этот вопрос здесь, потому что я не хочу дискуссии о климате. Вместо этого я хочу получить ответы относительно статистического содержания и особенно прояснить значение такого утверждения, которое использует / утверждает $5 \sigma$ .

$^\dagger$ Что такое нулевая гипотеза? Как они организовали эксперимент, чтобы получитьантропогенныйсигнал? Каковразмерэффектасигнала? Это всего лишь небольшой сигнал, и мы измеряем его только сейчас, потому что шум уменьшается или сигнал увеличивается? Какие предположения сделаны для создания статистической модели, с помощью которой они определяют пересечение порога 5 сигм (независимость, случайные эффекты и т. Д.)? Почему три кривые для разных исследовательских групп различны, имеют ли они разные шумы или имеют разные сигналы, и в случае последних, что это означает в отношении интерпретации вероятности и внешней достоверности?

p-value intuition application communication climate Секст Эмпирик
источник

@MattF. Я ожидаю, что можно будет сделать простое изложение, которое объясняет статистическую концепцию порога

, которая использовалась здесь (по крайней мере, физики частиц высоких энергий, которые также используют

расхождения / эффекты для описания отношения сигнал / шум). в подсчете событий проблем с этим нет). Под простым я подразумеваю что-то оторванное от жаргона климатологии, но достаточно сложное, чтобы вместить суть. Скажем, это было бы что-то написанное для профессиональных статистиков и математиков, чтобы они могли понять

здесь.

5 σ

$5\sigma$

σ

$\sigma$

5 σ

$5\sigma$

Секст Эмпирик

Подчеркнуть контраст с физикой высоких энергий: для этого поля статистики могут понять, что уровень

в принципе не имеет смысла, а планка установлена на высоком уровне, поскольку вычисления технически неверны (1. эффект поиска в другом месте 2. неправильные предположения о распределении ошибок игнорирование систематических эффектов 3. неявно проводя байесовский анализ, «экстраординарные претензии требуют экстраординарных доказательств»).

5 σ

$5\sigma$

Секст Эмпирик

Вопрос в том, насколько эти три эффекта присутствуют в случае этой статьи о глобальном потеплении, созданной человеком. Я думаю, что важно прояснить это, чтобы демистифицировать притязания науки. Очень часто просто бросить несколько цифр в аргумент, чтобы они звучали строго, и большинство людей перестают задавать вопросы.

Секст Эмпирик

Вы видели эту критику: judithcurry.com/2019/03/01/… ?

Роберт Лонг

По совпадению я читал эти газеты всего несколько дней назад, и теперь заметил вашу новую награду. Я мог бы написать что-нибудь сейчас.

амеба говорит восстановить монику

Ответы:

Это не всегда о статистическом тестировании. Это также может быть о теории информации.

Термин 5σ - это то, что он говорит: отношение «сигнал» к «шуму». При проверке гипотез мы имеем оценку параметра распределения и стандартную ошибку оценки. Первый - это «сигнал», второй - «шум», а отношение статистики и ее стандартной ошибки - это z-статистика, t-статистика, F-статистика, как вы ее называете.

Тем не менее отношение сигнал / шум полезно везде, где мы получаем / воспринимаем некоторую информацию через некоторый шум. Как объясняет приведенная ссылка

Отношение сигнал / шум (часто сокращенно SNR или S / N) является мерой, используемой в науке и технике для количественной оценки степени искажения сигнала шумом.

В нашем случае «сигнал» - это измеренное фактическое изменение температуры некоторых слоев атмосферы, а «шум» - это предсказание изменения по сравнению с моделированием без известных антропогенных воздействий. Так получилось, что эти симуляции предсказывали более или менее стационарную температуру с определенным стандартным отклонением σ.

Теперь вернемся к статистике. Все тестовые статистические данные (z, t, F) являются отношениями оценки к ее стандартной ошибке. Поэтому, когда мы, статистики, слышим о чем-то вроде S / N, мы думаем о z-статистике и наделяем ее вероятностью. Климатологи, очевидно, этого не делают (нигде в статье не упоминается вероятность ). Они просто обнаруживают, что изменение примерно в три-восемь раз больше, чем ожидалось, отношение сигнал / шум составляет от 3 до 8.

В статье сообщается, что они провели два вида моделирования: одно с известными антропогенными воздействиями, включенными в модель, и другие с исключенными известными антропогенными воздействиями. Первое моделирование было похоже на измеренные фактические спутниковые данные, а второе было далеко. Если это возможно или нет, они не говорят и, очевидно, не волнует.

Чтобы ответить на другие вопросы. Они не ставили никаких экспериментов, они делали симуляции в соответствии со своими моделями. Таким образом, нет явной нулевой гипотезы, кроме очевидной, что изменение похоже на ожидаемое (S / N равно 1).

Размер эффекта сигнала - это разница между фактическими данными и моделированием. Это сигнал в 5 раз больше ожидаемого (в пять раз больше обычной изменчивости температур). Кажется, что шум уменьшается из-за количества и, возможно, точности измерений.

Вопреки нашим ожиданиям от «настоящих ученых», не существует статистической модели, о которой мы могли бы говорить, поэтому вопрос о сделанных предположениях является бессмысленным. Единственное предположение состоит в том, что их модели позволяют им предсказывать климат. Это так же верно, как если бы сказать, что модели, используемые для прогнозов погоды, являются надежными.

Есть намного больше, чем три кривых. Это результаты моделирования от разных моделей. Они просто должны быть разными. И да, есть разные шумы. Сигнал, насколько он различен, представляет собой разные наборы измерений, которые имеют свою погрешность измерения, а также должны быть разными. Что это значит в отношении интерпретации? Вероятностная интерпретация S / N не очень хорошая. Однако внешняя достоверность результатов является обоснованной. Они просто утверждают, что изменения климата в период с 1979 по 2011 год сопоставимы с моделированием, когда учитываются известные антропогенные воздействия, и примерно в пять раз превышают те, которые рассчитываются путем моделирования, когда известные антропогенные факторы исключаются из модели.

Так что остался один вопрос. Если климатологи попросят статистиков составить модель, что это будет? На мой взгляд, что-то в линии броуновского движения.

Нино Роуд
источник

Так что же представляет собой «сигнал», какова природа «шума» и к какому невидимому процессу (процессам) мы можем приписать его?

Джош

Сори @ Джош, я преждевременно нажал кнопку отправки. Теперь вы можете прочитать мой полный ответ. Больше или меньше, «сигнал» - это фактические измерения, а «шум» - это результаты моделирования, когда известные антропогенные факторы исключены из модели. И на мой взгляд, это очень нестатично ...

Нино Роуд

n σ

$n\sigma$

@NinoRode Может быть, я что-то упускаю, но поскольку модель «шума» без антропогенных воздействий, очевидно, неверна из-за того, что средняя температура выросла на основе эмпирических измерений , как эта модель обеспечивает соответствующую базовую линию? Поскольку понятно, что температуры колеблются из-за естественных процессов ( en.wikipedia.org/wiki/Little_Ice_Age ) в дополнение к антропогенным, что является основанием для предположения о том, что модель «шума» должна иметь средне-нулевое повышение температуры по сравнению с период анализа?

Джош

@ Скотт, проблема с умной карикатурой заключается в том, что во временных рядах шум не отображается, потому что измерения, вероятно, недостаточно точны, чтобы определить, какая температура была в определенном столетии, не говоря уже о конкретном году. Так что все выглядит плавно и плавно до появления современных измерительных приборов. В механике жидкости это было бы похоже на сравнение мгновенного наблюдения поля скоростей с усредненным по Рейнольдсу; это не подходящее сравнение. Если вы действительно не думаете, что глобальная температура практически не изменялась до рождения Греты Тунберг. :)

Джош

Предостережение: я НЕ эксперт по климатологии, это не моя область. Пожалуйста, имейте это в виду. Исправления приветствуются.

Рисунок, на который вы ссылаетесь, взят из недавней статьи Santer et al. 2019, Празднование годовщины трех ключевых событий в науке изменения климата от Изменения Природы . Это не исследовательская работа, а краткий комментарий. Эта фигура является упрощенным обновлением аналогичной фигуры из более ранней научной статьи тех же авторов, Santer et al. 2018, Влияние человека на сезонный цикл тропосферной температуры . Вот фигура 2019 года:

И вот фигура 2018 года; панель А соответствует фигуре 2019 года:

Здесь я попытаюсь объяснить статистический анализ этого последнего рисунка (все четыре панели). Наука бумага открытый доступ и вполне читаемый; статистические данные, как обычно, скрыты в дополнительных материалах. Прежде чем обсуждать статистику как таковую, необходимо сказать несколько слов о данных наблюдений и используемых здесь симуляциях (климатических моделях).

1. Данные

Аббревиатуры RSS, UAH и STAR относятся к реконструкциям тропосферной температуры по спутниковым измерениям. Тропосферная температура контролируется с 1979 года с помощью метеорологических спутников: см. Википедию по измерениям температуры в МГУ . К сожалению, спутники не измеряют температуру напрямую; они измеряют что-то еще, из чего можно вывести температуру. Кроме того, известно, что они страдают от различных временных смещений и проблем калибровки. Это затрудняет восстановление фактической температуры. Несколько исследовательских групп проводят эту реконструкцию, следуя несколько другим методологиям и получая несколько разные конечные результаты. RSS, UAH и STAR являются этими реконструкциями. Процитирую Википедию,

Спутники не измеряют температуру. Они измеряют излучение в различных диапазонах длин волн, которые затем должны быть математически инвертированы для получения косвенных значений температуры. Результирующие температурные профили зависят от деталей методов, которые используются для получения температур по радиациям. В результате разные группы, которые проанализировали спутниковые данные, получили разные температурные тренды. Среди этих групп - системы дистанционного зондирования (RSS) и Университет Алабамы в Хантсвилле (UAH). Серия спутников не является полностью однородной - запись построена из серии спутников с одинаковыми, но не идентичными приборами. Датчики со временем изнашиваются, и для дрейфа спутника на орбите необходимы поправки.

Существует много споров о том, какая реконструкция является более надежной. Каждая группа время от времени обновляет свои алгоритмы, изменяя весь восстановленный временной ряд. Вот почему, например, RSS v3.3 отличается от RSS v4.0 на приведенном выше рисунке. В целом, AFAIK общепризнанно, что оценки глобальной приземной температуры более точны, чем спутниковые измерения. В любом случае, что имеет значение для этого вопроса, это то, что существует несколько доступных оценок пространственно разрешенной тропосферной температуры с 1979 года по настоящее время, то есть как функция широты, долготы и времени.

$T(\mathbf x, t)$

2. Модели

Существуют различные климатические модели, которые можно использовать для моделирования температуры тропосферы (также в зависимости от широты, долготы и времени). Эти модели принимают в качестве входных данных концентрацию CO2, вулканическую активность, солнечное излучение, концентрацию аэрозолей и различные другие внешние воздействия, а в качестве выходных - температуру. Эти модели можно запускать в течение одного и того же периода времени (с 1979 года по настоящее время) с использованием фактических измеренных внешних воздействий. Затем результаты могут быть усреднены, чтобы получить среднее значение модели.

Можно также запустить эти модели, не вводя антропогенные факторы (парниковые газы, аэрозоли и т. Д.), Чтобы получить представление о неантропогенных модельных прогнозах. Обратите внимание, что все другие факторы (солнечные / вулканические / и т. Д.) Колеблются вокруг их средних значений, поэтому выходные данные неантропогенной модели являются стационарными по построению. Другими словами, модели не позволяют климату изменяться естественным образом без какой-либо конкретной внешней причины.

$M(\mathbf x,t)$ $N(\mathbf x, t)$

$z$

$T(\mathbf x, t)$ $M(\mathbf x, t)$ $N(\mathbf x, t)$

$T(\mathbf x, i)$ $M(\mathbf x, i)$ $N(\mathbf x, i)$ $i$

Среднегодовое значение: просто средняя температура за весь год.
Годовой сезонный цикл: летняя температура минус зимняя температура.
$\mathbf x$ $i$
Годовой сезонный цикл с вычитанным глобальным средним: такой же, как (2), но снова вычитая среднее глобальное.

$M(\mathbf x, i)$ $F(\mathbf x)$

$T(\mathbf x, i)$ $F(\mathbf x)$

Z (i) = \sum_{x} T (x, i) F (x),

$Z(i) = \sum_\mathbf x T(\mathbf x, i) F(\mathbf x),$

β

$\beta$

z

$z$

W (i) = \sum_{x} N (x, i) F (x),

$W(i) = \sum_\mathbf x N(\mathbf x, i) F(\mathbf x),$

β_{n o i s e}

$\beta_\mathrm{noise}$

β_{n o i s e}

$\beta_\mathrm{noise}$

z

$z$ -статистики:

z = \frac{β}{{Var}^{1 / 2} [β_{n o i s e}]} .

$z = \frac{\beta}{\operatorname{Var}^{1/2}[\beta_\mathrm{noise}]}.$

$z$

4. Некоторые комментарии

Первый отпечаток пальца (панель А), ИМХО, самый тривиальный. Это просто означает, что наблюдаемые температуры монотонно растут, а температуры по нулевой гипотезе - нет. Я не думаю, что нужен весь этот сложный механизм, чтобы сделать такой вывод. Временные ряды глобальной средней нижней тропосферной температуры (вариант RSS) выглядят так :

и, очевидно, здесь есть очень существенная тенденция. Я не думаю, что нужны модели, чтобы это увидеть.

$z$

амеба говорит восстановить монику
источник

(+1) Это отличный ответ! Если вы не возражаете: не могли бы вы расширить шаг «PCA через временные точки»? Я не понимаю, что стоит делать PCA вместо того, чтобы анализировать каждое измерение отдельно.

mkt - Восстановить Монику

β_{noise}

$\beta_{\text {noise}}$

N (x, i)

$N(x,i)$

F (x)

$F(x)$

T (x, i)

$T(x,i)$

F (x)

$F(x)$

N (x, 2019)

$N(x, 2019)$

Да, этот материал можно обсуждать со всех сторон. Лично я часто без особых суждений о какой-либо стороне, но мне нравится, что аргументы четкие и ясные. Сообщение о климате в настоящее время очень размыто.

Секст Эмпирик

F (x)

$F(x)$