Как применить теорему Байеса к поиску потерянного в море рыбака

19

В статье «Постоянно обновляемые шансы» упоминается история рыбака из Лонг-Айленда, который буквально обязан своей жизнью Байесовской статистике. Вот короткая версия:

Посреди ночи на лодке два рыбака. Пока один спит, другой падает в океан. Лодка продолжает троллить на автопилоте всю ночь, пока первый парень, наконец, не проснется и не оповестит береговую охрану. Береговая охрана использует программное обеспечение под названием SAROPS (Система оптимального планирования поиска и спасания), чтобы найти его как раз вовремя, так как он был гипотермичен и почти не имел сил оставаться на плаву.

Вот длинная версия: пятнышко в море

Я хотел узнать больше о том, как на самом деле применяется теорема Байеса. Я довольно много узнал о программном обеспечении SAROPS, просто погуглив.

Симулятор SAROPS

Компонент симулятора учитывает своевременные данные, такие как океанское течение, ветер и т. Д., И моделирует тысячи возможных путей дрейфа. Из этих дрейфовых дорожек создается карта распределения вероятностей.

Обратите внимание, что следующие рисунки не относятся к случаю пропавшего рыбака, о котором я упоминал выше, но являются игрушечным примером из этой презентации.

Карта вероятностей 1 (красный цвет обозначает наибольшую вероятность, синий - самую низкую) введите описание изображения здесь

Обратите внимание на круг, который является начальной точкой.

Карта вероятностей 2 - прошло больше времени введите описание изображения здесь

Обратите внимание, что карта вероятностей стала мультимодальной. Это связано с тем, что в этом примере учитывается несколько сценариев:

  1. Человек плавает в воде - топ-средний режим
  2. Человек находится на спасательном плоту (больше подвержен влиянию ветра с севера) - два нижних режима (разделены из-за "эффекта джибинга")

Карта вероятностей 3 - Поиск был проведен по прямоугольным путям, введите описание изображения здесь выделенным красным На этом изображении показаны оптимальные пути, созданные планировщиком (еще один компонент SAROPS). Как вы можете видеть, эти пути были найдены, и карта вероятности была обновлена ​​симулятором.

Вы можете быть удивлены, почему области, которые искали, не были уменьшены до нулевой вероятности. Это связано с тем, что существует вероятность сбоя, , то есть вероятность, что искатель пропустит человека в воде. Понятно, что вероятность неудачи намного выше для одинокого человека на плаву, чем для человека на спасательном плоту (это легче увидеть), поэтому вероятности в верхней части не сильно снизились.p(fail)

Последствия неудачного поиска

Вот где в игру вступает теорема Байеса. После проведения поиска карта вероятностей соответствующим образом обновляется, поэтому оптимальный поиск может быть спланирован.

После рассмотрения теоремы Байеса о википедии и в статье «Интуитивное (и краткое) объяснение теоремы Байеса на BetterExplained.com»

Я взял уравнение Байеса:

P(AX)=P(XA)×P(A)P(X)

И определил A и X следующим образом ...

  • Событие A: человек находится в этой области (ячейка сетки)

  • Тест X: Неудачный поиск по этой области (ячейка сетки), т.е. искал эту область и ничего не видел

Уступая,

P(person thereunsuccessful)=P(unsuccessfulperson there)×P(person there)P(unsuccessful)

В Системе оптимального планирования поиска и спасения я обнаружил, что SAROPS вычисляет вероятность неудачного поиска, , с учетом путей поиска и имитированных путей дрейфа. Итак, для простоты предположим, что мы знаем, каково значение .P ( ошибка )P(fail)P(fail)

Итак, теперь у нас есть,

P(person thereunsuccessful)=P(fail)×P(person there)P(unsuccessful)
  1. Правильно ли здесь применено уравнение Байеса?

  2. Как рассчитать знаменатель, вероятность неудачного поиска?

    Также в поисково-спасательной системе оптимального планирования , говорят они

    Априорные вероятности «нормированы обычным байесовским способом» для получения апостериорных вероятностей

  3. Что означает «нормализованный в нормальной байесовской манере» ?

    P(unsuccessful)

  4. Наконец, каков был бы правильный способ нормализации карты вероятности с сеткой после того, как вы обновили результаты неудачного поиска, учитывая, что, поскольку вы не искали ВСЕ области (ячейки сетки), у вас было бы несколько ячеек, равных и некоторые равны ?P(person there)P(person thereunsuccessful)

Еще одно примечание по упрощению - согласно Системе оптимального планирования поиска и спасения апостериорное распределение фактически рассчитывается путем обновления вероятностей смоделированных путей дрейфа, а затем воссоздания сетки вероятностных карт. Чтобы сделать этот пример достаточно простым, я решил игнорировать пути симов и сосредоточиться на ячейках сетки.

mlai
источник

Ответы:

6
  1. Если предположить независимость между ячейками сетки, то да, похоже, теорема Байеса была правильно применена.
  2. п(Икс)знак равноп(Икс|A)п(A)+п(Икс|Aс)п(Aс)
    AсAп(Икс|Aс)знак равно1
  3. п(A|Икс)
    п(A|Икс)αп(Икс|A)п(A)п(Aс|Икс),αп(Икс|Aс)п(Aс), и п(A|Икс)+п(Aс|Икс)знак равно1
    п(Икс)
  4. яAяяИксяяИкс

    • Σяп(Aя|Икс)знак равно1
    • п(Aя|Икс)знак равноп(Aя|Икся)αп(Икся|Aя)п(Aя)п(Aя|Икс)αп(Aя)п(Aя|Икс)

    п(Aя|Икс)

jaradniemi
источник
Σяп(Aя|Икс)знак равно1п(Икс|A)п(A)Σяп(Икс|A)п(Aя)
Я только что понял, что поиск в каждой ячейке с фиксированной вероятностью сбоя не приведет к абсолютно никакому изменению в распределении вероятностей :)
mlai
п(Икс|A)п(Aя)п(Aя)для тех, кто этого не сделал.
Мале
4

Мне указали на книгу, в которой есть целая глава, посвященная моему вопросу - «Анализ военно-морских операций», написанная бывшим профессором, который раньше был пилотом вертолета и фактически выполнял поисковые и спасательные операции, не меньше!

В главе 8 приведен пример, похожий на этот (я немного его настроил):

Начнем с того, что есть предварительное распределение в сетке для определения местоположения пропавшего человека (ов), лодки и т. Д.

Предыдущее распространение: Prior distribution

Поиск выполняется по части сетки, и вероятности обновляются с помощью нормализованного апостериорного распределения , применяя уравнение Байеса так же, как я упоминал в своих вопросах:

п(цель в (I, J)|нет обнаружения)знак равноп(нет обнаружения|цель в (I, J))×п(цель в (I, J))п(нет обнаружения)

где (i, j) = (широта, лонг)

В этом случае я решил поискать в столбце 3, потому что этот столбец имел наибольшую суммарную априорную вероятность.

Нормализованное апостериорное распределение после поиска в третьем столбце w / pFail = 0.2: Normalized posterior distribution (w/ failure probability = 0.2)

Мой вопрос был в основном о том, как нормализовался задний. Вот как это было сделано в книге - просто разделить каждую отдельную заднюю вероятность на общую сумму , S :

Image description

Я выбрал 0,2 вероятности неудачного поиска, потому что мой профессор сказал: «Мы ищем только 80% вероятности обнаружения, потому что это, как правило, лучший компромисс между временем и точностью».

Просто для удовольствия я запустил другой пример с pFail 0,5. Принимая во внимание, что в первом примере ( pFail = 0,2), следующий наилучший маршрут поиска (с учетом нормализованного апостериорного и предполагающего прямолинейного поиска без диагонали или зигзага) будет летать над столбцом 2, во втором примере ( pFail = 0.5) следующий лучший маршрут - через ряд 2.

Нормализованное апостериорное распределение после поиска в третьем столбце w / pFail = 0.5: eNormalized posterior distribution (w/ failure probability = 0.5)

enter image description here

Он также добавил следующее: «Самолеты несут с собой небольшой контрольный список, чтобы определить оптимальную высоту и скорость полета. Работать на летающем вертолете - это все равно, что сидеть на стиральной машине и читать книгу, приклеенную к другой стиральной машине».

mlai
источник