Какое распределение использовать для моделирования времени до прибытия поезда?

15

Я пытаюсь смоделировать некоторые данные о времени прибытия поезда. Я хотел бы использовать дистрибутив, который фиксирует «чем дольше я жду, тем больше вероятность того, что поезд появится» . Похоже, что такой дистрибутив должен выглядеть как CDF, так что P (Train Train Up | Ожидал 60 минут) близко к 1. Какой дистрибутив подходит для использования здесь?

Foobar
источник
10
Если вы ждете 25 часов и поезда не было, я подозреваю, что вероятность появления поезда в следующую минуту может быть близка к 0 поскольку вполне возможно, что линия была временно или окончательно закрыта
Генри
@ Генри, это полностью зависит от вашей веры в предыдущие вероятности. Например, наименее используемая железнодорожная станция в Британии theguardian.com/uk-news/2016/dec/09/… имеет пробелы в прибытии более одного дня (по воскресеньям обслуживание отсутствует).
Секст Эмпирик
@MartijnWeterings - возможно, благодаря журналистам, количество пользователей Shippea Hill увеличилось на 1200% и даже не достигло 10 самых низких показателей использования в следующем году , некоторые из которых, такие как аэропорт Тиссайд, имеют один поезд в неделю в одном направлении
Генри

Ответы:

17

Умножение двух вероятностей

Вероятность первого прибытия в момент времени между t и t+dt (время ожидания) равна умножению

  • вероятность прибытия между t и t+dt (которая может быть связана со скоростью прибытия s(t) в момент времени t )
  • и вероятность не прибытия до времени t (иначе он не был бы первым).

Этот последний термин связан с:

P(n=0,t+dt)=(1s(t)dt)P(n=0,t)

или

P(n=0,t)t=s(t)P(n=0,t)

давая:

P(n=0,t)=e0ts(t)dt

и распределение вероятностей для времени ожидания:

f(t)=s(t)e0ts(t)dt

Вывод совокупного распределения.

В качестве альтернативы вы можете использовать выражение для вероятности менее чем одного прибытия при условии, что время t

P(n<1|t)=F(n=0;t)

и вероятность прибытия между временем t и t+dt равна производной

farrival time(t)=ddtF(n=0|t)

Этот подход / метод полезен, например, для получения гамма-распределения как времени ожидания n-го прихода в пуассоновском процессе. (время ожидания пуассоновского процесса, следующего за гамма-распределением )


Два примера

Вы можете связать это с парадоксом ожидания ( пожалуйста, объясните парадокс ожидания ).

  • Экспоненциальное распределение: если поступления являются случайными, как процесс Пуассона, то s(t)=λ является постоянным. Вероятность следующего заезда не зависит от предыдущего времени ожидания без заезда (скажем, если вы бросаете правильные кости много раз без шести, то для следующего броска у вас не будет внезапно более высокой вероятности за шесть, см. Ошибку игрока ) , Вы получите экспоненциальное распределение, и pdf для времени ожидания:

    f(t)=λeλt

  • Tts(t)=1/(Tt)

    f(t)=e0t1TtdtTt=1T
    0T


Так что это второй случай, с «вероятность того, что человек уже некоторое время ждал, возрастает». , относится к вашему вопросу.

s(t)dt что поезд прибудет в определенный момент, может быть более сложной функцией.


Автор StackExchangeStrike

Секст Эмпирик
источник
7

Классическим распределением для моделирования времени ожидания является экспоненциальное распределение .

Экспоненциальное распределение происходит естественным образом при описании длин времен прихода в однородном пуассоновском процессе.

Стефан Коласса
источник
2
Да, но я полагаю, что процесс Пуассона не является хорошей моделью для сети поездов.
оставил около