Вопросы с тегом «dynamic-programming»

17
Когда не удается оптимальное управление (?)

Чтобы «задать свой вопрос», я должен сначала решить модель. Я опущу некоторые шаги, но тем не менее, это неизбежно сделает этот пост очень длинным - так что это также тест, чтобы увидеть, нравится ли этому сообществу такие вопросы. Прежде чем начать, я поясняю, что это может выглядеть полностью как...

13
Решение уравнения Гамильтона-Якоби-Беллмана; необходимо и достаточно для оптимальности?

Рассмотрим следующее дифференциальное уравнение где - это состояние, а - управляющая переменная. Решение дается где - заданное начальное состояние.xux(t)=x0+∫ t 0 f(x(s),u(s))ds. х0:=х(0)x˙(t)=f(x(t),u(t))x˙(t)=f(x(t),u(t))\begin{align} \dot x(t)=f(x(t),u(t))...

11
Рекомендации для изучения непрерывного динамического программирования

Кто-нибудь знает хорошие ссылки для изучения непрерывного динамического программирования? Ссылки не должны быть книгами. Они также могут быть ссылками на онлайн-ресурсы. Были бы полезны ссылки на четкие, краткие обсуждения даже только...

8
Угадай и проверь

В динамическом программировании метод неопределенных коэффициентов иногда называют «угадай и проверь». Я периодически слышал, что есть какие-то канонические предположения. В частности, я видел V(k)=A+Bln(k)V(k)=A+Bln⁡(k)V(k) = A + B\ln(k) V(k)=Bk1−σ1−σV(k)=Bk1−σ1−σV(k) =...

5
Принцип однократного отклонения для бесконечных повторяющихся игр и динамического программирования

В контексте того, что будущая прибыль обесценивается постоянным параметром, принцип однократного отклонения верно как для повторных игр, так и для динамического программирования. Поскольку в повторяющихся играх отклонение от одного выстрела относится к одной истории, поэтому на пути равновесия...

4
Оптимизация с использованием функции стоимости

У меня есть следующая проблема оптимизации: max зависимости оту + М т - 1E0∑∞t=0[log(ct)+log(mt)]E0∑t=0∞[log(ct)+log(mt)]E_{0}\sum_{t=0}^{\infty}[log(c_{t}) + log(m_{t})]y+Mt−1pt+Rt−1Bt−1pt=ct+mt+bt+τty+Mt−1pt+Rt−1Bt−1pt=ct+mt+bt+τty + \frac{M_{t-1}}{p_{t}} + R_{t-1}\frac{B_{t-1}}{p_{t}} = c_{t} +...

1
Естественный заем / лимит задолженности и другие ограничения заимствования

Столкнувшись с простой проблемой максимизации потребления домашних хозяйств в условиях неопределенности (и с последовательной торговлей безопасностью Arrow) $$ \ макс _ {\ {c_t (ы ^ т), а_ {T + 1} (с ^ т, S_ {T + 1}) \} _ {т = 0} ^ {\ infty}} \ sum_ {т = 0} ^ {\ infty} \ sum_ {s ^ t \ in S ^ t} \...