Я думал об этой проблеме в душе, она была вдохновлена инвестиционными стратегиями.
Допустим, там было волшебное денежное дерево. Каждый день вы можете предложить денежное дерево денежному дереву, и оно либо утроит его, либо уничтожит с вероятностью 50/50. Вы сразу замечаете, что в среднем вы будете зарабатывать деньги, делая это, и стремитесь воспользоваться денежным деревом. Однако, если бы вы предложили все свои деньги сразу, вы бы потеряли 50% всех своих денег. Неприемлемый! Вы довольно склонны к риску, поэтому вы решили придумать стратегию. Вы хотите минимизировать шансы потерять все, но вы также хотите заработать столько денег, сколько сможете! Вы получаете следующее: каждый день вы предлагаете 20% своего текущего капитала денежному дереву. Если предположить, что самое низкое, что вы можете предложить, составляет 1 цент, то вам потребуется 31 полоса потерь, чтобы потерять все ваши деньги, если вы начали с 10 долларов. Более того, чем больше денег вы зарабатываете, тем дольше должна быть полоса неудач, чтобы вы все потеряли, удивительно! Вы быстро начинаете зарабатывать кучу денег. Но тут в голову приходит идея: вы можете просто предлагать 30% каждый день и зарабатывать гораздо больше денег! Но подождите, почему бы не предложить 35%? 50%? Однажды с большими знаками доллара в ваших глазах вы подбегаете к денежному дереву со всеми своими миллионами и предлагаете 100% своих денег, которые денежное дерево быстро сжигает. На следующий день вы получаете работу в McDonalds. которое денежное дерево стремительно сжигает. На следующий день вы получаете работу в McDonalds. которое денежное дерево стремительно сжигает. На следующий день вы получаете работу в McDonalds.
Есть ли оптимальный процент вашей наличности, который вы можете предложить, не теряя всего этого?
(под) вопросы:
Если есть оптимальный процент, который вы должны предложить, это статический (то есть 20% каждый день) или процент должен расти по мере увеличения вашего капитала?
Предлагая 20% каждый день, шансы потерять все ваши деньги уменьшаются или увеличиваются со временем? Есть ли процент денег, из-за которого шансы потерять все ваши деньги со временем возрастают?
источник
Ответы:
Это общеизвестная проблема. Это называется ставка Келли. Ответ, кстати, 1/3. Это эквивалентно максимизации полезности бревна.
Келли начала с того, что уделяла время бесконечности, а затем решала все назад. Поскольку вы всегда можете выразить результаты в терминах непрерывного сложения, вы также можете обратить процесс вспять и выразить его в журналах. Я собираюсь использовать объяснение утилиты журнала, но утилита журнала удобна. Если вы максимизируете богатство как то в итоге вы получите функцию, аналогичную утилите ведения журнала. Если b - это шансы на выплату, а p - это вероятность выигрыша, а X - это процент вложенного богатства, тогда будет работать следующая деривация.n→∞ b p X
Для бинарной ставкиE(log(X))=plog(1+bX)+(1−p)log(1−X) , за один период и единицу богатства.
Установка производной на ноль, чтобы найти экстремумы,
Перекрестное умножение итогеpb(1−X)−(1−p)(1+bX)=0
pb−pbX−1−bX+p+pbX=0
bX=pb−1+p
X=bp−(1−p)b
В вашем случаеX=3×12−(1−12)3=13.
Вы можете легко расширить это до нескольких или непрерывных результатов, решая ожидаемую полезность богатства по совместному распределению вероятностей, выбирая распределения и подвергаясь любым ограничениям. Интересно, что если вы выполняете это таким образом, включая ограничения, такие как способность выполнять платежи по ипотечным кредитам и т. Д., То вы учли свой совокупный набор рисков и, таким образом, у вас есть скорректированный риск или, по крайней мере, контролируемый риск решение.
Desiderata Фактическая цель оригинального исследования была связана с тем, сколько играть в азартные игры на основе шумного сигнала. В конкретном случае, сколько нужно играть на шумный электронный сигнал, когда он указывает на запуск ядерного оружия Советским Союзом. Соединенные Штаты и Россия уже несколько раз запускали его, очевидно, по ошибке. Сколько вы играете на сигнал?
источник
Мне понравился ответ Дейва Харриса. хотя я бы подошел к проблеме с точки зрения «низкого риска», а не максимизации прибыли
Случайная прогулка, которую вы делаете, при условии, что ваша ставка на дробь равнаq а вероятность выигрыша p=0.5 задана как
Yt|Yt−1=(1−q+3qXt)Yt−1 ,
где Xt∼Bernoulli(p) . в среднем у вас есть
E(Yt|Yt−1)=(1−q+3pq)Yt−1
Вы можете применить это итеративно, чтобы получить
Yt|Y0=Y0∏j=1t(1−q+3qXt)
с ожидаемым значением
E(Yt|Y0)=(1−q+3pq)tY0
Вы также можете выразить сумму в момент времениt как функцию от одной случайной величиныZt=∑tj=1Xt∼Binomial(t,p) , но отметив, чтоZt не зависит отZt−1
Yt|Y0=Y0(1+2q)Zt(1−q)t−Zt
возможная стратегия
Вы можете использовать эту формулу для определения значения «низкого риска» дляq . Предположим, вы хотели убедиться, что после k последовательных потерь у вас все еще будет половина вашего первоначального богатства. Затем вы устанавливаете q=1−2−k−1
Использование примераk=5 означает, что мы установили q=0.129 , или с k=15 мы установили q=0.045 .
Кроме того, из-за рекурсивного характера стратегии этот риск является тем, что вы принимаете каждый раз при каждой ставке. То есть в моментs , продолжая играть, вы гарантируете, что в момент времени k+s ваше богатство будет не менее 0.5Ys
обсуждение
Приведенная выше стратегия зависит не от выигрыша от выигрыша, а от установления границы проигрыша. Мы можем получить ожидаемый выигрыш путем подстановки в значение дляq мы рассчитали, и в момент времени k который использовался с учетом риска.
однако, интересно взглянуть на медиану, а не на ожидаемую отдачу в момент времениt , которую можно найти, предполагая, что median(Zt)≈tp .
Yk|Y0=Y0(1+2q)tp(1−q)t(1−p)
когда p=0.5 мы имеем соотношение, равное 1(1+q−2q2)0.5t . Это максимизируется, когдаq=0.25 и больше1 когдаq<0.5
также интересно рассчитать вероятность того, что вы будете впереди в момент времениt . чтобы сделать это, нам нужно определить значение z таким образом, чтобы
(1+2q)z(1−q)t−z>1
осуществляя некоторую перестановку, мы находим, что пропорция выигрышей должна удовлетворять
zt>log(1−q)log(1−q)−log(1+2q)
Это может быть включено в нормальное приближение (примечание: среднее значение0.5 и стандартная ошибка0.5t√ ) как
Pr(ahead at time t)≈Φ(t√log(1+2q)+log(1−q)[log(1+2q)−log(1−q)])
что ясно показывает, что игра имеет очень хорошие шансы. коэффициент умноженияt√ минимизируется, когдаq=0 (максимальное значение13 ) и монотонно убывает как функция отq . поэтому стратегия «низкого риска» заключается в том, чтобы ставить очень небольшую долю своего богатства и играть много раз.
предположим, что мы сравниваем это сq=13 иq=1100 . коэффициент для каждого случая составляет0.11 и0.32 . Это означает, что после38 игр у вас будет около 95% шансов быть впереди с небольшой ставкой по сравнению с 75% шансов с большей ставкой. Кроме того, у вас также есть шанс разориться с более крупной ставкой, при условии, что вам пришлось округлить свою ставку до ближайших 5 центов или доллара. Начиная с20 это может быть13.35,8.90,5.95,3.95,2.65,1.75,1.15,0.75,0.50,0.35,0.25,0.15,0.1,0.05,0 . Это последовательность из14 проигрышей из38 , и, учитывая, что игра будет ожидать19 проигрышей, если вам не повезет с первыми несколькими ставками, то даже выигрыш может не компенсировать плохую серию (например, если произойдет большинство ваших побед) как только большая часть богатства исчезнет). разориться с меньшей 1% -ой долей невозможно в38 играх. Обратная сторона в том, что меньшая ставка в среднем приведет к гораздо меньшей прибыли, например,увеличениев350 раз при большой ставке по сравнению сувеличениемв1.2 при малой ставке (т.е. вы ожидаете получить 24 доллара после 38 раундов с маленькой ставка и 7000 долларов с большой ставкой).
источник
Я не думаю, что это сильно отличается от мартингейла. В вашем случае нет ставок на удвоение, но выигрыш выплачивается в 3 раза.
Я закодировал «живую копию» вашего дерева. Я бегу 10 симуляций. В каждой симуляции (трассе) вы начинаете с 200 монет и пробуете с деревом по 1 монете каждый раз 20 000 раз.
Единственными условиями, которые останавливают симуляцию, является банкротство или «выживание» 20 тысяч попыток.
Я думаю, что, несмотря ни на что, рано или поздно вас ждет банкротство.
Код является импровизированным javascript, но без зависимостей: https://repl.it/@cilofrapez/MagicTree-Roulette
Он показывает вам результаты сразу. Код прост в настройке: запускать сколько угодно симуляций, ставок, сколько угодно попыток ... Не стесняйтесь играть!
В нижней части кода результаты каждого моделирования (по умолчанию 10) сохраняются в CSV-файл с двумя столбцами: номер вращения и деньги. Я сделал это так, чтобы его можно было подавать в онлайн-плоттер для графиков.
Было бы легко автоматизировать все это локально, например, с помощью библиотеки Google Charts. Если вы хотите видеть только результаты на экране, вы можете закомментировать эту последнюю часть, как я упоминал в файле.
РЕДАКТИРОВАТЬ
Исходный код:
источник
Постановка задачи
ПустьYt=log10(Mt) - логарифм суммы денег Mt игрок имеет в момент времени t .
Пустьq будет доля денег, на которую игрок делает ставку.
ПустьY0=1 - сумма денег, с которой игрок начинает (десять долларов). Пусть YL=−2 будет сумма денег, на которой игрок обанкротится (ниже 1 цента). Для простоты мы добавляем правило, согласно которому игрок прекращает играть, когда он пропустил некоторую сумму денег YW (позже мы можем отменить это правило, приняв предел YW→∞ ).
Случайная прогулка
Вы можете увидеть рост и падение денег как асимметричную случайную прогулку. То есть вы можете описатьYt как:
где
Вероятность банкротства
мартингал
Выражение
это мартингейл, когда мы выбираемc таким, что.
Вероятность обанкротиться
таким образом
и
Выводы
Какой бы оптимальный процент не зависел от того, как вы оцениваете различные прибыли. Тем не менее, мы можем сказать что-то о вероятности потерять все это.
Только когда игрок ставит нулевую долю своих денег, он, безусловно, не обанкротится.
Вероятность банкротства при использовании критерия Келли.
Симуляторы
To further illustrate the possible outcomes of gambling with the money tree, you can model the distribution ofYt as a one dimensional diffusion process in a homogeneous force field and with an absorbing boundary (where the gambler get's bankrupt). The solution for this situation has been given by Smoluchowski
This diffusion equation relates to the tree problem when we set the speedc equal to the expected increase E[Yt] , we set D equal to the variance of the change in a single steps Var(Xt) , x0 is the initial amount of money, and t is the number of steps.
The image and code below demonstrate the equation:
The histogram shows the result from a simulation.
The dotted line shows a model when we use a naive normal distribution to approximate the distribution (this corresponds to the absence of the absorbing 'bankruptcy' barrier). This is wrong because some of the results above the bankruptcy level involve trajectories that have passed the bankruptcy level at an earlier time.
The continuous line is the approximation using the formula by Smoluchowski.
Codes
источник