Оптимальные случайные ставки

7

Этот вопрос исходит от этого сайта, который я часто просматриваю.

Два игрока идут на горячее новое игровое шоу под названием «Higher Number Wins». Два идут в отдельные кабинки, и каждый нажимает кнопку, и на экране появляется случайное число от нуля до единицы. (На данный момент ни один из них не знает номер другого, но они знают, что номера выбраны из стандартного равномерного распределения.) Они могут выбрать сохранить это первое число или нажать кнопку еще раз, чтобы отменить первое число и получить второе случайное число, которое они должны хранить. Затем они выходят из своих кабин и видят окончательный номер каждого игрока на стене. Великолепный главный приз - ящик, полный золотых слитков, - вручается игроку, который сохранил большее число. Какой номер является оптимальным для игроков, чтобы отказаться от своего первого номера и выбрать другой? Другими словами, в каком диапазоне они должны оставить первое число,

Это либо очень странная проблема аукциона с симметричными игроками (я также предполагаю, что игроки нейтральны к риску), либо очень странная игра в лотерею / теорию игр.

Как бы вы подошли к этому вопросу математически и как бы вы ответили на него? Там нет никакого приза для меня, чтобы получить правильный ответ на загадку сайта, мне просто любопытно. Моя интуиция подсказывает мне, что оптимальное ограничение составляет 0,5, поскольку у вас есть 50-50 шансов быть выше или ниже номера вашего оппонента, независимо от того, повторяет он случайное число или нет, но я не уверен.

Кицунэ кавалерия
источник
Я не думаю, что нейтральность к риску имеет какое-либо отношение к этому, игроки просто пытаются максимизировать свою вероятность выигрыша. Выплаты являются двоичными, безопасных средних результатов нет.
Гискард
@denesp Вы могли бы избежать риска в том смысле, что если бы вы рисовали, скажем, 0,46, вы, возможно, не захотели бы перерисовать, даже если у вас больше шансов получить лучшее число, чем худшее.
Кицунэ кавалерия
1
@KitsuneCavalry Я понимаю, что вы говорите, но это было бы некое «поведенческое» понятие неприятия риска, так как оно определено на промежуточном этапе, а не на конечных результатах.
Шейн
@ Шейн Конечно, я тебя слышу. И я все равно не слишком беспокоюсь об этом.
Кицунэ кавалерия

Ответы:

6

Сначала я просто покажу, что 0,5 (или 12) пороговая точка не работает как симметричное равновесие, тогда вы можете решить для себя, хотите ли вы подумать о проблеме или прочитать полный ответ.

Обозначим точки отсечения как cx,cy, Предположим, что оба игрока используют стратегиюc=12, Обозначим номера игроковx а также y соответственно x1 а также y1 и их потенциальное второе число x2 а также y2, предполагатьx1=23, Сохраняя это вероятность того, что игрокx выигрывает

P(12y1<23)+P(y1<12)P(y2<23)=16+1223=12.
Это также означает, что 23является медианой этого распределения .

Теперь предположим x1=12, Сохраняя это вероятность того, что игрокx выигрывает

P(y1<12)P(y2<12)=1212=14
Но если он откажется x1=12 у него есть вероятность
P(y1<12)P(x2>y2)+P(y112)P(x2>y1)=38
победы. 38>14 так держать x1=12 (и его окрестности) не оптимальны, поэтому они не могут быть равновесным движением.


ОСТОРОЖНО, СПОЙЛЕРЫ

Если игрок y имеет отключение cy и игрок x рисует x1=cy и сохраняет вероятность того, что игрок Икс выигрывает

P(y1<cy)P(y2<cy)=cycy=cy2.
Если игрок x где выбросить x1 вероятность того, что он выиграет
P(y1cy)P(x2>y1)+P(y1<cy)P(x2>y2)=(1cy)(11+cy2)+cy12
Предположим, что существует симметричное равновесие, то есть cx=cy=c,
(Я не думаю, что существуют другие равновесия, но я не доказал это.)
Поскольку вероятность выигрыша постоянна в значенииx1, предельное значение c таков, что если x1=c тогда вероятность выигрыша равна, когда x1хранится и когда его выбрасывают. Это значит, что
п(Y1<с)п(Y2<с)знак равноп(Y1с)п(Икс2>Y1)+п(Y1<с)п(Икс2>Y2)ссзнак равно(1-с)(1-1+с2)+с12с2знак равно12-с+с22+с212с2+с2-12знак равно0сзнак равно5-12,

Giskard
источник
Кто-то сделал схожий с вами вывод и сделал этот расчет Вольфрама, чтобы проверить его дважды: tinyurl.com/j9xey5t Итак, я собираюсь сказать, что все выглядит правильно. Теперь, если вы решите общую форму этой игры, я дам вам лучший ответ: P Шучу ~ (хотя было бы интересно посмотреть, как изменится игра с большим количеством шансов на переигровку.) Означает ли ваша отредактированная отсечка то, что оба игрока имеют 50 % выигрыша, или вы все еще думаете, что в вашем ответе есть ошибка?
Кицунэ кавалерия
@KitsuneCavalry Я думаю, что согласиться с этим было немного преждевременно, но, к счастью, расчет верен, и мои рассуждения о 50% ошибочны. Отсечка настолько высока, что рисование «везет», и, таким образом, у вас больше 50% шансов на победу, если вы его вытянете. До розыгрыша у вас есть ровно 50%.
Жискар
Если это что-то значит, сайт, который дал вопрос, дал ответ. Вы получили это на деньги. Почувствуй себя победителем сегодня. Вы заработали это B)
Kitsune Cavalry
2

Предположим, человек 1 выбирает отсечение c1 и человек 2 выбирает отсечение c2, с c2c1, Позволятьp1(x) вероятность того, что окончательное число человека 1 не больше x, p1(x) равно c1x если x<c1 а также c1x+xc1в противном случае. определятьp2(x)по аналогии. Сейчас сюжетp2(x) против p1(x) на параметрическом графике для 0x1, Результат - три отрезка линии:

  • Один из (0,0) в (c12,c1c2)соответствует 0xc1;
  • Один из (c12,c1c2) в (c1c2+c2c1,c22)соответствует c1xc2;
  • Один из (c1c2+c2c1,c22) в (1,1)соответствует c2x1,

Эти три отрезка линии делят единицу площади на две части. Площадь части под графиком - это вероятность того, что человек 1 имеет большее число. Некоторая геометрия показывает, что эта область12+12(c2c1)(c1c2+c21), Чтобы было устойчивое равновесие, обе его частные производные должны быть равны нулю, т.е.

1c22c1c2+c22=01c1+2c2c12+2c1c2=0

Добавление уравнений показывает, что (c2c1)(1+c1+c2)=0, что возможно только если c1=c2, Подставляя обратно в одно из уравнений,1c1c12=0Таким образом, единственное устойчивое равновесие c1=c2=512,

е «»
источник
Это отличный ответ, но почему вы называете равновесие устойчивым равновесием?
Жискард
1
@denesp Я думаю, это излишне.
f ''