Оптимальная смешанная стратегия - игрок - Большая Энциклопедия Нефти и Газа, статья, страница 1
Когда-то я думал, что я нерешительный, но теперь я в этом не уверен. Законы Мерфи (еще...)

Оптимальная смешанная стратегия - игрок

Cтраница 1


Оптимальная смешанная стратегия игрока А всегда обеспечивает ему средний выигрыш не меньше у при любой фиксированной стратегии игрока В. Аналогичное свойство справедливо и для игрока В.  [1]

Отыскание оптимальной смешанной стратегии игрока А проводится по той же схеме, которая позволяет находить оптимальную смешанную стратегию игрока В в 2 х я-игре.  [2]

Требуется найти все крайние оптимальные смешанные стратегии игроков в игре с матрицей А.  [3]

В противном случае взятая комбинация корней уравнения (23.3) оптимальной смешанной стратегии игрока 1 составить не может, и следует перейти к другой такой комбинации.  [4]

Абсцисса этой точки является, таким образом, оптимальной смешанной стратегией игрока 1, а ее ордината - значением игры.  [5]

Абсциссой нижней точки подученной ломаной будет значение q, определяющее оптимальную смешанную стратегию игрока Д а ординатой v - значение игры.  [6]

Только после того, как произведено упрощение игры, начинается поиск оптимальных смешанных стратегий игроков и определяется цена игры. Иными словами, отыскивается решение игры.  [7]

Отыскание оптимальной смешанной стратегии игрока А проводится по той же схеме, которая позволяет находить оптимальную смешанную стратегию игрока В в 2 х я-игре.  [8]

Если существуют такие смешанные стратегии F ( x) и Q ( y) соответственно для игроков 1 и 2, при которых нижняя и верхняя цены непрерывной игры совпадают, то F ( x) и Q ( y) естественно назвать оптимальными смешанными стратегиями соответствующих игроков, а Vi V2 V - ценой игры.  [9]

Поэтому множества стратегий игроков расширяются до множества смешанных стратегий, состоящих в случайном выборе игроками своих первоначальных стратегий, наз. В приведенном примере оптимальными смешанными стратегиями игроков являются выборы игроками обеих своих стратегий с вероятностями 1 / 2, а значение игры в смешанных стратегиях равно нулю. Если множества А ж В конечны, то А.  [10]

Требуется найти цену игры v и оптимальные стратегии игрока А и игрока В. Нам предстоит найти вероятности р1и р2 % ля оптимальной смешанной стратегии SA игрока А и вероятности д и д2ддя оптимальной стратегии SB игрока В.  [11]

На этом рисунке геометрически представлена конкретная игра 2x2 с платежной матрицей, приведенной на том же рисунке. Длина отрезка MSA есть цена игры v, длины отрезков AI A и SAA2 - соответственно вероятностиp2npi, задающие оптимальную смешанную стратегию игрока А. Эту линию называют нижней границей выигрыша. Обратим внимание на то, что цена игры v определяется по наивысшей точке нижней границы выигрыша.  [12]

Эксперимент состоит, из ряда партий игры. Дальше снова очередь А - он отвечает В той своей стратегией Ак, которая дает максимальный выигрыш при стратегии Bt противника. Он отвечает нам той своей стратегией, которая является наихудшей не для последней, примененной нами, стратегии Ak, а для смешанной стратегии, в которой до сих пор примененные стратегии Af, Ak встречаются с равными вероятностями. И так далее: на каждом шаге итерационного процесса каждый игрок отвечает на очередной ход другого той своей стратегией, которая является оптимальной для него относительно смешанной стратегии другого, в которую все примененные до сих, пор стратегии входят пропорционально частотам их применения. Доказано, что такой метод сходится: при увеличении числа партий средний выигрыш на одну партию будет стремиться к цене игры, а частоты применения стратегий - к их вероятностям в оптимальных смешанных стратегиях игроков.  [13]

Эксперимент состоит из ряда партий игры. Начинается он с того, что один из игроков ( скажем, А) выбирает произвольно одну из своих стратегий At. Дальше снова очередь А - он отвечает В той своей стратегией Л, которая дает максимальный выигрыш при стратегии Bs противника. Он отвечает нам той своей стратегией, которая является наихудшей не для последней, примененной нами, стратегии Ak, а для смешанной стратегии, в которой до сих пор примененные стратегии AI, А встречаются с равными вероятностями. И так далее: на каждом шаге итерационного процесса каждый игрок отвечает на очередной ход другого той своей стратегией, которая является оптимальной для него относительно смешанной стратегии другого, в которую все примененные до сих пор стратегии входят пропорционально - частотам их применения. Доказано, что такой метод сходится: при увеличении числа партий средний выигрыш на одну партию будет стремиться к цене игры, а частоты применения стратегий - к их вероятностям в оптимальных смешанных стратегиях игроков.  [14]



Страницы:      1