Оптимальная смешанная стратегия - игрок - Большая Энциклопедия Нефти и Газа, статья, страница 1

Оптимальная смешанная стратегия - игрок

Cтраница 1

Оптимальная смешанная стратегия игрока А всегда обеспечивает ему средний выигрыш не меньше у при любой фиксированной стратегии игрока В. Аналогичное свойство справедливо и для игрока В. [1]

Отыскание оптимальной смешанной стратегии игрока А проводится по той же схеме, которая позволяет находить оптимальную смешанную стратегию игрока В в 2 х я-игре. [2]

Требуется найти все крайние оптимальные смешанные стратегии игроков в игре с матрицей А. [3]

В противном случае взятая комбинация корней уравнения (23.3) оптимальной смешанной стратегии игрока 1 составить не может, и следует перейти к другой такой комбинации. [4]

Абсцисса этой точки является, таким образом, оптимальной смешанной стратегией игрока 1, а ее ордината - значением игры. [5]

Абсциссой нижней точки подученной ломаной будет значение q, определяющее оптимальную смешанную стратегию игрока Д а ординатой v - значение игры. [6]

Только после того, как произведено упрощение игры, начинается поиск оптимальных смешанных стратегий игроков и определяется цена игры. Иными словами, отыскивается решение игры. [7]

Отыскание оптимальной смешанной стратегии игрока А проводится по той же схеме, которая позволяет находить оптимальную смешанную стратегию игрока В в 2 х я-игре. [8]

Если существуют такие смешанные стратегии F ( x) и Q ( y) соответственно для игроков 1 и 2, при которых нижняя и верхняя цены непрерывной игры совпадают, то F ( x) и Q ( y) естественно назвать оптимальными смешанными стратегиями соответствующих игроков, а Vi V2 V - ценой игры. [9]

Поэтому множества стратегий игроков расширяются до множества смешанных стратегий, состоящих в случайном выборе игроками своих первоначальных стратегий, наз. В приведенном примере оптимальными смешанными стратегиями игроков являются выборы игроками обеих своих стратегий с вероятностями 1 / 2, а значение игры в смешанных стратегиях равно нулю. Если множества А ж В конечны, то А. [10]

Требуется найти цену игры v и оптимальные стратегии игрока А и игрока В. Нам предстоит найти вероятности р1и р2 % ля оптимальной смешанной стратегии SA игрока А и вероятности д и д2ддя оптимальной стратегии SB игрока В. [11]

На этом рисунке геометрически представлена конкретная игра 2x2 с платежной матрицей, приведенной на том же рисунке. Длина отрезка MSA есть цена игры v, длины отрезков AI A и SAA2 - соответственно вероятностиp2npi, задающие оптимальную смешанную стратегию игрока А. Эту линию называют нижней границей выигрыша. Обратим внимание на то, что цена игры v определяется по наивысшей точке нижней границы выигрыша. [12]

Эксперимент состоит, из ряда партий игры. Дальше снова очередь А - он отвечает В той своей стратегией Ак, которая дает максимальный выигрыш при стратегии Bt противника. Он отвечает нам той своей стратегией, которая является наихудшей не для последней, примененной нами, стратегии Ak, а для смешанной стратегии, в которой до сих пор примененные стратегии Af, Ak встречаются с равными вероятностями. И так далее: на каждом шаге итерационного процесса каждый игрок отвечает на очередной ход другого той своей стратегией, которая является оптимальной для него относительно смешанной стратегии другого, в которую все примененные до сих, пор стратегии входят пропорционально частотам их применения. Доказано, что такой метод сходится: при увеличении числа партий средний выигрыш на одну партию будет стремиться к цене игры, а частоты применения стратегий - к их вероятностям в оптимальных смешанных стратегиях игроков. [13]

Эксперимент состоит из ряда партий игры. Начинается он с того, что один из игроков ( скажем, А) выбирает произвольно одну из своих стратегий At. Дальше снова очередь А - он отвечает В той своей стратегией Л, которая дает максимальный выигрыш при стратегии Bs противника. Он отвечает нам той своей стратегией, которая является наихудшей не для последней, примененной нами, стратегии Ak, а для смешанной стратегии, в которой до сих пор примененные стратегии AI, А встречаются с равными вероятностями. И так далее: на каждом шаге итерационного процесса каждый игрок отвечает на очередной ход другого той своей стратегией, которая является оптимальной для него относительно смешанной стратегии другого, в которую все примененные до сих пор стратегии входят пропорционально - частотам их применения. Доказано, что такой метод сходится: при увеличении числа партий средний выигрыш на одну партию будет стремиться к цене игры, а частоты применения стратегий - к их вероятностям в оптимальных смешанных стратегиях игроков. [14]

Страницы: 1