Полезная стратегия

Cтраница 1

Полезные стратегии ( составы AI и Л2) должны применяться с частотами 1 / 7 и 6 / 7; состав Лз не должен применяться. Чтобы найти оптимальную стратегию противника, в общем случае можно поступить так: изменить знак выигрыша на обратный, прибавить к элементам матрицы постоянную величину L, чтобы сделать их неотрицательными, и решить задачу за противника так же, как мы решали ее за себя. Однако то обстоятельство, что нам известна цена игры v, несколько упрощает задачу. [1]

Полезные стратегии ( составы А и Л2) должны применяться с частотами 1 / 7 и 6 / 7; состав Л3 не должен применяться. Чтобы найти оптимальную стратегию противника, в общем случае можно поступить так: изменить знак выигрыша на обратный, прибавить к элементам матрицы постоянную величину L, чтобы сделать их неотрицательными, и решить задачу за противника так же, как мы решали ее за себя. Однако то обстоятельство, что нам известна цена игры v, несколько упрощает задачу. [2]

Полезная стратегия для избежания подобных проблем состоит в больших начальных шагах и постепенном уменьшении размера среднего случайного шага. Это позволяет сети вырываться из локальных минимумов и в то же время гарантирует окончательную стабилизацию сети. [3]

В данном случае оптимальная стратегия противника получается применением смеси двух полезных стратегий Вх и В2, пересекающихся в точке К. Стратегия В4 является заведомо невыгодной, а стратегия В3 - невыгодной при оптимальных стратегиях. [4]

Геометрическоедстолкование иг - BlMNBs. На ЭТОЙ ломаной. [5]

В данном случае оптимальная стратегия стороны В получается применением смеси двух полезных стратегий В2 и Bit которые дают прямые, пересекающиеся в точке N. Если через точку Л7 проходит более двух построенных прямых, то за полезные можно брать две любые из них. [6]

Рассмотрим теперь оптимальную смешанную стратегию второго игрока rjo - Она задается вероятностями г) с которыми применяются чистые полезные стратегии. Существенно, что не может быть т) - о при i 1, k, так как в этом случае t - я стратегия не входила бы в оптимальную смешанную стратегию второго игрока, т.е. не была бы полезной. [7]

Следовательно, у игры 2Хп всегда имеется решение, в котором с обеих сторон участвует не более двух полезных стратегий. [8]

Остальные k - 1 уравнений получим, составив выражения для средних потерь при оптимальной смешанной стратегии второго игрока и при любых k - 1 полезных стратегиях первого игрока. [9]

Таким образом, средний выигрыш первого игрока, если он применяет свою оптимальную смешанную страте гию, будет один и тот же при применении вторым игро ком любой из полезных стратегий, а значит, и любсн смешанной стратегии, состоящей из полезных страте гий. [10]

И если один из игроков придерживается своей оптимальной стратегии, то выигрыш ( проигрыш) его остается неизменным независимо от тактики другого игрока, если, конечно, последний не выходит за пределы своих полезных стратегий, иначе выигрыш ( проигрыш) возрастает. [11]

И, если один из игроков придерживается своей оптимальной стратегии, то выигрыш ( проигрыш) его остается неизменным независимо от тактики другого игрока, если, конечно, последний не выходит за пределы своих полезных стратегий, иначе выигрыш ( проигрыш) возрастает. [13]

Линия выигрыша при стратегии i / h.| Минимаксная стратегия в игре 2X i. [14]

Оптимальная смешанная стратегия второго игрока г ] 0 ( т) 1, 1 - т) /, 0) при известной цене игры v найдется из выражения средних потерь второго игрока при любой из полезных стратегий первого игрока. [15]

Страницы: 1 2