Минимаксная стратегия

Cтраница 2

Очевидно, что минимаксные стратегии, так же как и байесовские, могут, вообще говоря, не существовать. В этом случае аналогично ( 3) можно ввести понятие г-минимаксной стратегии. В последующих рассмотрениях мы будем исходить из того, что sup и inf в ( 4), ( 5) достигаются. [16]

Этот случай соответствует применению минимаксной стратегии. [17]

Седловой точке соответствует пара минимаксных стратегий ( в данном случае / 42 и В2), которые называются оптимальными, а их совокупность является решением игры. [18]

Стратегия, соответствующая минимаксу называется минимаксной стратегией. [19]

Тогда л - л является минимаксной стратегией. [20]

Рассматриваемая задача является задачей на поиск минимаксной стратегии при наличии ограничений. [21]

В предположении, что игроки используют минимаксную стратегию, этот алгоритм предписывает присвоить каждой нетерминальной вершине дерева оценку, равную такому выигрышу, которого можно ожидать, если продолжить игру с этого места и до конца. [22]

Для определения алгоритма принятия решения, соответствующего минимаксной стратегии, продифференцируем (4.36) по P ( Oj) и приравняем производную нулю. [23]

Элемент матрицы а32, лежащий на пересечении минимаксных стратегий Л3 и В2 и равный чистой цене игры К, минимален в своей строке и максимален в своем столбце. Этот элемент то аналогии с точкой на поверхности, являющейся минимумом по одной координате и максимумом по другой, называется седловой точкой. В данном случае об игре говорят, что это игра с седловой точкой или строго детерминированная игра. Седловой точке всегда соответствует пара минимаксных стратегий, которые являются оптимальными, а их совокупность определяет решение игры. [24]

В условиях неполной информации необходимо принять некую форму минимаксной стратегии. Таким образом, все статистические решения являются минимаксными процедурами. Там, где допускаются только две гипотезы ( Л0 и AJ), мы имеем дело со специальным случаем, в котором hl выражает все неблагоприятные исходы. При условии неполной информации индивид минимаксимизирует свою позицию долгосрочного дохода; фирма минимаксимизирует свою позицию долгосрочных поступлений. [25]

Минимаксную и максиминную стратегии часто называют одним термином - минимаксные стратегии. [26]

Если же игра повторяется неоднократно, то постоянное применение минимаксных стратегий становится неразумным. Например, если игрок В будет уверен в том, что на следующем ходу А применит прежнюю стратегию, то он несомненно выберет стратегию, отвечающую наименьшему элементу в этой строке, а не прежнюю. [27]

Это, в свою очередь, позволяет рассматривать вопросы существования чистых минимаксных стратегий, смешанных минимаксных стратегий и байесовых стратегий. Исходя из этого, в дальнейшем будем придерживаться именно байесова подхода к решению задачи. [28]

Стратегия игрока II, обеспечивающая выигрыш р, является его минимаксной стратегией. [29]

Минимаксные стратегии неустойчивы: если один из игроков, применяя свою минимаксную стратегию, каким-либо образом узнает о способе действий противника, то, отступив от нее, он может увеличить свой выигрыш. [30]

Страницы: 1 2 3 4