Cтраница 2
Тем самым имеет место строгое улучшение стационарной стратегии. [16]
Положим 11 - - множество всех стационарных стратегий. [17]
Можно показать, что множество всех оптимальных стационарных стратегий игры Г является замкнутым выпуклым многогранником. Стохастическая игра с рациональными коэффициентами не обязательно обладает рациональной ценой. [18]
Необходимое условие оптимальности содержит утверждение, что оптимальная стационарная стратегия дает решение экстремальных уравнений. Покажем теперь, что стационарная стратегия, дающая решение экстремальных уравнений, является оптимальной. [19]
Из теоремы 5.7 следует, что итерационный алгоритм приводит к оптимальной стационарной стратегии за конечное число итераций. [20]
Эта вероятность не зависит от времени /, поскольку рассматриваются лишь стационарные стратегии. [21]
Теорема 1.7. Если р0 - точка безразличия, то должны существовать две стационарные стратегии, для которых Ро - точка безразличия и которые отличаются лишь решением, принимаемым в одном состоянии. [22]
Если G ( i, f) пусто при всех i S, то оптимальная стационарная стратегия найдена. [23]
Правомерность такого предположения может быть доказана строго ( фактически это вытекает из теоремы о стационарной стратегии, приводимой в разд. [24]
Всегда существуют единственные конечные значения yt, удовлетворяющие экстремальным уравнениям ( 1), и стационарная стратегия, соответствующая этим значениям г / г и являющаяся оптимальной среди всех возможных стратегий. [25]
Таким образом, предположение, что уравнения ( 3) имеют единственное решение, соответствующее оптимальной стационарной стратегии, исключает системы с оптимальными стратегиями, соответствующими множественным цепям. На самом деле нетрудно найти оптимальные стратегии и для множественных цепей, но эти случаи здесь не будут рассматриваться. [26]
Любое допустимое базисное решение задачи линейного программирования (2.45) - (2.48) порождает чистую ( нерандомизированную) стационарную стратегию. [27]
Для получения асимптотики суммарного среднего дохода в случае периодической стратегии нужно лишь уметь находить такую асимптотику для стационарной стратегии. [28]
Предположим, что заключение, сделанное в варианте а), является верным; тогда покажите, что существует стационарная стратегия, которая лучше всех других возможных стратегий. [29]
Прежде чем вывести соответствующие экстремальные уравнения и изложить алгоритм их решения, рассмотрим более детально вероятностную структуру модели при использовании стационарной стратегии. Введем в выражение ( 3), приведенное ниже, допущение, которое исключает некоторые особые случаи, представляющие интерес для узких специалистов. Это допущение существенно упрощает рассуждения, не сужая в то же время практической применимости рассматриваемого аппарата. В дальнейшем дается нестрогое описание поведения марковской цепи. [30]