Стационарная стратегия

Cтраница 2

Тем самым имеет место строгое улучшение стационарной стратегии. [16]

Положим 11 - - множество всех стационарных стратегий. [17]

Можно показать, что множество всех оптимальных стационарных стратегий игры Г является замкнутым выпуклым многогранником. Стохастическая игра с рациональными коэффициентами не обязательно обладает рациональной ценой. [18]

Необходимое условие оптимальности содержит утверждение, что оптимальная стационарная стратегия дает решение экстремальных уравнений. Покажем теперь, что стационарная стратегия, дающая решение экстремальных уравнений, является оптимальной. [19]

Из теоремы 5.7 следует, что итерационный алгоритм приводит к оптимальной стационарной стратегии за конечное число итераций. [20]

Эта вероятность не зависит от времени /, поскольку рассматриваются лишь стационарные стратегии. [21]

Теорема 1.7. Если р0 - точка безразличия, то должны существовать две стационарные стратегии, для которых Ро - точка безразличия и которые отличаются лишь решением, принимаемым в одном состоянии. [22]

Если G ( i, f) пусто при всех i S, то оптимальная стационарная стратегия найдена. [23]

Правомерность такого предположения может быть доказана строго ( фактически это вытекает из теоремы о стационарной стратегии, приводимой в разд. [24]

Всегда существуют единственные конечные значения yt, удовлетворяющие экстремальным уравнениям ( 1), и стационарная стратегия, соответствующая этим значениям г / г и являющаяся оптимальной среди всех возможных стратегий. [25]

Таким образом, предположение, что уравнения ( 3) имеют единственное решение, соответствующее оптимальной стационарной стратегии, исключает системы с оптимальными стратегиями, соответствующими множественным цепям. На самом деле нетрудно найти оптимальные стратегии и для множественных цепей, но эти случаи здесь не будут рассматриваться. [26]

Любое допустимое базисное решение задачи линейного программирования (2.45) - (2.48) порождает чистую ( нерандомизированную) стационарную стратегию. [27]

Для получения асимптотики суммарного среднего дохода в случае периодической стратегии нужно лишь уметь находить такую асимптотику для стационарной стратегии. [28]

Предположим, что заключение, сделанное в варианте а), является верным; тогда покажите, что существует стационарная стратегия, которая лучше всех других возможных стратегий. [29]

Прежде чем вывести соответствующие экстремальные уравнения и изложить алгоритм их решения, рассмотрим более детально вероятностную структуру модели при использовании стационарной стратегии. Введем в выражение ( 3), приведенное ниже, допущение, которое исключает некоторые особые случаи, представляющие интерес для узких специалистов. Это допущение существенно упрощает рассуждения, не сужая в то же время практической применимости рассматриваемого аппарата. В дальнейшем дается нестрогое описание поведения марковской цепи. [30]

Страницы: 1 2 3 4