Cтраница 4
Предположим, что для объекта ( 1) с допустимым параметром в настройка регулятора 1 ( в) е Т обеспечивает некоторое качество управления ( в смысле заданного предельного функционала), которое зависит от параметра в и распределений возмущений v е V. Требуется построить реализуемую стратегию, обеспечивающую нехудшее качество управления по сравнению с классом стационарных стратегий в условиях полной априорной информации. Данный раздел содержит формальную постановку задачи и процедуру синтеза, а ее обоснование предполагается в отдельной публикации. [46]
Всегда существует однозначно определенное конечное г /, удовлетворяющее экстремальным уравнениям ( 3), и соответствующая стационарная стратегия является оптимальной - лучшей из всех допустимых стратегий. [47]
Отметим, что в алгоритме поиска наилучшей стратегии наибольшие вычислительные трудности заключаются в нахождении выигрыша для любой стационарной стратегии. Независимость параметров, выражаемая равенством ( 111 48), приводит к тому, что любая стационарная стратегия определяет прямое произведение марковских цепей на фазовом пространстве RRUXRC. Это позволяет решать задачи с существенно большим числом состояний, чем в рассмотренном примере. Применение полученной методики без значительного увеличения реальной размерности задачи возможно и в том случае, когда число характеристических параметров не два, как в исследуемой задаче, а больше. [48]
Из приведенных теорем вытекает, что рассматриваемая задача линейного программирования обладает специальной структурой. С помощью подходящего начального распределения ( например, ajl / N) можно найти оптимальное базисное решение, которое соответствует оптимальной стационарной стратегии. [49]
Множество ФК ( К, Р, г) совпадает с частью границы выпуклого многогранника, каждая грань которого соответствует одной чистой стационарной стратегии. [50]