Cтраница 1
Субоптимальные стратегии, полученные методом прицела, в рассматриваемом случае оказываются несколько более смелыми, чем оптимальные стратегии. [1]
В этих случаях нужно искать субоптимальные стратегии второго игрока. [2]
Таким образом, если в субоптимальных стратегиях, полученных квазиразомкнутым методом, специальная поправка может содержать составляющую, связанную с активной осторожностью, то в стратегиях, полученных методом прицела, такая активная поправка, а также поправка, связанная с пассивной осторожностью, отсутствуют. [3]
Именно знание подобных свойств ( и способов их обеспечения) для различных исследуемых задач управления и позволяет судить о принципиальных отличиях рассматриваемых субоптимальных стратегий от соответствующих этим задачам оптимальных эталонов. В этом и состоит суть анализа, а отсюда и синтеза ( путем искусственного восстановления недостающих свойств) исследуемых суб-олтимальных алгоритмов. [4]
Все эти предпосылки, а также рассмотренное во введении современное представление о психофизиологической структуре принятия решений человеком и привели к выбору того класса субоптимальных стратегий управления, который был назван в данной книге адаптивными алгоритмами управления с прогнозированием. [5]
В § 10 на отдельных примерах было показано, что в ряде случаев методы синтеза алгоритмов управления с прогнозированием могут рассматриваться как определенные аналитические приемы построения субоптимальных стратегий управления. Область такого применения исследуемых методов лишь незначительно превышает класс. В значительном числе важных для практики случаев оказывается возможным использование исследуемых методов только как вычислительных процедур определения субоптимальных управлений. Именно в этих случаях обнаруживается наиболее положительное качество метода прицела, связанное с четким разделением исходной задачи на две более простые: задачу статистического оценивания и задачу детерминированного управления. [6]
В настоящее время существуют тесты, чтобы определять потери качества в трехмерной системе, для которой быстродействующая модель вычисляет только три точки переключения вместо пяти. В общем, эти упрощенные субоптимальные стратегии приводят к тому, что траектории объекта имеют значительно больше переключений, чем это было бы в случае оптимальных стратегий. Однако следует отметить, что объект всегда управляем, даже если итеративная система с быстродействующей моделью случайно попадает в предельный цикл. [7]
Рассмотренный путь усовершенствования стратегии, полученной методом прицела, позволяет подчеркнуть главную мысль, развиваемую в гл. При этом, как было показано в § 10, приходится опираться на анализ проявления эффектов изучения и осторожности в задачах дуального управления. В частности, на основании изложенного выше очевидно, что субоптимальные стратегии управления с активной адаптацией для условно-гауссовских процессов в качестве аргументов должны включать в себя элементы ковариационной матрицы y ( t), зависящие от выбора управлений. Как было показано в рассмотренном выше примере, аналогичный вид стратегия управления имеет и в случае проявления эффекта активной осторожности. Поэтому в общем случае рациональный весовой коэффициент Я, при переменных v ( 0 должен подбираться специально. [8]
Как было отмечено ранее, для од-ношагового процесса управления характерно присутствие только эффекта осторожности. Кроме того, следует иметь в виду, что синтез такого решения обычно оказывается достаточно простым, так как вычислительные трудности возникают, как правило, при синтезе многошаговых решений. Сравнение структуры алгоритма осторожного одношагово-го оптимального управления со структурой алгоритма смелой субоптимальной стратегии, полученной - методом прицела, позволяет в большинстве случаев найти удобный вид стратегии управления. [9]
Алгоритмы оптимальной фильтрации находят применение в многошаговых стратегиях управления. Так, широкое распространение получил алгоритм управления, в котором при появлении каждого нового наблюдения, сначала, пользуясь алгоритмами фильтрации, определяют оценки ненаблюдаемых переменных состояния, а затем подставляют эти оценки в модель объекта и отыскивают управление, решая детерминированную экстремальную задачу. Тем не менее, этот прием широко используют и в различного рода субоптимальных стратегиях. [10]