Решение - уравнение - беллман - Большая Энциклопедия Нефти и Газа, статья, страница 1

Решение - уравнение - беллман

Cтраница 1

Решение уравнений Беллмана (7.60), (7.61), (7.66), (7.67), (7.75) и (7.77) в общем случае может быть проведено лишь численными методами. Однако существует ряд частных, но важных прикладных задач, в которых соответствующее уравнение Беллмана решается в замкнутом виде. При этом для вектора управления могут быть получены несложные формулы. Это будет иметь место, когда В (, и) В ( t) и, а все элементы в первой строке матрицы В ( t), за исключением первого, равны нулю. В данном случае q ( t) - некоторая функция времени, и - управляющая величина, на которую наложено симметричное ограничение и ( тк) sg ук, ук - заданная последовательность положительных чисел. Часто также принимают ю ( Xj) - 0 при l l [ d; to ( Xj) 1 при х d, где d - заданное число. [1]

Решение уравнения Беллмана может быть не единственно. В этом случае необходимо дополнительное исследование, позволяющее выяснить, какое из имеющихся решений может претендовать на роль функции Беллмана исходной задачи оптимального управления. [2]

Для решения уравнения Беллмана в виде формулы (21.122) предварительно фиксируем управление. [3]

В этом случае процесс решения уравнения Беллмана относительно функционала S [ t u ] несколько изменяется. [4]

Такая структурная операция для решений уравнения Беллмана очень характерна. [5]

Поскольку в нашем распоряжении нет общих стандартных методов решения уравнения Беллмана и задач оптимального управления, то какие-либо общие методы решения задач синтеза также отсутствуют. [6]

В рассматриваемой сейчас задаче имеется простой спо -: об решения уравнения Беллмана: достаточно вычислять; [ i ] последовательно от v II ] до v [ / 0 ], запоминая управле-шя, на которых достигался максимум. [7]

Прежде всего выявим формальное отличие процедуры квазиразомкнутого метода от классической процедуры решения уравнений Беллмана ( 42) и ( 43), позволяющей получать строго оптимальные стратегии управления. [8]

Следовательно, задача построения оптимальной стратегии в этом случае сводится к решению уравнения Беллмана (3.8), к доказательству единственности полученного решения и к построению оптимальной стратегии по полученным оптимальным потерям. [9]

Кроме того, обычная процедура вычисления оптимального управления, состоящая в решении уравнения Беллмана и последующем нахождении оптимального управления, в поставленной задаче также не всегда осуществима, поскольку, например, возможны случаи, когда функция (3.2) тождественно равна единице. [10]

Структурная схема оптимального стохастического управления объектом, представляющим собой интегрирующее звено. [11]

Итак, в - мерной задаче синтеза необходимо на каждом шаге, путем решения уравнения Беллмана, получать функции ( J, Ц2 параметров. [12]

Синтез оптимальной системы управления осуществим, пользуясь методом динамического программирования, для детерминированных систем, в случае, когда функция Беллмана как решение уравнения Беллмана задается изначально. Выполнение уравнения Беллмана при этом обеспечивается выбором соответствующего адаптивного алгоритма оценивания. [13]

Иными словами, функция Беллмана не всегда удовлетворяет соответствующему рассматриваемой задаче уравнению Беллмана. Следовательно, решение уравнения Беллмана не обязательно совпадает с соответствующей функцией Беллмана. [14]

При решении задачи дуального управления предполагается, что все неизвестные и неконтролируемые параметры случайны и имеют априорно заданные функции распределения. Собственно решение задачи основано на последовательном применении метода динамического программирования Беллмана ( см. раздел IV. Однако на практике, как отмечалось выше, решение уравнения Беллмана даже в случае линейного объекта, наталкивается на большие вычислительные трудности - так называемое проклятие размерности. В общем случае эти трудности практически непреодолимы, поэтому обычно переходят к субоптимальным адаптивным алгоритмам, стараясь сохранить при этом по возможности все свойства оптимальных алгоритмов. Имеются два пути решения этой задачи. Первый состоит в последовательном усложнении простейших алгоритмов, с целью обеспечить качественное оценивание и управление. Второй предусматривает упрощение функционального уравнения Беллмана. [15]

Страницы: 1 2