Cтраница 3
Отметим, что при выводе уравнения Беллмана существенным было предположение о дифференцируемости функции S ( t, х ( г)), которое не выполняется для многих практических задач, например для задач, имеющих управление в виде кусочно-постоянной функции времени. [31]
Отметим, что при выводе уравнения Беллмана существенным было предположение о дифференцируемое функции S ( t, x ( f)), которое не выполняется для многих практических задач, например для задач, имеющих управление в виде кусочно-постоянной функции времени. [32]
В этом случае процесс решения уравнения Беллмана относительно функционала S [ t u ] несколько изменяется. [33]
Поэтому квадратичная форма, удовлетворяющая уравнению Беллмана, будет функцией Беллмана, если она является положительно определенной. [34]
Уравнение ( 82) называется уравнением Беллмана. [35]
BfO 1), называются уравнениями Беллмана. [36]
Выражение ( IV-18) называют уравнением Беллмана, а ф - функцией Беллмана. Причем каждую из полученных функций приходится держать в памяти машины до самого последнего этапа расчета. Чем больше возможных состояний, тем больший необходим объем памяти. Зная синтез, мы можем подавать на управляющее устройство состояние системы я, и получать соответствующее ему оптимальное управление. [37]
Уравнение ( 22) называется уравнением Беллмана или уравнением динамического программирования. [38]
Описанная выше процедура отыскания частного решения уравнения Беллмана, дающего синтез оптимального управления, оказывается применимой также и в том случае, когда в правые части дифференциальных уравнений входят нелинейные функции типа целых степенных рядов от координат системы. [39]
Хотя нахождение оптимального решения с помощью уравнения Беллмана обычно чрезвычайно сложно и удается в редких частных случаях, оно представляет большой интерес для обоснования различных модификаций метода динамического программирования и последующего перехода к приближенным решениям. [40]
![]() |
Дисперсия ошибки воспроизведения сигнала с помощью оптимального фильтра.| Кривая, характеризующая время оптимального управления. [41] |
Поясним вкратце рассуждения, приводящие к уравнению Беллмана. [42]
Как видим, полученные уравнения являются уравнениями Беллмана для игр на выживание. [43]
Одним из принципиальных моментов является переход от уравнения Беллмана (1.3) к уравнению Гамильтона-Якоби (1.5) и дальнейший его эффективный анализ на основе понятий гамильтоновой механики и аппарата дифференциально-алгебраической геометрии. Кроме того, в главе 3 формально описывается метод Колесникова синтеза оптимальной обратной связи, основанный на конструкции поля экстремалей, а также метод дифференциальных инвариантов потенциальной функции. [44]
Уравнение ( 4 81) и является уравнением Беллмана в рассматриваемой здесь задаче с закрепленным концом траектории и свободным временем. [45]