Cтраница 4
Недавно Ларсон выдвинул способ, названный динамическое программирование с возмущением переменных состояния [13], который позволяет более эффективно использовать имеющиеся вычислительные средства для метода динамического программирования. Вероятно, выходом из положения, связанного с дилеммой памяти, является использование вместо функции оптимального дохода ( функции Беллмана), требующей очень большой памяти ВМ, возмущенной функции дохода [14], которая представляет собой вариацию неоптимальной функции дохода из-за малых изменений переменных состояния относительно номинальной траектории. Такую функцию можно во многих случаях определить с помощью сравнительно небольшого числа параметров и тем самым уменьшить трудности, связанные с памятью ВМ. Знание возмущенной функции дохода позволяет получать улучшенные траектории. Метод, который можно было бы назвать дифференциальным динамическим программированием и который представляет собой остроумную комбинацию градиентного метода с динамическим программированием, был использован Мэйном [14] для получения алгоритмов второго порядка, применяемых при определении оптимальных траекторий как в дискретных, так и в непрерывных системах. [46]
Определение оптимальных значений и ад для следующих трех случаен: 1) максимум абсолютного выхода цел чюго продукта, 2) максимум относительного выхода, 3) максимум функции дохода. [47]
Недавно Ларсон выдвинул способ, названный динамическое программирование с возмущением переменных состояния [13], который позволяет более эффективно использовать имеющиеся вычислительные средства для метода динамического программирования. Вероятно, выходом из положения, связанного с дилеммой памяти, является использование вместо функции оптимального дохода ( функции Беллмана), требующей очень большой памяти ВМ, возмущенной функции дохода [14], которая представляет собой вариацию неоптимальной функции дохода из-за малых изменений переменных состояния относительно номинальной траектории. Такую функцию можно во многих случаях определить с помощью сравнительно небольшого числа параметров и тем самым уменьшить трудности, связанные с памятью ВМ. Знание возмущенной функции дохода позволяет получать улучшенные траектории. Метод, который можно было бы назвать дифференциальным динамическим программированием и который представляет собой остроумную комбинацию градиентного метода с динамическим программированием, был использован Мэйном [14] для получения алгоритмов второго порядка, применяемых при определении оптимальных траекторий как в дискретных, так и в непрерывных системах. [48]
Использование функций дохода позволяет получить соотношения между гидрологическими или физическими параметрами и экономической выгодой. Помимо этого, функции дохода могут отражать сезонные колебания запасов и расхода воды. В конце каждого прогона имитационной моделирующей программы в соответствующие функции дохода вводятся такие параметры, как регулируемый расход потока, уровень вырабатываемой электроэнергии и уровень запаса воды для получения показателя относительной экономической выгоды, ожидаемой при принятии данного варианта графика эксплуатации системы. [49]
Но есть и математическая функция. В очень ограниченном смысле слово функция используют и социологи. Например, когда говорят, что интенсивность рождений является функцией доходов индивидов, устанавливают функциональную связь ( в математическом смысле термина) между двумя интенсивностями. Функции этого вида могут быть представлены графически. [50]
Это выражение приближается к функции дохода, определенной с помощью аппроксимации в пространстве стратегий. Следовательно, можно утверждать, что при увеличении числа аппроксимаций стратегии и функции дохода, полученные с помощью двух различных способов аппроксимации, в пределе приближаются друг к другу. Интересно отметить что при аппроксимации в пространстве функций величина Ъ оказывает большее влияние на стратегию и функцию дохода, чем а. Это связано с тем, что чем больше величина Ь, тем в большее число мест она входит. Если Ъ мало, то число требуемых аппроксимаций также мало, если же, напротив, b близко к 1, потребуется много стадий аппроксимации. [51]
В табл. 11 приведены результаты вычислений. Как видно из таблицы, здесь нет непрерывной зависимости функции дохода и полного потока от А. В этом резкое отличие табл. 11 от табл. 10, соответствующей задаче минимизации, в которой переход от одного А, к другому сопровождается плавным изменением полного потока и функции дохода. [52]