Cтраница 3
Именно в точке Х производная ( градиент) обращается в нуль. Поэтому и говорят, что все градиентные методы не могут отличить глобального максимума от локального. Этот недостаток существенно ограничивает область применения градиентных методов. [31]
![]() |
Методы наискорейшего спуска ( а и покоординатного спуска ( б. [32] |
Если поиск максимума начать из точки XQ, то метод, основанный на градиенте функции, дает точку XL Именно в точке Х производная ( градиент) обращается в нуль. Поэтому и говорят, что все градиентные методы не могут отличить глобального максимума от локального. Этот недостаток существенно ограничивает область применения градиентных методов. [33]
![]() |
Система координат, связанная с произ-нолыюй точкой поверхности постоянного уровня. [34] |
Нужно отметить еще одно очевидное свойство градиента целевой функции. Вектор градиента по направлению совпадает с направлением наискорейшего возрастания целевой функции. Именно это свой-с во и обусловило применение градиентных методов при решении злдач нелинейного программирования. [35]
В данной главе рассматривается частная, но важная задача оптимизации режима - оптимальное распределение активных мощностей тепловых электростанций. Параграф 4.3 посвящен решению этой задачи методом Лагранжа. Основное внимание в данной главе уделено применению градиентного метода для оптимизации режима. [36]
Выше было указано, что для улучшения точности алгоритма Пао может быть применен градиентный алгоритм Ермольева. В данном пункте приводятся методические основы спектрального метода получения оптимальных программных управлений. Этот подход может считаться альтернативой градиентному методу Ермольева, поскольку он использует параметризацию функций управления, фазовых координат, функционалов качества, а также предполагает применение градиентного метода оптимизации. Кроме того, по неклассическим равновесиям безкоалиционной игры, спектральный подход обеспечивает получение решения в виде непрерывных функций, что, как будет показано на примере, может существенно улучшить значения показателей качества, а также может быть использовано для анализа динамики конфликта и его прогноза. [37]
При отсутствии хорошего начального приближения алгоритм (2.24) может расходиться, поэтому метод Ньютона целесообразно применять в сочетании с методом наискорейшего спуска, который призван предварительно отыскать приемлемое начальное приближение. Тем не менее общий объем вычислений, необходимых для минимизации (2.21) с требуемой точностью при применении этого метода, может оказаться меньше, чем при применении более простых градиентных методов. [38]
В предыдущем параграфе рассмотрена связь характера целевых функций с общими потерями на поиск яп я различных методах оптимизации. При переходе от безградиентных методов к градиентным и далее к методам с использованием вторых производных наблюдается уменьшение количества шагов поиска 1 с одновременным увеличением числа проб л3 для определения направления поиска. Уменьшение i и увеличение / г3 при переходе от одной группы методов к другой оказываются довольно резкими, поэтому в большинстве случаев наименьшее значение яп получается при применении градиентных методов. Однако и в этих методах величина п может достигнуть неприемлемо больших значений при наличии узких гребней на гиперповерхности отклика целевой функции. [39]
Математические модели исследуемых ПГУ представлены в виде системы программ для ЭЦВМ БЭСМ-4. Эта система состоит из двух частей: программы расчета тепловой схемы установки и программы определения суммарных расчетных затрат по установке. Алгоритм удовлетворения ограничений на технологические характеристики включен во вторую часть, а на независимые и зависимые параметры - в первую часть. Алгоритм оптимизации параметров ПГУ, основанный на применении градиентного метода, реализован в виде отдельной программы, не содержащей никаких вычислений, кроме подсчета величины шага. [40]
Особо следует остановиться на вопросе о сохранении симметрии ядерной конфигурации при проведении оптимизации. Все градиентные методы сохраняют симметрию начального приближения. Это утверждение вытекает из того, что градиент некоторой функции имеет ту же симметрию, что и сама функция, а симметрия функции потенциальной энергии должна быть не ниже, чем симметрия ядерной конфигурации. Часто для уменьшения числа варьируемых параметров с самого начала вводят координаты симметрии и варьируют только полносимметричные координаты. В том и другом случае найденный экстремум может оказаться не минимумом по отношению к несимметричным деформациям, что в действительности часто и происходит. С другой стороны, когда симметрия заранее обусловлена требованиями задачи, применение градиентных методов позволяет обойтись без использования симметризованных переменных, так как поиск экстремума автоматически осуществляется в подпространстве требуемой размерности. [41]
Недавно Ларсон выдвинул способ, названный динамическое программирование с возмущением переменных состояния [13], который позволяет более эффективно использовать имеющиеся вычислительные средства для метода динамического программирования. Вероятно, выходом из положения, связанного с дилеммой памяти, является использование вместо функции оптимального дохода ( функции Беллмана), требующей очень большой памяти ВМ, возмущенной функции дохода [14], которая представляет собой вариацию неоптимальной функции дохода из-за малых изменений переменных состояния относительно номинальной траектории. Такую функцию можно во многих случаях определить с помощью сравнительно небольшого числа параметров и тем самым уменьшить трудности, связанные с памятью ВМ. Знание возмущенной функции дохода позволяет получать улучшенные траектории. Метод, который можно было бы назвать дифференциальным динамическим программированием и который представляет собой остроумную комбинацию градиентного метода с динамическим программированием, был использован Мэйном [14] для получения алгоритмов второго порядка, применяемых при определении оптимальных траекторий как в дискретных, так и в непрерывных системах. Поскольку этот метод имеет такую же интуитивную притягательность, что и динамическое программирование, он должен упростить применение градиентных методов и в стохастических задачах. [42]