Cтраница 2
В дифференциальной игре принимают интересы игроков А и В противоположными. [16]
В дифференциальных играх сближения, рассматриваемых в данной главе, присутствует неполнота информации того же типа, который описан в § 1 гл. В первом параграфе дается постановка задачи. Второй параграф содержит решение задачи об оптимальных помехах для изотропной игры общего вида и для ряда конкретных примеров. [17]
III рассматриваются дифференциальные игры с запаздыванием информации. Допускается, что один из противников измеряет фазовый вектор другого противника с постоянным или переменным запаздыванием. Введение запаздывания отражает свойство реальных систем, заключающееся в том, что на получение и обработку информации требуется затратить некоторое конечное время. [18]
Может ли дифференциальная игра на самом деле иметь в качестве части своего решения экивокальную поверхность. Если да, то в случае, подобном изображенному на рис. 10.5.1, часть первичного решения будет резко прервана даже несмотря на то, что отброшенная часть будет частью формально верной конструкции. [19]
Хорошими моделями дифференциальных игр, к тому же поддающимися геометрическим методам решения, являются так называемые простые игры преследования. В таких играх скорости игроков Р и Е постоянны, а управлениями служат направления скоростей; платой, как правило, выбирается время захвата. [20]
В теории дифференциальных игр обычно предполагается [28, 57, 60], что при построении позиционного управления игроки располагают в каждый момент времени точными значениями полного фазового вектора игры. Учет переработки текущей информации приводит к дифференциальным играм с запаздыванием информации, рассмотренным в гл. Вследствие ограниченности возможности наблюдения, информационных помех и некоторых других причин непрерывное поступление информации к игрокам может нарушаться. В этих условиях возникают игровые задачи, в которых один из игроков может измерять фазовые координаты другой стороны не во все моменты времени, а лишь на части интервала движения. С помощью сведения к эквивалентным играм решен ряд конкретных задач с исследованием вопроса о минимальной информации, достаточной для достижения в игре наилучшего результата. [21]
Численное решение дифференциальной игры представляет большие трудности, особенно в случае нелинейных систем. Предлагаемый приближенный способ позволяет, выбрав закон управления из заданного класса, произвести его оценку и оптимизацию по параметрам, а также найти оптимальное ответное управление противника. В § 1 излагается алгоритм метода, в § 2 приводится численный пример. [22]
Типичным примером дифференциальной игры является игра преследования, в которой фазовые координаты определяют положения ( а иногда и скорости) нескольких объектов, из которых одни называются преследователями, а другие - преследуемыми. Каждый игрок управляет координатами подчиненных ему объектов. Игра заканчивается в заранее указанный момент, причем выигрыш преследователей определяется близостью преследующих объектов к преследуемым в момент окончания игры. [23]
В теории дифференциальных игр проблема как бы обращается: выбирается показатель /, характеризующий процесс преследования, и требуется для преследуемого и преследователя найти законы управления, обеспечивающие им наилучшие значения /, Поскольку речь идет о конфликтной ситуации, оптимальность процесса означает обычно, что требуется минимизировать / выбором управления для одного из партнеров и одновременно максимизировать / выбором управления для другого партнера. В частности, большой круг проблем составляют задачи о минимаксе ( максимине) времени Т до встречи объектов. [24]
Сложность решения дифференциальных игр, которые излагались выше, в том, что оптимальные стратегии отыскиваются в классе функций общего вида ( обычно измеримых) относительно состояний х, у объектов управления. Таким образом, эта задача - задача синтеза управлений ( см. § 13, гл. IV), осложненная наличием игровой ситуации. [25]
Определение понятия дифференциальных игр будет связано со следующей концепцией. [26]
Типичными примерами дифференциальных игр являются сражения, воздушные бои, футбол, преследование судна торпедой, перехват самолета зенитной ракетой, охрана объектов от нападения. Если один из игроков выключается из игры, мы получаем обычную задачу максимизации. Она уже относится к вариационному исчислению н составляет основную часть теории управления. [27]
В теории дифференциальных игр существуют аналогичные обстоятельства. [28]
В теории дифференциальных игр, как и в других областях анализа, иногда удобно произвести некоторую замену переменных. [29]
Для построения эквивалентной дифференциальной игры в непрерывном случав необходим дополнительный анализ, постулирование тех величин и уравнений, которые могут описать процесс измерения и управления в согласии с приведенным выше словесным описанием модели. Более наглядным путем, которому ниже отдается предпочтение, является предельный переход в соотношениях для дискретной системы. Предельный переход не является доказательством получаемых соотношений, а играет лишь наводящую роль; соотношения для эквивалентной дифференциальной игры, полученные в результате этого перехода, могут быть просто постулированы. [30]