Cтраница 3
IV посвящена дифференциальным играм, в которых один из противников может наблюдать другого не во все время движения, а лишь на некоторых временных интервалах или в отдельные моменты времени. Игры с неполной информацией данного типа сведены к дифференциально-импульсным играм с полной информацией. Ставятся и решаются задачи об оптимальном выборе одним из игроков интервалов или моментов наблюдений с целью получения им наилучшего результата в игре. Во многих случаях наблюдения в конечном или счетном числе моментов времени оказываются достаточными для получения того же результата, что и в игре с непрерывными наблюдениями. Даются решения игровых задач сближения и преследования управляемых объектов в условиях неполной информации, указаны оптимальные моменты наблюдений для этих игр. [31]
В некоторых случаях дифференциальные игры в задачах военного дела играют совершенно явную и не требующую особых комментариев роль. Это верно, например, для большинства моделей, включающих преследование, убегание и другое маневрирование подобного рода. Мы уже отмечали, что стратегия логически эквивалентна схеме управляющей системы в том смысле, что имеется инструкция, как выбирать управления в ответ на любые значения измеряемых данных. [32]
Напомним, что данная дифференциальная игра получена при следующих двух предположениях. Во-первых, наложено условие (1.3.11) гарантированной эффективности измерений. Как следуетиз формул (1.3.10), (1.3.11), это условие в каждый момент времени t связывает матрицу системы A ( t) и функцию h ( е, г), характеризующую возможности измерений. [33]
Таким образом, исходная дифференциальная игра (2.2.1) - (2.2.4) и многошаговая игра (2.2.7) - (2.2.9) оказываются эквивалентными в следующем смысле. Оптимальной стратегии и и управлению v в первой игре отвечает оптимальная стратегия и / с ( 2ь 9k) и управление i k во второй игре и обратно: оптимальной стратегии uk ( zfc, qk) и управлению i k для второй игры соответствует оптимальная стратегия и и управление v первой игры. Соответствующие оптимальные значения функционала в обеих играх при этом равны друг другу. [34]
Следуя терминологии теории дифференциальных игр [ 31, такие способы управления удобно назвать стратегиями. [35]
![]() |
Схема для задачи преследования. [36] |
В качестве примера дифференциальной игры укажем на задачу преследования, в которой игрок А управляет одним подвижным объектом, а игрок В - другим. [37]
В математической теории дифференциальных игр вопросы существования решений, в частности, существования равновесия проработаны достаточно глубоко. Данный вопрос рассматривается в большинстве работ, указанных в первом разделе обзора. [38]
Мои работы по дифференциальным играм были впервые опубликованы в шести выпусках Rand Reports в период с 1951 по 1953 / 54 г., когда вышла заключительная серия из четырех работ. Выпущенные ограниченным тиражом, они тем не менее имели некоторое хождение в Соединенных Штатах, но, насколько я знаю, ни один из выпусков не достиг Советского Союза. [39]
Чтобы ознакомиться с дифференциальными играми, рассмотренными в книге, лучше всего было бы, по-видимому, бегло пролистать ее; но мы дадим и здесь несколько кратких замечаний. [40]
Естественной аналогией в дифференциальных играх является выбор управлений как функций фазовых координат. [41]
В данной главе рассматриваются дифференциальные игры двух игроков в предположении, что одна из сторон получает информацию о фазовых координатах другой стороны с запаздыванием. Показывается ( § 1), что при некоторых условиях общего характера каждая дифференциальная игра с запаздыванием эквивалентна некоторой дифференциальной игре без запаздывания. Третий параграф содержит обобщения на случай переменного запаздывания. [42]
Сюда же можно отнести дифференциальные игры, связанные с оптимальным перехватом уклоняющейся цели. [43]
Однако введенный Айзексом термин дифференциальная игра дошел до Советского Союза и стал употребляться советскими математиками. [44]
Возможны и другие постановки дифференциальных игр. Одной из них является следующая. [45]