Допустимая стратегия

Cтраница 1

Допустимая стратегия qn, которая максимизирует целевую функцию О, называется оптимальной стратегией. [1]

Допустимые стратегии удобно рассматривать в терминах 5-игры. [2]

Единственная допустимая стратегия удаления состоит в вычеркивании примеров тех m - дизъюнктов, которые уже были выведены на этой же глубине, запоминая при этом, как именно данные примеры были получены. Другими словами, если ЛП, Л / 2, A / 3eRes ( lO, label ( Л / 3) - пример label ( Л /) и N3 и N расположены на одной глубине в I /, то мы можем всюду в Res ( У) заменить N3 на N. Таким образом, АЧ М2, W, jV2 Nl Ny и, возможно, некоторые резолюции с N в качестве первой или второй компоненты будут добавлены к Res ( I /), a все вхождения N3 будут устранены. В исходном пространстве, однако, может использоваться любая полная стратегия доказательства теорем в том случае, когда абстрактное пространство порождается полностью. Например, мы можем так ограничить процедуру ridfindm в proofsearch2, чтобы она порождала резольвенты из S только согласно некоторой полной m - резолюционной стратегии. [3]

Если существуют допустимые стратегии, то существуют и оптимальные стратегии. [4]

В следующем примере допустимая стратегия порождается настраиваемой рандомизированной обратной связью, а допустимость обеспечивается специальной структурой основного контура. [5]

Минимум ищется по классу допустимых стратегий, sup - по классу допустимых управлений. [6]

Здесь экстремумы вычисляются по допустимым стратегиям игрока X и управлениям игрока У. Предполагается, что поставленная задача имеет решение. Аналогично может быть рассмотрена игровая задача и с точки зрения У. [7]

Следовательно, а является допустимой стратегией и X х 1 ] - Тогда, согласно доказанному выше, а оптимальна. [8]

Заметим, что Р - допустимые стратегии аналогичны понятию оптимальности по Парето в задачах выбора решений при неопределенности. Кроме этого, (4.3) - (4.4) представляют собой функционалы в абстрактных пространствах стратегий х ( со), Я ( со, dx), причем (4.4) - аддитивный функционал. [9]

Здесь U - множество всех допустимых стратегий, последними могут быть, в частности, нерандомизированные или рандомизированные однородные марковские стратегии. [10]

При описанном выше увеличении множества допустимых стратегий селектора состояний пропускная способность ПМК W для максимальной вероятности ошибки не уменьшается, в то время как пропускная способность для средней вероятности ошибки, вообще говоря, уменьшается. [11]

Прежде всего установим связь между допустимыми стратегиями игрока I и допустимыми векторами в задаче В. [12]

Геометрическое определение байе. [13]

Поскольку Ss является произвольной точкой на границе допустимых стратегий, то для любой точки этой границы можно найти такие w и 1 - w, для которых эта точка будет определять байесовскую стратегию. [14]

В задаче оптимизации должен быть показатель, по которому могут сравниваться различные допустимые стратегии. Его называют по-разному: функция выигрыша, критерий качества, целевая функция. [15]

Страницы: 1 2 3