Cтраница 1
Допустимая стратегия qn, которая максимизирует целевую функцию О, называется оптимальной стратегией. [1]
Допустимые стратегии удобно рассматривать в терминах 5-игры. [2]
Единственная допустимая стратегия удаления состоит в вычеркивании примеров тех m - дизъюнктов, которые уже были выведены на этой же глубине, запоминая при этом, как именно данные примеры были получены. Другими словами, если ЛП, Л / 2, A / 3eRes ( lO, label ( Л / 3) - пример label ( Л /) и N3 и N расположены на одной глубине в I /, то мы можем всюду в Res ( У) заменить N3 на N. Таким образом, АЧ М2, W, jV2 Nl Ny и, возможно, некоторые резолюции с N в качестве первой или второй компоненты будут добавлены к Res ( I /), a все вхождения N3 будут устранены. В исходном пространстве, однако, может использоваться любая полная стратегия доказательства теорем в том случае, когда абстрактное пространство порождается полностью. Например, мы можем так ограничить процедуру ridfindm в proofsearch2, чтобы она порождала резольвенты из S только согласно некоторой полной m - резолюционной стратегии. [3]
Если существуют допустимые стратегии, то существуют и оптимальные стратегии. [4]
В следующем примере допустимая стратегия порождается настраиваемой рандомизированной обратной связью, а допустимость обеспечивается специальной структурой основного контура. [5]
Минимум ищется по классу допустимых стратегий, sup - по классу допустимых управлений. [6]
Здесь экстремумы вычисляются по допустимым стратегиям игрока X и управлениям игрока У. Предполагается, что поставленная задача имеет решение. Аналогично может быть рассмотрена игровая задача и с точки зрения У. [7]
Следовательно, а является допустимой стратегией и X х 1 ] - Тогда, согласно доказанному выше, а оптимальна. [8]
Заметим, что Р - допустимые стратегии аналогичны понятию оптимальности по Парето в задачах выбора решений при неопределенности. Кроме этого, (4.3) - (4.4) представляют собой функционалы в абстрактных пространствах стратегий х ( со), Я ( со, dx), причем (4.4) - аддитивный функционал. [9]
Здесь U - множество всех допустимых стратегий, последними могут быть, в частности, нерандомизированные или рандомизированные однородные марковские стратегии. [10]
При описанном выше увеличении множества допустимых стратегий селектора состояний пропускная способность ПМК W для максимальной вероятности ошибки не уменьшается, в то время как пропускная способность для средней вероятности ошибки, вообще говоря, уменьшается. [11]
Прежде всего установим связь между допустимыми стратегиями игрока I и допустимыми векторами в задаче В. [12]
![]() |
Геометрическое определение байе. [13] |
Поскольку Ss является произвольной точкой на границе допустимых стратегий, то для любой точки этой границы можно найти такие w и 1 - w, для которых эта точка будет определять байесовскую стратегию. [14]
В задаче оптимизации должен быть показатель, по которому могут сравниваться различные допустимые стратегии. Его называют по-разному: функция выигрыша, критерий качества, целевая функция. [15]