Cтраница 3
Очевидно, худшие правила следует сразу отбросить. Минимаксные оценки позволяют отыскивать правила решения, которые обеспечивают наилучший результат для худшего случая. Так, если имеется множество нехудших правил решения, то согласно минимаксному критерию из них надо выбрать такое, для которого максимальное значение условного среднего риска меньше, чем для любого другого правила. Проблема заключается в том, чтобы иметь способ регулярного определения таких правил. Если число правил конечно, то задача решается перебором, в частности, это всегда принципиально возможно при конечных ансамблях оценок и смесей. Правда, при увеличении объема ансамблей число правил растет очень быстро ( при т значениях оценки и п значениях смеси число правил равно т) так, что если не удается найти способ усечений множества правил, то задачу вряд ли можно довести до конца. [31]
Когда априорное распределение iti ( в) неизвестно, процедура построения безусловной оценки случайного параметра & может основываться на минимаксном критерии качества. Минимаксной называется оценка Ф мм, для которой верхняя граница значений условной функции риска г ( О) не превосходит верхних границ значений функции ( относительно переменной §) при любых других оценках. Так же как и минимаксное правило выбора решения в альтернативных ситуациях, минимаксная оценка дает уверенность в том, что потери в среднем ( по совокупности выборок заданного размера) не будут больше некоторой величины rmin. В некоторых случаях минимаксная оценка может оказаться слишком осторожной. [32]
Целью его является достижение большей предельной глубины поиска за счет отбрасывания менее перспективных продолжений. Этот метод позволяет отсекать ветви в дополнение к тем, которые отсекаются самим альфа-бета алгоритмом. В связи с этим возникает риск пропустить какое-нибудь хорошее продолжение и неправильно вычислить минимаксную оценку. [33]
Незнание априорной ПВ X исключает возможность нахождения байесовских оценок, так как воспользоваться равенством (4.14) для построения апостериорного распределения при этом не удается. Можно, конечно, в этом случае применить так называемые минимаксные оценки, гарантирующие непревышение средним риском П при любых W0 ( X) определенного значения Пма 1СМВВ, являющегося значением П для некоторой наименее благоприятной априорной ПВ. Отметим, однако, что отыскание таких оценок не просто и, кроме того, сами минимаксные оценки нередко излишне осторожны, минимизируя средний риск для плохих W0 ( X) ценой существенного завышения П для остальных. [34]
Из этого следует, в частности, что корню дерева присвоена оценка, равная цене игры для первого игрока. Рассмотрим, например, рис. 3.9; здесь терминальным вершинам присвоена оценка нуль, если выигрывает первый игрок, но за максимальное количество ходов, - 1, если выигрывает второй игрок, и 1, если первый выигрывает раньше, чем за максимум ходов. Число, написанное около каждой вершины, представляет собой оценку, присвоенную этой вершине алгоритмом минимаксной оценки. Заметим, что корню присвоена оценка нуль, а это указывает, что первый игрок может добиться выигрыша при максимальном количестве ходов - тот же самый результат был установлен в разд. Мы рекомендуем в качестве упражнения дать оценки для большого дерева, изображенного на рис. 3.8. ( Какую оценку следует присвоить корню этого дерева. [35]
В [16, 22] приведен алгоритм получения оценки т, основанный на анализе структуры механизма реакции, представленной в виде графа. Алгоритм предцолагает рассмотрение вспомогательных схем реакций, задаваемых определенным образом для каждой пары веществ. Путем аналитического решения нестационарной модели, описывающей поведение этих вспомогательных схем, авторы приходят к минимаксной оценке т исходной реакции. Отметим, что хотя аналитические решения алгоритма в принципе могут быть получены, однако количество необходимых при его реализации выкладок затрудняет практическое его применение. [36]
Когда распределение помех имеет длинные хвосты, как, скажем, нормальное, такая минимаксная оценка оказывается по дисперсии существенно хуже, чем оценка МНК. Однако, если распределение имеет четкие границы, причем плотность вероятности вблизи границ заметно отлична от нуля, например так, как у равномерного распределения, минимаксная оценка дает существенный выигрыш по сравнению с МНК. [37]
![]() |
Условные функции риска. [38] |
&), представляет минимаксную оценку. Однако обращение этой функции в постоянную величину при небайесовской оценке не означает, что оценка минимаксная. С другой стороны, если условие г ( &) const неосуществимо для всех & при байесовских оценках, то это еще не значит, что нельзя найти минимаксную оценку. Идея последовательного оценивания состоит в том, чтобы производить наблюдения до тех пор, пока оценка неизвестного параметра распределения, основанная на выборке, получаемой в результате наблюдений, не будет удовлетворять заданному критерию качества. В книге Вальда [2] дается постановка задачи последовательного интервального оценивания. Ее решение связывается с возможностью преодоления недостатка интервальной оценки при фиксированном размере выборки, который состоит, вообще говоря, в случайности длины доверительного интервала. [39]
Когда априорное распределение iti ( в) неизвестно, процедура построения безусловной оценки случайного параметра & может основываться на минимаксном критерии качества. Минимаксной называется оценка Ф мм, для которой верхняя граница значений условной функции риска г ( О) не превосходит верхних границ значений функции ( относительно переменной §) при любых других оценках. Так же как и минимаксное правило выбора решения в альтернативных ситуациях, минимаксная оценка дает уверенность в том, что потери в среднем ( по совокупности выборок заданного размера) не будут больше некоторой величины rmin. В некоторых случаях минимаксная оценка может оказаться слишком осторожной. [40]
Машина выигрывает 70 % игр у своего партнера - человека. Она часто удивляла своих конструкторов, выбирая странные, на первый взгляд непонятные ходы, которые при дальнейшем анализе оказывались, однако, вполне оправданными. Обычно считают, что машины справляются, с длинными запутанными вычислениями и пасуют перед общей оценкой обстановки. Как ни странно, оценка позиций этой машиной была хорошей; основным ее недостатком является выбор заключительных ходов в комбинационной игре. Любопытно также отметить, что машина игрок в Геке нарушает обычную процедуру счета, а именно в этой машине по существу дискретная задача решается с помощью аналоговой системы. Он использовал прием, предложенный автором этой статьи для игры в шахматы, - исследование возможных вариантов на несколько ходов и минимаксную оценку окончательных позиций. Ниже приводится простая партия, сыгранная машиной и Сгрэчи с пояснительными замечаниями Стрэчи. В скобках указаны позиции шашек противника, снимаемых при данном ходе. [41]