Cтраница 4
Признак, задающий класс, или соответственно переменная регрессии добавляются к остальным признакам, в результате чего образуется вектор описания объекта. Положение этого признака среди прочих произвольно, однако в задачах распознавания удобно сделать его первым, а выходную переменную в задачах восстановления регрессии - последней. [46]
В задаче восстановления регрессии проблема состоит не в том, чтобы минимизировать функционал, а в том, чтобы найти функцию, близкую к регрессии. В этой задаче близость определяется с помощью метрики LP или метрики С в зависимости от того, как в дальнейшем предполагается использовать восстановленную функцию. Пусть, например, решается задача восстановления регрессии у - yix) в задаче интерпретации прямых экспериментов. [47]
Случай, когда у принимает только два значения: ноль и единица, a Fix, а) - индикаторная функция, образует задачу обучения распознаванию образов. Случай, когда у принимает произвольные значения, a Fix, а) - произвольное множество функций ( лишь бы функционал (1.15) имел смысл для любого а), для квадратичной функции потерь образует задачу восстановления регрессии. [48]
Однако, строго говоря, полученные результаты относились не к задаче восстановления регрессии, а к другой задаче - оценивания параметров регрессии. Такая подмена задач ( вместо приближения функции - оценивание ее параметров) правомерна для достаточно больших объемов выборки. С ростом объема выборки оцениваемые параметры стремятся к истинным и, следовательно, построенная с помощью найденных параметров функция стремится к регрессии. Однако для выборки ограниченного объема задача восстановления регрессии не всегда эквивалентна задаче оценивания ее параметров. [49]
Для задач восстановления регрессии предполагается, что все признаки заданы действительными числами. Однако для повышения точности счета желательно задавать признаки в таких единицах измерения, чтобы их значения были сравнимы по порядку величины. Качественные признаки, если таковые встретятся в задаче восстановления регрессии, следует кодировать аналогично тому, как это показано выше, но значение кода должно быть представлено в форме действительного числа. [50]