Cтраница 3
Самым радикальным средством представляются полный или почти полный отказ от предпосылок и попытка получения результатов и их интерпретации в такой новой обстановке. Непараметрические методы оказались проще классических, и только трудности внедрения все еще сохраняют преимущества за классикой. Есть основания думать, что ситуация уже начала меняться. [31]
При сопоставлении двух групп методов следует отметить, что параметрические методы используют преимущественно для оценки параметров и проверки их значимости. Непараметрические методы применяют для разнообразных задач проверки гипотез, не связанных с определенными параметрами. При этом в качестве центра распределения целесообразно принимать медиану, а не математическое ожидание. Непараметрическими методами можно также оценивать медиану или другие квантили распределения. [32]
Название непараметрические методы подчеркивает их отличие от классических - параметрических - методов, в к-рых предполагается, что генеральное распределение известно с точностью до конечного числа параметров, и к-рые позволяют по результатам наблюдений оценивать неизвестные значения этих параметров и проверять гипотезы относительно их значений. [33]
Непараметрические методы не используют явно гипотезу о виде распределения. Особенно эффективны непараметрические методы при проверке гипотез ( например, с использованием критерия Колмогорова-Смирнова), однако в последнее время их все чаще применяют и для оценки параметров градуировочных зависимостей. [34]
Как и в случае с двумя классами, множественный дискриминант-ный анализ в первую очередь позволяет сократить размерность задачи. Параметрические или непараметрические методы, которые могут не сработать в первоначальном ( многомерном) пространстве, могут хорошо действовать в пространстве меньшей размерности. В частности, можно будет оценить отдельные ковариационные матрицы для каждого класса и использовать допущение об общем многомерном нормальном распределении после преобразования, что было невозможно сделать с первоначальными данными. Вообще преобразование влечет за собой некоторое ненужное перемешивание данных и повышает теоретически достижимый уровень ошибки, а проблема классификации данных все еще ортается. Существуют другие пути уменьшения размерности данных, и мы вернемся к этой теме в гл. Существуют также другие методы дискриминантного анализа; некоторые из них упоминаются в литературе к этой главе. Одним из самых фундаментальных и наиболее широко используемых методов все же остается метод Фишера. [35]
В первом случае применяют параметрические методы оценки, при которых сначала оценивают параметры закона распределения, а затем определяют показатель надежности как функцию от оцененных параметров. Во втором случае применяют непараметрические методы, при которых показатели надежности оценивают непосредственно по опытным данным. [36]
Поэтому их называют параметрическими методами. В статистике применяются также непараметрические методы измерения взаимосвязей, не требующие использования количественных значений признаков, а следовательно, и вычисления параметров их распределений. [37]
Так, например, в большинстве задач распознавания образов отсутствует информация о вида законов распределения значений характеристик исследуемых объектов, обучающие выборки имеют малые размеры. В этих случаях приходится использовать специальные непараметрические методы. Предлагаемая книга в определенной степени восполняет создавшийся пробел. [38]
Изложены современные методы обработки данных при прямых, косвенных и совместных измерениях с однократными и многократными наблюдениями. Кроме традиционных статистических методов, приведены робастные и непараметрические методы, а также основы теории нечетких множеств и интервального анализа. Рассмотрены методы обработки данных при измерениях параметров детерминированных и случайных процессов. [39]
Однако к данным тестологии часто трудно подобрать подходящее параметрическое семейство, особенно, если выводы надо делать по малым выборкам. В таких случаях удобно пользоваться так называемыми непараметрическими методами математической статистики, не предполагающими использование какого - либо параметрического семейства. [40]
Параметрическое оценивание плотности допустимо лишь в достаточно простых ситуациях. Оценку функции плотности в таких случаях целесообразно получать непараметрическими методами. [41]
При значительном объеме статистических данных и небольшом числе признаков наилучшими являются непараметрические методы, а при малом объеме данных, существенном числе признаков и использовании качественного описания значений некоторых или всех признаков, а также при наличии эталонов ситуаций оправдано применение эвристических процедур. [42]
Однако прежде чем приступить к изложению соответствующих результатов, следует заметить, что существуют классические непараметрические методы восстановления плотности ( например, метод Парзена), которые, казалось бы, позволяют обойти решение некорректной задачи. Однако при более внимательном анализе оказывается, что все они содержат константу, определение которой - проблема, полностью эквивалентная определению константы регуляризации Y / при решении некорректных задач. [43]
Такие ошибки необходимо обнаружить и определить их влияние на результаты. Соответствующие статистические модели ( основанные на биномиальном распределении, распределениях Пуассона, Гаусса или на непараметрических методах) и метрики, полученные из этих моделей, позволяют оценить достоверность аналитических данных. Хорошим примером использования этого подхода может служить описанное в работе [13] сопоставление результатов измерений, проведенных в различных лабораториях, и рассмотренный в работе [60] метод построения градуировочных кривых для приборов с нестандартной дисперсией. При обработке указанными методами результатов измерений необходимо учитывать предположения и ограничения, положенные в основу этих методов. Многие статистические методы обработки имеются в пакетах программного обеспечения компьютерных систем ( см. ниже) и в некоторых карманных программируемых калькуляторах как встроенные функции. Еще раз следует отметить, что простота обработки данных этими методами не должна порождать излишних иллюзий и что к получаемым результатам следует относиться достаточно осторожно. Так, автор работы [40] рекомендует проверять впервые используемые пакеты программ статистической ( или численной) обработки на совокупности данных, для которой результат обработки известен, поскольку это позволит выявить основные слабые места в программе. [44]
Изложена общая постановка проблемы распознавания объектов и явлений, процессов и ситуаций. Рассмотрены системотехнический подход к построению систем распознавания, формированию признакового пространства в условиях ограничений ресурсов, нетрадиционные непараметрические методы обработки априорной информации, вероятностные и логические алгоритмы распознавания, модели оптимального управления процессом распознавания, методы и алгоритмы оценки эффективности систем распознавания. [45]