Cтраница 1
Каноническая дискриминантная функция является линейной комбинацией дискриминантных переменных и удовлетворяет определенным условиям. [1]
Канонические дискриминантные функции определены, и теперь можно приступить к их интерпретации. Задача сводится, во-первых, к изучению относительных расстояний между объектами и центроидами классов и, во-вторых, к рассмотрению соотношений между отдельными переменными и функциями. Если существует более одной функции, мы также задаемся вопросом, все ли из них необходимы. [2]
Он рассматривает канонические дискриминантные функции, алгоритмы и функции классификации, а также различные критерии выбора для включения переменных. Здесь приводится геометрическая интерпретация коэффициентов канонической дискри-минантной функции, представлено использование коэффициентов в стандартной и нестандартной форме, а также алгоритмы определения числа значимых дискриминантных функций. Профессор Клекка начинает рассмотрение дискриминантного анализа с самых простых вещей, а затем постепенно переходит к более сложному материалу. В конце работы дается обсуждение возможных нарушений предположений, лежащих в основе дискриминантного анализа, которое послужит отправной точкой для тех, кто собирается впервые применять дискриминантный анализ в исследовательских задачах. Клекка, безусловно, заслуживает самой высокой оценки. [3]
При определении значимости и минимального числа канонических дискриминантных функций мы не полагаемся на Л - статисти-ку Уилкса или связанный с ней тест значимости, основанный на хи-квадрат распределении. Вместо этого мы можем рассмотреть каноническую корреляцию и относительное процентное содержание, как было показано в разд. Если любая из данных величин окажется небольшой, функция будет для нас малоинтересной, даже если она - статистически значима. Тесты значимости представляют наибольший интерес в случае малых выборок. Таким образом, имея с ними дело, мы должны с большим вниманием отнестись к удовлетворению предположений. Однако в случае больших выборок мы может обойтись без тестов значимости или использовать их консервативно, когда наши данные нарушают предположения. [4]
Рассмотрим основные принципы получения коэффициентов иг канонической дискриминантной функции. Полное представление математических аспектов этой проблемы не входит в нашу задачу. Таблица групповых средних и стандартных отклонений недостаточна, так как не учитывает зависимости между переменными. [5]
Классификация может быть проведена и с помощью канонических дискриминантных функций вместо использования исходных дискриминантных переменных. При этом применяются те же формулы ( лишь заменяется X на /) и результаты классификации обычно бывают идентичными. [6]
Во многих учебниках по статистике применяются термины каноническая переменная для обозначения того, что мы называем канонической дискриминантной функцией и дискриминантная функция, которую мы в разд. [7]
Некоторые программы дискриминантного анализа ( такие, как BMD05M и подпрограмма в SAS76) выполняют только классификацию и не вычисляют канонические дискриминантные функции. [8]
II было показано, что решению уравнения ( 4) соответствует собственное значение ( лямбда) и множество коэффициентов для каждой канонической дискриминантной функции. Однако некоторые из них будут математически тривиальными решениями, а другие - статистически малозначимыми. [9]
В работе ( Overall and Klett, 1972; 292 - 295) описывается, как структурные коэффициенты могут использоваться для графического представления различия между групповыми центроидами в случае двух канонических дискриминантных функций. На графике с осями, которые относятся к этим двум функциям, представлены групповые центроиды и главный центроид, изображены векторы, исходящие из главного центроида и направленные в каждую дискримннантную переменную. Направляющие углы этих векторов вычисляются, исходя из структурных коэффициентов. Длина вектора определяется межгрупповыми и внутригрупповы-ми вариациями соответствующей переменной. [10]
Специалистам по приложениям, в общем-то, и необязательно досконально разбираться в этих вопросах. Им в первую очередь необходимо научиться применять и интерпретировать канонические дискриминантные функции. Это и является задачей следующего раздела. [11]
Если необходимо классифицировать большое число объектов методом расстояния и вероятностей, то, воспользовавшись дискри-минантными функциями, можно значительно сократить количество работы. Вместо вычисления расстояний для р переменных нам нужны только q канонических дискриминантных функций. [12]
Другая ситуация, в которой две процедуры могут давать разные результаты, возникает, когда одна или несколько канонических функций игнорируются, так как не являются статистически значимыми. Хотя в этом примере некоторые объекты могут быть классифицированы по-разному, результаты, полученные с помощью канонических дискриминантных функций, будут более точными, поскольку уменьшается влияние выборочных флуктуации. [13]
Как уже было сказано, целью дискриминантного анализа является решение двух задач: интерпретации и классификации. До сих пор внимание фокусировалось в основном на задаче интерпретации, которая связана с определением числа и значимости канонических дискриминантных функций и с выяснением их значений для объяснения различий между классами. Классификация - это особый вид деятельности исследователя, в котором либо дискри-минантные переменные, либо канонические дискриминантные функции используются для предсказания класса, к которому более вероятно принадлежит некоторый объект. Существует несколько процедур классификации, но все они сравнивают положение объекта с каждым из центроидов классов, чтобы найти ближайший. Например, целью исследования Бардес было сформировать подпространство, определяемое канонической дискриминантной функцией, используя данные о 19 сенаторах и выделенных фракциях. [14]
Прежде чем приступить к обсуждению вопроса классификации ( его мы рассмотрим в разд. В данном разделе обсуждаются принципы, лежащие в основе вычисления канонических дискриминантных функций, и методы определения их числа. [15]