Cтраница 2
Многомерный статистический анализ геометрической структуры исследуемой совокупности многомерных наблюдений объединяет в себе понятия и результаты таких моделей и схем, как дискриминантный анализ, смеси вероятностных распределений, кластер-анализ и таксономия, многомерное шкалирование. Узловым во всех этих схемах является понятие расстояния ( меры близости, меры сходства) между анализируемыми элементами. При этом анализируемыми могут быть как реальные объекты, на каждом из к-рых фиксируются значения показателей ас - тогда геометрич. [16]
Система оснащена пакетом модульных программ, обеспечивающих виброакустический контроль и диагностирование дефектов контактирующих поверхностей ( питтинг, заедание, абразивный износ) зубчатых механизмов, подшипников качения и скольжения, повреждений лопаток турбины, лопастей насоса и других роторных механизмов. Пакет прикладных программ обеспечивает распознавание технических состояний на основе сравнения мер близости - мерных векторов диагностических признаков с эталонными векторами. Диагностические признаки формируются из спектральных компонент гармонического ряда характерных частот спектров амплитудной, частотной и амплитудно-импульсной модуляции и из вероятностных характеристик виброакустического сигнала. [17]
Для проведения такой процедуры необходимо, чтобы было определено каким-либо образом расстояние между кластером - например, как расстояние между их центрами или между двумя наиболее близкими объектами, или между двумя наиболее удаленными объектами. Имеется много других способов выбора расстояния, каждый из которых соответствует своему типу кластерного анализа. Результат применения этого метода представляет собой диаграмму, напоминающую дерево - дендрограмму. На дендрограмме указаны все последовательные слияния кластеров и приведены отвечающие им меры близости. На основе этой диаграммы исследователь вручную производит окончательную классификацию. [18]
Теперь предположим, что необходимо вычислить насколько близки по значениям 1 0000 множеств. Сделать это вручную, т.е. расставить все эти множества в некую последовательность, упорядоченную по близости, очень трудно. Гораздо эффективнее и быстрее использовать для этого формулу мер сходства, которая позволяет по достаточно простому алгоритму рассчитать меры близости всех 1 0000 множеств по отношению к какому-либо выбранному отдельному множеству. [19]
Качество разбиения зависит от начальных точек-эталонов. Различные комбинации начальных А-эталонов, выбираемых из различных областей множества М, определяют различные разбиения на классы. Если число классифицируемых объектов достаточно велико, то решение задачи достаточно сложно. В этом случае пользуются итерационными алгоритмами. Смысл итерационного алгоритма заключается в том, что на каждом шагу последовательно обсчитывается небольшая часть исходных данных, например одно из них. Основными средствами и идеями при конструировании последовательных кластер-процедур являются: меры близости, эталонные множества или точки, функционал качества разбиения. [20]