Метод - кластерной анализ - Большая Энциклопедия Нефти и Газа, статья, страница 1

Метод - кластерной анализ

Cтраница 1

Метод кластерного анализа позволяет строить классификацию объектов посредством объединения их в группы, или кластеры, на основе критерия минимума расстояния в пространстве т показателей, описывающих объекты. [1]

Метод кластерного анализа, позволяющий строить классификацию нескольких объектов посредством объединения их в группы, или кластеры, на основе критерия минимума расстояния в пространстве определенных показателей, описывающих объекты, а также классификацию объектов на заданное число групп - кластеров. [2]

Данный метод по своей структуре имеет много общего с методом кластерного анализа. [3]

В результате поведенной литературной проработки и сопоставительного анализа существующих методов формализации нами было отобрано три наиболее близких применительно к анализу технических и технологических систем метода: Метод многокритериальной оценки, Метод кластерного анализа, Метод теоретико-множественного анализа. [4]

В результате поведенной литературной проработки и сопоставительного анализа существующих методов формализации нами было отобрано три наиболее близких применительно к анализу технических и технологических систем метода: Метод многокритериальной оценки, Метод кластерного анализа; Метод теоретико-множественного анализа. [5]

Среди других полезных свойств кластеров следует отметить то, что некоторые переменные должны быть постоянны для всех элементов в пределах кластера. Это свойство позволяет создавать простые методы идентификации элементов через кластеры. Большинство методов кластерного анализа требует определения между каждыми двумя элементами критерия подобия или расстояния, с тем чтобы можно было идентифицировать элементы, подобные данному элементу. Критерии подобия разработаны как для количественных ( непрерывных), так и для качественных ( дискретных) переменных, и основаны на использовании средней взвешенной оценки по результатам сравнения всех переменных. Термин расстояние заимствован из геометрического представления данных в виде точек в многомерном пространстве: малым расстояниям соответствует большее подобие. В методах иерархического кластерного анализа кластеры формируются последовательно либо путем объединения элементов в кластеры, а кластеров - в еще более крупные кластеры, либо путем разбиения больших кластеров на кластеры меньшего размера и отдельные элементы. Независимо от способа формирования кластеров результаты могут быть представлены в виде дендограммы или дерева семейства, в котором элементы одного уровня вложены в элементы всех других, более высоких уровней. В методах нсиерархического кластерного анализа элементы объединяются в конечное число кластеров так, чтобы оптимизировался некоторый критерий, описывающий требуемое свойство кластеров. Решение для данного числа кластеров может довольно сильно отличаться от решения для большего или меньшего их числа. [6]

I состоят из конечного числа точек. В этом случае множество QLI также состоит из конечного числа точек. В случае, если число точек в множестве Si c не слишком велико, то Qi; SibB противном случае с использованием методов кластерного анализа производится сжатие информации, в результате чего передаваемое множество QLI будет содержать заданное число точек. [7]

Гидроразрыв пласта - технически и технологически сложное мероприятие, эффективность которого определяется по многим показателям, зависящим от большого числа параметров, характеризующих геологические условия и технологию проведения ГРП. Как правило, взаимосвязи между различными параметрами, оцененными по уже проведенным ГРП, весьма неочевидны и плохо поддаются описанию обычными методами статистического анализа. Для подобных случаев специально разработаны методы многомерного статистического анализа данных. Это метод кластерного анализа, позволяющий разбить весь набор скважин с проведенным ГРП на несколько однородных по статистическим свойствам групп, и метод канонических корреляций ( канонический анализ), в котором устанавливаются максимальные корреляционные связи между двумя группами параметров. Поиск наиболее тесных связей между группой геолого-технологических параметров и показателями эффективности ГРП, а также получение прогноза показателей эффективности ГРП и являются целью исследований с применением статистического анализа данных. [8]

Третий метод позволяет оценить степень повторяемости кластерного решения в серии наборов данных. Если для различных выборок из одной и той же генеральной совокупности получается одинаковое кластерное решение, то напрашивается вывод, что это решение присуще всей совокупности. Маловероятно, что неустойчивое кластерное решение может отражать свойства генеральной совокупности. Эта методика уже рассматривалась в качестве примера в разд. Голдстейн и Линден ( 1969), проводя исследование больных алкоголизмом, разделили всю полученную выборку на две части, к которым затем применили один и тот же метод кластерного анализа. В результате в обоих решениях были обнаружены те же самые четыре кластера. [9]

Следующий подход, основан на применении техники кластерного анализа. Каждому элементу регулярной сетки ставится в соответствие некоторый заранее выбранный экспертом набор геологических и геофизических признаков. Это процедура позволяет разбить все точки региона на кластеры, каждый из которых отображается на географической карте в виде одной или нескольких зон, состоящих из точек с близкими значениями признаков. Затем максимальные магнитуды землетрясений, зарегистрированные в пределах каждой зоны, присваиваются всем ячейкам соответствующих кластеров. На этом процедура построения карты Мтах заканчивается. Недостатки подхода обусловлены не вполне адекватным применением к задаче прогноза Мтах метода кластерного анализа, который не предназначен для совместной обработки признаков и значений прогнозируемых величин. Дело в том, что разбиение множества точек на однородные группы методами многомерного кластерного анализа Мтах в значительной степени определяется набором признаков, способом измерения сходства между кластерами, типом алгоритма кластеризации и, наконец, критерием остановки процесса кластеризации. К сожалению, в работах, развивающих данный подход, эти параметры по существу выбираются произвольно. [10]

Чтобы понять это, рассмотрим следующий пример. Предположим, что группа исследователей проводит / Q-тест среди случайно отобранных детей из одного класса по всей школьной системе. Далее предположим, что в этом наборе данных на самом деле нет кластеров. Тем не менее допустим, что они все же решили провести кластерный анализ полученных данных, несмотря на унимодальное распределение по / Q-признакам. Если затем исследователи проведут дисперсионный анализ для сравнения групп по величине их / Q-оценок, применение / - теста покажет высокую значимость. Этот высокозначимый результат будет иметь место, несмотря на то, что в данных не существует ни одного кластера. С помощью методов кластерного анализа ( по определению) объекты разделяются на кластеры, которые фактически не перекрываются по признакам, применявшимся при создании кластеров. Проверки значимости различий между кластерами по этим признакам будут всегда давать положительные результаты, поскольку результаты таких проверок всегда положительны независимо от того, есть в данных кластеры или нет. Описанное использование тестов в лучшем случае бесполезно, в худшем - ведет к заблуждениям. [11]

Ранее мы полагали, что все точки объекта должны аппроксимироваться единственной линией. Обратим теперь наше внимание к более общей задаче описания объекта посредством совокупности линий. А именно это означает, что мы должны уметь разделять объект на такие подмножества, что каждое из них может быть хорошо представлено единственной линией. Существует много методов для выполнения этой операции. В следующих пунктах описываются два метода, основанные на кластерном анализе. Идея, лежащая в основе каждого из них, заключается в том, чтобы перевести исходный объект в новое пространство, в котором коллинеарные подмножества объекта образуют группы или кластеры. Эти кластеры затем могут быть найдены, например, с помощью методов кластерного анализа, подобных описанным в гл. [12]

Страницы: 1