Cтраница 2
Предназначен для расширения библиотеки программ пользователя на ФОРТРАНе. Программы пакета могут быть использованы в следующих областях статистики; элементарные и непараметрические статистики; планируемый ( анализ дисперсий), корреляционный и регрессионный анализ; множественная линейная, пошаговая, полиноминальная регрессия, каноническая корреляция; дискриминантный и факторный анализ; анализ временных рядов; генерация случайных чисел ( равномерных и нормальных); функции распределения. [16]
В последнем параграфе вводится понятие канонической корреляции. Основной идеей при этом опять будет попытка уменьшить число переменных, не потеряв при этом слишком много информации. В отличие от метода главных компонент, который работает с переменными, принадлежащими одному множеству, анализ с помощью канонической корреляции предполагает, что переменные естественным образом разбиваются на два множества. И вместо изучения обоих множеств из них будут выбираться несколько некоррелированных линейных комбинаций, которые попарно будут сильно коррелированы. [17]
Когда мы анализируем генеральные данные, то ответы на вопросы о числе функций и их значимости даются с помощью относительного процентного содержания и канонической корреляции. В пределах ошибок измерения эти статистики полностью описывают различия между группами и дискриминантными функциями. [18]
Анализируя данные табл. 9, не следует делать поспешного заключения о том, что первая дискриминантная функция будет всегда иметь большую каноническую корреляцию. По этой причине каноническая корреляция для нас более полезна, потому что она показывает насколько удачно выбрана дискриминантная функция. Если классы не очень хорошо различаются по исследуемым, переменным, то все корреляции будут иметь малые значения, поскольку нельзя найти различия там, где их нет. Оценивая и относительное процентное содержание, и канонические корреляции, можно довольно точно узнать, как много дискриминантных функций имеют реальный смысл, и какую пользу они принесут при определении различий между группами. [19]
Гидроразрыв пласта - технически и технологически сложное мероприятие, эффективность которого определяется по многим показателям, зависящим от большого числа параметров, характеризующих геологические условия и технологию проведения ГРП. Как правило, взаимосвязи между различными параметрами, оцененными по уже проведенным ГРП, весьма неочевидны и плохо поддаются описанию обычными методами статистического анализа. Для подобных случаев специально разработаны методы многомерного статистического анализа данных. Это метод кластерного анализа, позволяющий разбить весь набор скважин с проведенным ГРП на несколько однородных по статистическим свойствам групп, и метод канонических корреляций ( канонический анализ), в котором устанавливаются максимальные корреляционные связи между двумя группами параметров. Поиск наиболее тесных связей между группой геолого-технологических параметров и показателями эффективности ГРП, а также получение прогноза показателей эффективности ГРП и являются целью исследований с применением статистического анализа данных. [20]
На следующем этапе обработки пронормированные вейвлет-коэффици-енты заменяются на канонические, принадлежащие к последовательным скользящим выборкам. Далее анализируется множество L () - мерных векторов, компоненты которых суть вейвлет-коэффициенты уровня а, где q - число анализируемых совместно рядов наблюдений. Количество La в каждом временном окне должно быть больше некоторого минимального для обеспечения статистической значимости оценок. Далее анализируются выборочные оценки ковариационной матрицы размера q x q векторов множества La и находятся собственные векторы, соответстствующие максимальному собственному числу. Эта процедура представляет собой частный случай задачи о канонических корреляциях для выявления максимума квадрата модуля коэффициента корреляции и не требует пояснений. В результате такого анализа подавляются те помехи естественного или ( чаще) техногенного характера, которые присутствуют только в одном ряде наблюдений. [21]
Рассмотрим результаты канонического корреляционного анализа эффективности проведения ГРП на пластах группы АВ. Изначально были выбраны все указанные в таблице 4.1.1 геологические параметры, как независимые и все параметры, характеризующие эффективность. Для сокращения количества параметров, характеризующих ГРП, использовалась процедура отсева, сущность которой заключается в отбрасывании параметров, имеющих малый вес в линейной комбинации, и повторном каноническом анализе с уменьшенным количеством параметров. При этом в оставшемся множестве параметры не должны быть сильно коррелированны. Процедура отсева прекращается, когда предыдущие канонические корреляции значимо отличаются от текущих. [22]