Cтраница 2
XI показывает некоторые из трудностей, О трудности выбора уровня значимости уже упоминалось выше. [16]
Вполне очевидно, что для заданной выборки при известном характере распределения между величинами Дякр и р должно существовать однозначное соответствие, опосредованное через выборочные параметры n, x и S. Но если эти параметры полностью определены конкретным видом выборочной совокупности, то в основание выбора уровня значимости р не может быть положено какое-либо внутренне присущее ( имманентное) выборке свойство. По образному выражению Е. И. Пустыльника, уровень значимости - это как бы размер ячеек сита, сквозь которое отсеиваются неслучайные события. Вместе с тем необходимо отчетливо сознавать, что назначая тот или иной уровень значимости, мы заведомо обрекаем себя на отождествление определенной части случайных событий со значимыми или заведомо неслучайными событиями. Уровень значимости, выраженный в процентах, показывает, сколько раз в каждых ста испытаниях Мы рискуем ошибиться, принимая случайное событие за зна чимое. [17]
Как видно из табл. 5.2, для полной выборки среднее х отличается от всех остальных оценок, которые совпадают, а для сокращенной выборки все оценки совпадают. Поскольку проверка наличия промаха довольно трудоемка и зависит от предположения о виде распределения и выбора уровня значимости, то предпочтительно использование одной из устойчивых оценок. Для определенности далее примем результат Q 1 1264 В, соответствующий медиане. [18]
Вполне очевидно, что для заданной выборки при известном характере распределения между величинами Ахкр и р должно существовать однозначное соответ-ствие, опосредованное через выборочные параметры п, х и S. Но если эти параметры полностью определены конкретным видом выборочной совокупности, то в основание выбора уровня значимости р не может быть положено какое-либо внутренне присущее ( имманентное) выборке свойство. По образному выражению Е. И. Пустыльника, уровень значимости - это как бы размер ячеек сита, сквозь которое отсеиваются неслучайные события. Вместе с тем необходимо отчетливо сознавать, что назначая - тот или иной уровень значимости, мы заведомо обрекаем себя на отождествление определенной части случайных событий со значимыми или заведомо неслучайными событиями. Уровень значимости, выраженный в процентах, показывает, сколько раз в каждых ста испытаниях мы рискуем ошибиться, принимая случайное событие за зна чимое. [19]
Проверка тех или иных статистических гипотез имеет смысл тогда, когда она делается много раз на независимом экспериментальном материале. Допустим, что мы проверили гипотезу а ас на материале т независимых выборок. В результате выбора уровня значимости а мы каждый раз отвергаем или не отвергаем проверяемую гипотезу. Спрашивается, как истолковать результаты т независимых проверок одной и той же гипотезы. Если т велико, то даже при малом а и верной гипотезе мы будем иногда ее отвергать. Наоборот, если гипотеза неверна, то вполне возможно, что при большом т мы несколько раз ее не отвергнем. Для объединения результатов т независимых проверок одной и той же гипотезы применяется следующий прием. [20]
Величина ошибок, определяемых по формулам (IV.15) и (IV.17) существенным образом зависит от величины ta, определяемой уровнем значимости а. Последний - величина переменная и не может быть задан раз и навсегда. Ниже будет рассмотрен один из возможных подходов к выбору уровня значимости. [21]
Статистические методы часто используются для того, чтобы получить положительный или отрицательный ответ на конкретный вопрос, касающийся значимости данных. Ответ определяется доверительной вероятностью, указывающей степень определенности ответа. Обычный метод заключается в создании нуль-гипотезы, которая устанавливает, что не имеется никакого значимого различия между двумя рядами данных или что изучаемая переменная оказывает незначительное влияние11 на них. Чтобы получить положительный или отрицательный ответ, выбирается, например, доверительная вероятность: 95 % или 99 % того, что ответ является правильным. К выбору уровня значимости следует подходить очень внимательно. Если выбирается слишком высокая доверительная вероятность ( например, 99 9 %), то можно пропустить значительное влияние изучаемой переменной. [22]