Категории:

Дом Здоровье Зоология Информатика Искусство Искусство Компьютеры Кулинария Маркетинг Математика Медицина Менеджмент Образование Педагогика Питомцы Программирование Производство Промышленность Психология Разное Религия Социология Спорт Статистика Транспорт Физика Философия Финансы Химия Хобби Экология Экономика Электроника

Сущность задачи проверки статистических гипотез

Статистическая гипотеза представляет собой некоторое предположение о законе распределения случайной величины или о параметрах этого закона, формулируемое на основе выборки [3, 5, 11]. Примерами статистических гипотез являются предположения: генеральная совокупность распределена по экспоненциальному закону; математические ожидания двух экспоненциально распределенных выборок равны друг другу. В первой из них высказано предположение о виде закона распределения, а во второй – о параметрах двух распределений. Гипотезы, в основе которых нет никаких допущений о конкретном виде закона распределения, называют непараметрическими, в противном случае – параметрическими.

Гипотезу, утверждающую, что различие между сравниваемыми характеристиками отсутствует, а наблюдаемые отклонения объясняются лишь случайными колебаниями в выборках, на основании которых производится сравнение, называют нулевой (основной) гипотезой и обозначают Н₀. Наряду с основной гипотезой рассматривают и альтернативную (конкурирующую, противоречащую) ей гипотезу Н₁. И если нулевая гипотеза будет отвергнута, то будет иметь место альтернативная гипотеза.

Различают простые и сложные гипотезы. Гипотезуназывают простой, если она однозначно характеризует параметр распределения случайной величины. Например, если l является параметром экспоненциального распределения, то гипотеза Н₀ о равенстве l =10–простая гипотеза. Сложной называют гипотезу, которая состоит из конечного или бесконечного множества простых гипотез. Сложная гипотеза Н₀ о неравенстве l >10 состоит из бесконечного множества простых гипотез Н₀ о равенстве l =b_i, где b_i – любое число, большее 10. Гипотеза Н₀ о том, что математическое ожидание нормального распределения равно двум при неизвестной дисперсии, тоже является сложной. Сложной гипотезой будет предположение о распределении случайной величины Х по нормальному закону, если не фиксируются конкретные значения математического ожидания и дисперсии.

Проверка гипотезы основывается на вычислении некоторой случайной величины – критерия, точное или приближенное распределение которого известно. Обозначим эту величину через z, ее значение является функцией от элементов выборки z=z(x₁, x₂, …, x_n). Процедура проверки гипотезы предписывает каждому значению критерия одно из двух решений – принять или отвергнуть гипотезу. Тем самым все выборочное пространство и соответственно множество значений критерия делятся на два непересекающихся подмножества S₀ и S₁. Если значение критерия z попадает в область S₀, то гипотеза принимается, а если в область S₁, – гипотеза отклоняется. Множество S₀называется областью принятия гипотезы или областью допустимых значений, а множество S₁ – областью отклонения гипотезы или критической областью. Выбор одной области однозначно определяет и другую область.

Принятие или отклонение гипотезы Н₀ по случайной выборке соответствует истине с некоторой вероятностью и, соответственно, возможны два рода ошибок. Ошибка первого рода возникает с вероятностьюa тогда, когда отвергается верная гипотеза Н₀ и принимается конкурирующая гипотеза Н₁. Ошибка второго рода возникает с вероятностью b в том случае, когда принимается неверная гипотеза Н₀, в то время как справедлива конкурирующая гипотеза Н₁. Доверительная вероятность – это вероятность не совершить ошибку первого рода и принять верную гипотезу Н₀. Вероятность отвергнуть ложную гипотезу Н₀называется мощностью критерия. Следовательно, при проверке гипотезы возможны четыре варианта исходов

Гипотеза Н₀	Решение	Вероятность	Примечание
Верна	Принимается	1–a	Доверительная вероятность
Отвергается	a	Вероятность ошибки первого рода
Неверна	Принимается	b	Вероятность ошибки второго рода
Отвергается	1–b	Мощность критерия

Потери и риск

Последствия от принятия решений следует оценивать по степени их соответствия поставленной цели. Это соответствие, в принципе, может быть определено с помощью количественной меры, определяющей выигрыш или потери от принятия решения. Эта мера называется функцией потерь (штрафа) или функцией выигрыша (целевой функцией). Для определенности будем использовать функцию потерь, которую, естественно, следуетминимизировать, чтобы решение было оптимальным.

Потери могут зависеть не только от принятого решения , но и от реальной ситуации, описываемой параметрами . Возможно, что потери зависят и от наблюдений . В общем случае функция потерь имеет вид . В частных случаях может быть , и т. д.

Если бы значение было известно, т. е. полностью определена реальная ситуация , то при получении наблюдения оптимальным решением была бы точка минимума функции , т. е.оптимальным решающим правилом была бы просто минимизация известной функции по при заданных значениях ее параметров и . Полученное таким образом решение является каждый раз наилучшим.

В реальности же являются скрытыми параметрами, т. е. действительная обстановка может быть, в лучшем случае, известна только приближенно. В таком случае уже невозможно каждый раз находить наилучшее решение – неизбежны просчеты из-за ошибочной оценки ситуации.

Единственное, что можно сделать в сложившемся положении, это попытаться найти такое решающее правило, при котором минимальными будут средние потери, т. е. среднее значение функции потерь, называемое риском.Правило, минимизирующее риск, будем называть оптимальным.

Для нахождения среднего значения функции потерь нужно задать распределение вероятностей на пространстве ее аргументов , что может быть сделано следующим образом.

Закон распределения вероятностей возможных ситуаций описывается ПРВ на .

Наблюдения z должны быть в той или иной мере связаны с , иначе в них нет никакой надобности. Эта связь может быть описана условной ПРВ на пространстве наблюдений , которая называется функцией правдоподобия (ФП).

Решения u принимаются в зависимости от z, это и есть решающее правило. В наиболее общем случае это правило рандомизировано и определяется условной вероятностной мерой, для определенности заданной условной ПРВ .

Таким образом, совместная ПРВ параметров , , есть функция , определенная на пространстве .

В зависимости от степени усреднения можно рассматривать различные типы рисков. Средний риск. Если известно распределение и (заданы ПРВ и ), то для любого решающего правила можно найти безусловное математическое ожидание функции потерь, зависящее только от этого правила и называемое средним риском:

. (2.1)

Оптимизация принятия решений заключается в выборе такого правила (т. е. ПРВ ), при котором средний риск (2.1) минимален.

Для нерандомизированых правил распределение сосредоточено в точке , т. е.

(2.2)

где – функция Дирака, и (2.1) принимает вид

. (2.3)

Здесь и в дальнейшем, если не возникает недоразумений, будем опускать обозначения областей интегрирования. Выражение (2.3) определяет средний риск для любого правила , а оптимизация принятия решений заключается в выборе такого правила , при котором риск (2.3) минимален.

Априорным риском называется величина

, (2.4)

где не зависит от . Если, кроме того, , то

. (2.5)

Выражения (2.4) и (2.5) определяют априорную оценку потерь, связанных с решением , принимаемым при отсутствии наблюдений или при их игнорировании. Такое решение может быть спланировано заранее, еще до наступления момента, когда решение необходимо принимать. В такой постановке оптимальным решением является , минимизирующее (2.4) или (2.5), оно учитывает только априорную информацию.

Апостериорным риском называется условное математическое ожидание функции потерь для данного решения при данном значении . Для этого найдем по формуле Байеса апостериорное условное распределение при заданном значении :

. (2.6)

Апостериорный риск определится усреднением функции потерь по ПРВ (2.6):

. (2.7)

Предыдущая 3 4 5 6 7 8 9 10 11 12 13 14 15 161718 Следующая

Последнее изменение этой страницы: 2016-08-11

lectmania.ru. Все права принадлежат авторам данных материалов. В случае нарушения авторского права напишите нам сюда...