Главная Случайная страница


Категории:

ДомЗдоровьеЗоологияИнформатикаИскусствоИскусствоКомпьютерыКулинарияМаркетингМатематикаМедицинаМенеджментОбразованиеПедагогикаПитомцыПрограммированиеПроизводствоПромышленностьПсихологияРазноеРелигияСоциологияСпортСтатистикаТранспортФизикаФилософияФинансыХимияХоббиЭкологияЭкономикаЭлектроника






Каждый элемент генеральной совокупности может быть выбран.

Выбор является случайным.

Каждый элемент генеральной совокупности может быть выбран.

Каждый элемент выбирается независимо от остальных.

Все элементы выборки получаются в равных условиях.

Виды реальных выборов.

1. Механический выбор. В этом случае элементы генеральной совокупности выбираются по какой-либо закономерности. Например, измерения производятся через равные промежутки времени, контролируется каждая десятая деталь, сходящая с конвейера, каждый пятый человек по списку. Применяется для автоматизированного контроля.

2.Серийный выбор. Элементы в этом случае выбираются не по одному, а сериями. Например, контролю подвергается не одна таблетка лекарства, а упа­ковка, не один человек из какой-либо группы, а вся группа. Диктуется условия­ми производства и обследования.

3.Типический выбор. В этом случае генеральная совокупность делится на непересекающиеся части. Из каждой части выбираются элементы в количестве, пропорциональном объему части. Так можно получить сведения о средней зарплате в отрасли, об урожайно­сти поля, о политических предпочтениях людей. Характерен для экономических и социологических исследований.

4.Субъективный выбор - на основе какого-либо субъективного принципа. Например, обследуются не все партии продукции, а лишь одна, наиболее по­дозрительная на содержание брака, ведется опрос по телефону, а не всех слоев населения. Он экономит время, средства, но может привести к большим ошиб­кам.

5. Выбор с помощью случайных независимых измерений (температура среды, величина тока, загрязненность реки). Характерен для инженерных и естествен­нонаучных исследований.

Все типы выборов могут комбинироваться между собой. Существуют и дру­гие типы выборов. В математической статистике рассматривается только простой случайный выбор. Отметим одно его важное свойство - случайность (рандомизированность). Случайный выбор - объективен, гарантирует от пропуска скрытых зако­номерностей в генеральной совокупности, поэтому реальный выбор следует ор­ганизовывать так, чтобы свойство случайности присутствовало. В механиче­ском и субъективном выборах случайность отсутствует, поэтому они менее на­дежны.

Обратимся снова к анализу выборки. Повторяя выборку (x1,x2,…,xn) не­сколько раз, мы будем в общем случае получать каждый раз новые элементы, поэтому элементы выборки рассматриваются как случайные величины. Так как они принимают значения из одной и той же генеральной совокупности, то рас­пределены одинаково - так же, как случайная величина X, образующая рас­сматриваемую генеральную совокупность x1,x2,…,xn - это n копий случай­ной величины X. Далее, так как каждый элемент выборки получен независимо от остальных, то все элементы выборки рассматриваются как взаимно незави­симые случайные величины.

Итак, с теоретической точки зрения выборка (x1,x2,…,xn) - это n-мерная случайная величина, все компоненты которой - взаимно независимые одинако­во распределенные случайные величины. Их закон распределения - такой же, как у изучаемой случайной величины X. Такую теоретическую выборку следует отличать от ее реализации, т. е. на­бора n чисел, полученных в конкретном выборе (в конкретных измерениях). Чтобы подчеркнуть это различие, теоретическую выборку, т. е. n-мерную слу­чайную величину, иногда обозначают символом (Х1, Х2,..., Хn), составленным из больших букв, а ее реализацию – символом (x1,x2,…,xn ), составленным из малых букв. В дальнейшем с целью упрощения записей и теоретическую вы­борку, и ее реализацию будем обозначать одним и тем же символом (x1,x2,…,xn), так как из текста обычно ясно, о чем идет речь. Обсудим еще последнее свойство простого случайного выбора - о том, что все элементы выборки получаются в равных условиях. Это свойство можно выразить, введя случайную величину X* , принимаю­щую выборочные значения x1,x2,…,xn с одной и той же вероятностью 1/n. Дискретное равномерное распределение с законом, заданным формулой

Р(Х*=xk) = 1/n, k= 1,2,...,n, (2.1)

называется выборочным распределением, а его числовые характеристики - вы­борочными числовыми характеристиками (иначе - числовыми характеристи­ками выборки).

К выборкам, как и к выбору, предъявляется ряд требований. Важнейшим из них является требование репрезентативности (представительности). Это требование означает, что выборка должна хорошо представлять всю ге­неральную совокупность. Простой случайный выбор тоже репрезентативен, так как теоретически любой элемент генеральной совокупности может попасть в выборку, но менее надежен, чем типический, так как в силу независимости и случайности выбора элементов возможна их концентрация и, следовательно, недостаточно представительный охват генеральной совокупности.

Другим требованием является требование однородности выборки. Это оз­начает, что условия проведения экспериментов для получения выборки не должны меняться. Выборка должна быть получена из одной генеральной сово­купности, а не из нескольких. В ней должны отсутствовать выбросы. Неодно­родная выборка не может дать правильного прогноза. Различают малые и большие выборки, так как они отличаются мето­дами обработки. Для обработки большой выборки привлекаются асимптотиче­ские методы, основанные на центральной предельной теореме. В статистиче­ской практике принято считать выборку с объемом п > 30 большой. Для изучения двумерной случайной величины (Х,У) создается двумерная выборка, представляющая таблицу пар чисел (xi, yi) (i = 1,2,...,n).

Существуют выборки любой размерности.

Основные понятия, используемые при оценивании.

Оценивание — определение приближенного значения неизвестной характеристики или параметра распределения (генеральной совокупности), по результатам наблюдений(определение приближенного значения неизвестного параметра генеральной совокупности по результатам наблюдений). При этом параметром генеральной совокупности может быть либо число, либо набор чисел (вектор), либо функция, либо множество или иной объект нечисловой природы.

Оценивание проводят с помощью оценок — статистик, являющихся основой для оценивания неизвестного параметра распределения.

Оценивание бывает двух видов — точечное оценивание и оценивание с помощью доверительной области. Точечное оценивание — способ оценивания, заключающийся в том, что значение оценки принимается как неизвестное значение параметра распределения.

Пример. Пусть результаты наблюдений x1,x2,...,xn рассматривают в вероятностной модели как случайную выборку из нормального распределения N(m,σ). Т. е. считают, что результаты наблюдений моделируются как реализации n независимых одинаково распределенных случайных величин, имеющих функцию нормального распределения N(m,σ) с некоторыми математическим ожиданием m и средним квадратическим отклонением , неизвестными статистику. Требуется оценить параметры m и σ (или σ2) по результатам наблюдений. Оценки обозначим m * и ( ) * соответственно. Обычно в качестве оценки m * математического ожидания m используют выборочное среднее арифметическое , а в качестве оценки (σ2) * дисперсии σ2 используют выборочную дисперсию s2, то есть

.

Для оценивания математического ожидания m могут использоваться и другие статистики, например, выборочная медиана , полусумма минимального и максимального членов вариационного ряда

и др. Для оценивания дисперсии σ2 также имеется ряд оценок, в частности, (см. выше) и оценка, основанная на размахе R, имеющая вид

,

где коэффициенты a(n) берут из специальных таблиц. Эти коэффициенты подобраны так, чтобы для выборок из нормального распределения

.

Наличие нескольких методов оценивания одних и тех же параметров приводит к необходимости выбора между этими методами.

Понятие точечной статистической оценки. Требования к оценкам

Определение 3.1. Точечной статистической оценкой неизвест­ной числовой характеристики или параметра распределения называется функция , зависящая от элементов выборки, приближенно рав­ная :

(3.1)

Для каждой конкретной выборки - это число, т. е. точка на числовой оси.

Определение 3.2. Статистикой называется любая функция выбороч­ных элементов (наблюдений).

статистическая точечная оценка - это статистика, по значе­ниям которой можно судить о величине . Для одной и той же неизвестной величины можно составить бесконечно много различных оценок. Например, в качестве оценки математического ожи­дания m нормального распределения могут служить выборочное среднее , выборочная медиана med, полусумма квартилей tq, полусумма крайних эле­ментов tR.

В силу многообразия оценок, применяемых для оценивания одной и той же неизвестной величины, возникает задача выбора из них лучшей в определенном смысле. все статистические оценки являются случай­ными, так как случайными являются элементы выборки.

Определение 3.3. Оценка называется состоятель­ной оценкой , если она стремится по вероятности к сростом n: (3.2)

Это означает, что для любого > 0 выполняется соотношение

(3.3)

Это требование означает сближение и с ростом n в вероятностном смысле. В математической статистике, как правило, применяются только со­стоятельные оценки.

Пример 3.1. Из предельной теоремы Бернулли теории вероятностей следует, что относительная частота Р*(А) события А является состоятельной оценкой вероятности Р(А) этого события:

Определение 3.4. Оценка называется несмещенной оценкой , если математическое ожидание оценки равно : М = . (3.4)

Свойства выборочной дисперсии

Свойство 1. Выборочная дисперсия является состоятельной оценкой гене­ральной дисперсии:

Свойство 2. Вспомогательная формула для выборочной дисперсии

(3.17)

Свойство 3. Выборочная дисперсия - смещенная оценка генеральной дисперсии с отрицательным смещением -

(3.18)

Вследствие смещённости выборочной дисперсии возникает задача создания несмещённой оценки дисперсии. Так как , то смещение можно устранить, умножив на множитель : (3.19)

является несмещённой оценкой . Действительно,

В заключение заметим, что не является робастной оценкой .

 

7. Метод максимального правдоподобия.

 

Метод максимального правдоподобия, созданный Фишером (Р. Фишер -англ. математик, 1890-1962), является достаточно универсальным и плодотвор­ным методом оценивания.

Пусть имеется выборка (x1,x2,…xn) из генеральной совокупности с плотно­стью вероятности f(x, , содержащей один неизвестный параметр . Выборка является n -мерной случайной величиной, компоненты xi которой взаимно независимы, одинаково распределены с плотностью f(x, . Тогда плотность распределения n-мерной случайной величины (x1,x2,…xn) будет равна

(3.23)

Эта функция называется функцией правдоподобия для рассматриваемой выбор­ки.

Будем считать переменной неслучайной величиной, а элементы (x1,x2,…xn) выборки фиксированными, так как выборка фактически осущест­влена. Если придавать различные значения, то естественно ожидать, что плотность примет максимальное значение в случае, когда окажется равным истинному его значению, так как при других значениях ме­нее вероятно за один раз получить именно данную выборку.

Эти интуитивные соображения приводят к тому, что за оценку берут та­кое значение , при котором функция правдоподобия достигает максимума. Технически (так как L состоит из произведений) удобнее искать max lnL (точка , дающая максимум lnL, дает и максимум L). Итак, для отыскания имеем уравнение

(3.24)

которое называется уравнением правдоподобия, а его решение , зависящее от элементов выборки, оценкой максимального правдоподобия.

При выполнении достаточно общих условий оценки максимального правдо­подобия являются состоятельными и асимптотически эффективными. В общем случае они являются смещенными [10]. В случае, когда генеральная плотность вероятности содер­жит k параметров, вместо одного уравнения правдоподобия решается система уравнений

(3.35) Пример. Рассмотрим показательный закон с плотностью

Функция правдоподобия при х > О имеет вид

Отсюда

Оценки максимального правдоподобия и метода моментов параметра по­казательного

Замечание. Выше рассмотрены два наиболее употребительных на прак­тике метода получения оценок параметров закона распределения - методы мо­ментов и максимума правдоподобия. Существуют и другие методы, освещен­ные в литературе. Назовем еще методы квантилей, минимума хи-квадрат, наи­меньших квадратов, наименьших абсолютных отклонений, минимакса [10,11].

 

 

8. Распределение средней арифметической для выборок из нормальной совокупности.

 

9. Распределение Стьюдента.

10. Распределение дисперсии в выборках из нормальной генеральной совокупности

11. Распределение Хи-квадрат Пирсона.

12. Понятие доверительного интервала

 

Сложной.

Как правило, гипотезы о генеральном распределении - сложные.

 

примеры наиболее важных в практическом отношении гипотез.

1.Гипотеза о равенстве математических ожиданий двух генеральных сово­купностей.

Она возникает, когда нужно проверить, одинаковы ли средние значения ос­новных

параметров изделий, производимых двумя станками, участками, цеха­ми.

2.Гипотеза о равенстве дисперсий нескольких генеральных совокупностей.

Например, следует сравнить точность двух измерительных приборов, раз­брос значений

контролируемого параметра при массовом производстве продук­та на двух участках.

3.Гипотеза о законе распределения генеральной совокупности.

Эта гипотеза может возникнуть на основе теоретических соображений, имеющегося опыта

исследований, на основе изучения гистограммы выборки.

4.Гипотеза об однородности выборки, об отсутствии в ней выбросов.

 

Для проверки любой статистической гипотезы выбирается какой-либо кри­терий, называемый

критерием значимости.

Определение 4.3. Критерием значимости называется правило про­верки статистической

гипотезы.

Выдвинутую гипотезу проверяют на основе имеющийся выборки. Для этого конструируется

функция выборочных элементов, называемая статистикой, по величине которой судят о

справедливости гипотезы.

Определение 4.4. Статистикой критерия значимости называ­ется статистика, по

Ошибки первого и второго рода.

Суждения о принятии или отвержении выдвинутой статистической гипотезы не являются

абсолютными, а носят лишь вероятностный характер, т. е. являют­ся правдоподобными.

Принимая или отвергая гипотезу, мы можем совершить ошибку.

Определение 2.5. Ошибкой первого рода называется ошибка отвер­жения правильной

гипотезы. Ошибкой второго рода называется ошиб­ка принятия неверной гипотезы.

Вероятность ошибки первого рода равна уровню значимости, т. е. :

(4.3)

Эта формула означает, что гипотеза отвергается с вероятностью , хотя эта гипотеза верна.

Вероятность ошибки второго рода обозначается :

(4.4)

Формула (4.4) означает, что принимается гипотеза , с вероятностью , хотя верна

альтернативная гипотеза . При той схеме проверки гипотез, которая сформулирована выше, вероятность задается. Вероятность же приходится находить. Это удается в редких слу­чаях,

так как для этого нужно знать распределение статистики Z для случая альтернативной гипотезы

. Принципы назначения уровня значимости при проверке статистической гипотезы

согласуются с опасностью совершения ошибок первого и второго ро­да. Эти принципы вообще

находятся вне статистики. Они выдвигаются практи­кой.

Для того, чтобы проверяемая гипотеза была достаточно обоснованно от­вергнута, уровень

значимости выбирают достаточно малым; в практике: 0.01; 0.001. Напротив, если делается

вывод о принятии гипотезы, то уровень значи­мости не должен быть очень малым, ибо в этом

случае расширяется область допустимых значений V\Vk, и даже при неверной гипотезе

статистика Z кри­терия может попасть в эту область за счет случайных колебаний. Будет

совер­шена ошибка второго рода. Уровень значимости в этом случае можно взять равным

0.05; 0.10. Чем меньше уровень значимости, тем меньше вероятность забраковать верную

гипотезу, т. е. совершить ошибку первого рода, но при этом увеличивается вероятность

принятия неверной гипотезы, т. е. совершения ошибки второго рода.

 

Выбор является случайным.

Каждый элемент генеральной совокупности может быть выбран.

Последнее изменение этой страницы: 2016-08-11

lectmania.ru. Все права принадлежат авторам данных материалов. В случае нарушения авторского права напишите нам сюда...