Категории:

Дом Здоровье Зоология Информатика Искусство Искусство Компьютеры Кулинария Маркетинг Математика Медицина Менеджмент Образование Педагогика Питомцы Программирование Производство Промышленность Психология Разное Религия Социология Спорт Статистика Транспорт Физика Философия Финансы Химия Хобби Экология Экономика Электроника

Каждый элемент генеральной совокупности может быть выбран.

Выбор является случайным.

Каждый элемент генеральной совокупности может быть выбран.

Каждый элемент выбирается независимо от остальных.

Все элементы выборки получаются в равных условиях.

Виды реальных выборов.

1. Механический выбор. В этом случае элементы генеральной совокупности выбираются по какой-либо закономерности. Например, измерения производятся через равные промежутки времени, контролируется каждая десятая деталь, сходящая с конвейера, каждый пятый человек по списку. Применяется для автоматизированного контроля.

2.Серийный выбор. Элементы в этом случае выбираются не по одному, а сериями. Например, контролю подвергается не одна таблетка лекарства, а упаковка, не один человек из какой-либо группы, а вся группа. Диктуется условиями производства и обследования.

3.Типический выбор. В этом случае генеральная совокупность делится на непересекающиеся части. Из каждой части выбираются элементы в количестве, пропорциональном объему части. Так можно получить сведения о средней зарплате в отрасли, об урожайности поля, о политических предпочтениях людей. Характерен для экономических и социологических исследований.

4.Субъективный выбор - на основе какого-либо субъективного принципа. Например, обследуются не все партии продукции, а лишь одна, наиболее подозрительная на содержание брака, ведется опрос по телефону, а не всех слоев населения. Он экономит время, средства, но может привести к большим ошибкам.

5. Выбор с помощью случайных независимых измерений (температура среды, величина тока, загрязненность реки). Характерен для инженерных и естественнонаучных исследований.

Все типы выборов могут комбинироваться между собой. Существуют и другие типы выборов. В математической статистике рассматривается только простой случайный выбор. Отметим одно его важное свойство - случайность (рандомизированность). Случайный выбор - объективен, гарантирует от пропуска скрытых закономерностей в генеральной совокупности, поэтому реальный выбор следует организовывать так, чтобы свойство случайности присутствовало. В механическом и субъективном выборах случайность отсутствует, поэтому они менее надежны.

Обратимся снова к анализу выборки. Повторяя выборку (x₁,x₂,…,x_n) несколько раз, мы будем в общем случае получать каждый раз новые элементы, поэтому элементы выборки рассматриваются как случайные величины. Так как они принимают значения из одной и той же генеральной совокупности, то распределены одинаково - так же, как случайная величина X, образующая рассматриваемую генеральную совокупность x₁,x₂,…,x_n - это n копий случайной величины X. Далее, так как каждый элемент выборки получен независимо от остальных, то все элементы выборки рассматриваются как взаимно независимые случайные величины.

Итак, с теоретической точки зрения выборка (x₁,x₂,…,x_n) - это n-мерная случайная величина, все компоненты которой - взаимно независимые одинаково распределенные случайные величины. Их закон распределения - такой же, как у изучаемой случайной величины X. Такую теоретическую выборку следует отличать от ее реализации, т. е. набора n чисел, полученных в конкретном выборе (в конкретных измерениях). Чтобы подчеркнуть это различие, теоретическую выборку, т. е. n-мерную случайную величину, иногда обозначают символом (Х₁, Х₂,..., Х_n), составленным из больших букв, а ее реализацию – символом (x₁,x₂,…,x_n ), составленным из малых букв. В дальнейшем с целью упрощения записей и теоретическую выборку, и ее реализацию будем обозначать одним и тем же символом (x₁,x₂,…,x_n), так как из текста обычно ясно, о чем идет речь. Обсудим еще последнее свойство простого случайного выбора - о том, что все элементы выборки получаются в равных условиях. Это свойство можно выразить, введя случайную величину X* , принимающую выборочные значения x₁,x₂,…,x_n с одной и той же вероятностью 1/n. Дискретное равномерное распределение с законом, заданным формулой

Р(Х*=x_k) = 1/n, k= 1,2,...,n, (2.1)

называется выборочным распределением, а его числовые характеристики - выборочными числовыми характеристиками (иначе - числовыми характеристиками выборки).

К выборкам, как и к выбору, предъявляется ряд требований. Важнейшим из них является требование репрезентативности (представительности). Это требование означает, что выборка должна хорошо представлять всю генеральную совокупность. Простой случайный выбор тоже репрезентативен, так как теоретически любой элемент генеральной совокупности может попасть в выборку, но менее надежен, чем типический, так как в силу независимости и случайности выбора элементов возможна их концентрация и, следовательно, недостаточно представительный охват генеральной совокупности.

Другим требованием является требование однородности выборки. Это означает, что условия проведения экспериментов для получения выборки не должны меняться. Выборка должна быть получена из одной генеральной совокупности, а не из нескольких. В ней должны отсутствовать выбросы. Неоднородная выборка не может дать правильного прогноза. Различают малые и большие выборки, так как они отличаются методами обработки. Для обработки большой выборки привлекаются асимптотические методы, основанные на центральной предельной теореме. В статистической практике принято считать выборку с объемом п > 30 большой. Для изучения двумерной случайной величины (Х,У) создается двумерная выборка, представляющая таблицу пар чисел (x_i, y_i) (i = 1,2,...,n).

Существуют выборки любой размерности.

Основные понятия, используемые при оценивании.

Оценивание — определение приближенного значения неизвестной характеристики или параметра распределения (генеральной совокупности), по результатам наблюдений(определение приближенного значения неизвестного параметра генеральной совокупности по результатам наблюдений). При этом параметром генеральной совокупности может быть либо число, либо набор чисел (вектор), либо функция, либо множество или иной объект нечисловой природы.

Оценивание проводят с помощью оценок — статистик, являющихся основой для оценивания неизвестного параметра распределения.

Оценивание бывает двух видов — точечное оценивание и оценивание с помощью доверительной области. Точечное оценивание — способ оценивания, заключающийся в том, что значение оценки принимается как неизвестное значение параметра распределения.

Пример. Пусть результаты наблюдений x₁,x₂,...,x_n рассматривают в вероятностной модели как случайную выборку из нормального распределения N(m,σ). Т. е. считают, что результаты наблюдений моделируются как реализации n независимых одинаково распределенных случайных величин, имеющих функцию нормального распределения N(m,σ) с некоторыми математическим ожиданием m и средним квадратическим отклонением , неизвестными статистику. Требуется оценить параметры m и σ (или σ²) по результатам наблюдений. Оценки обозначим m * и ( ) * соответственно. Обычно в качестве оценки m * математического ожидания m используют выборочное среднее арифметическое , а в качестве оценки (σ²) * дисперсии σ² используют выборочную дисперсию s², то есть

Для оценивания математического ожидания m могут использоваться и другие статистики, например, выборочная медиана , полусумма минимального и максимального членов вариационного ряда

и др. Для оценивания дисперсии σ² также имеется ряд оценок, в частности, (см. выше) и оценка, основанная на размахе R, имеющая вид

где коэффициенты a(n) берут из специальных таблиц. Эти коэффициенты подобраны так, чтобы для выборок из нормального распределения

Наличие нескольких методов оценивания одних и тех же параметров приводит к необходимости выбора между этими методами.

Понятие точечной статистической оценки. Требования к оценкам

Определение 3.1. Точечной статистической оценкой неизвестной числовой характеристики или параметра распределения называется функция , зависящая от элементов выборки, приближенно равная :

(3.1)

Для каждой конкретной выборки - это число, т. е. точка на числовой оси.

Определение 3.2. Статистикой называется любая функция выборочных элементов (наблюдений).

статистическая точечная оценка - это статистика, по значениям которой можно судить о величине . Для одной и той же неизвестной величины можно составить бесконечно много различных оценок. Например, в качестве оценки математического ожидания m нормального распределения могут служить выборочное среднее , выборочная медиана med, полусумма квартилей t_q, полусумма крайних элементов t_R.

В силу многообразия оценок, применяемых для оценивания одной и той же неизвестной величины, возникает задача выбора из них лучшей в определенном смысле. все статистические оценки являются случайными, так как случайными являются элементы выборки.

Определение 3.3. Оценка называется состоятельной оценкой , если она стремится по вероятности к сростом n: (3.2)

Это означает, что для любого > 0 выполняется соотношение

(3.3)

Это требование означает сближение и с ростом n в вероятностном смысле. В математической статистике, как правило, применяются только состоятельные оценки.

Пример 3.1. Из предельной теоремы Бернулли теории вероятностей следует, что относительная частота Р*(А) события А является состоятельной оценкой вероятности Р(А) этого события:

Определение 3.4. Оценка называется несмещенной оценкой , если математическое ожидание оценки равно : М = . (3.4)

Свойства выборочной дисперсии

Свойство 1. Выборочная дисперсия является состоятельной оценкой генеральной дисперсии:

Свойство 2. Вспомогательная формула для выборочной дисперсии

(3.17)

Свойство 3. Выборочная дисперсия - смещенная оценка генеральной дисперсии с отрицательным смещением -

(3.18)

Вследствие смещённости выборочной дисперсии возникает задача создания несмещённой оценки дисперсии. Так как , то смещение можно устранить, умножив на множитель : (3.19)

является несмещённой оценкой . Действительно,

В заключение заметим, что не является робастной оценкой .

7. Метод максимального правдоподобия.

Метод максимального правдоподобия, созданный Фишером (Р. Фишер -англ. математик, 1890-1962), является достаточно универсальным и плодотворным методом оценивания.

Пусть имеется выборка (x₁,x₂,…x_n) из генеральной совокупности с плотностью вероятности f(x, , содержащей один неизвестный параметр . Выборка является n -мерной случайной величиной, компоненты x_i которой взаимно независимы, одинаково распределены с плотностью f(x, . Тогда плотность распределения n-мерной случайной величины (x₁,x₂,…x_n) будет равна

(3.23)

Эта функция называется функцией правдоподобия для рассматриваемой выборки.

Будем считать переменной неслучайной величиной, а элементы (x₁,x₂,…x_n) выборки фиксированными, так как выборка фактически осуществлена. Если придавать различные значения, то естественно ожидать, что плотность примет максимальное значение в случае, когда окажется равным истинному его значению, так как при других значениях менее вероятно за один раз получить именно данную выборку.

Эти интуитивные соображения приводят к тому, что за оценку берут такое значение , при котором функция правдоподобия достигает максимума. Технически (так как L состоит из произведений) удобнее искать max lnL (точка , дающая максимум lnL, дает и максимум L). Итак, для отыскания имеем уравнение

(3.24)

которое называется уравнением правдоподобия, а его решение , зависящее от элементов выборки, оценкой максимального правдоподобия.

При выполнении достаточно общих условий оценки максимального правдоподобия являются состоятельными и асимптотически эффективными. В общем случае они являются смещенными [10]. В случае, когда генеральная плотность вероятности содержит k параметров, вместо одного уравнения правдоподобия решается система уравнений

(3.35) Пример. Рассмотрим показательный закон с плотностью

Функция правдоподобия при х > О имеет вид

Отсюда

Оценки максимального правдоподобия и метода моментов параметра показательного

Замечание. Выше рассмотрены два наиболее употребительных на практике метода получения оценок параметров закона распределения - методы моментов и максимума правдоподобия. Существуют и другие методы, освещенные в литературе. Назовем еще методы квантилей, минимума хи-квадрат, наименьших квадратов, наименьших абсолютных отклонений, минимакса [10,11].

8. Распределение средней арифметической для выборок из нормальной совокупности.

9. Распределение Стьюдента.

10. Распределение дисперсии в выборках из нормальной генеральной совокупности

11. Распределение Хи-квадрат Пирсона.

12. Понятие доверительного интервала

Сложной.

Как правило, гипотезы о генеральном распределении - сложные.

примеры наиболее важных в практическом отношении гипотез.

1.Гипотеза о равенстве математических ожиданий двух генеральных совокупностей.

Она возникает, когда нужно проверить, одинаковы ли средние значения основных

параметров изделий, производимых двумя станками, участками, цехами.

2.Гипотеза о равенстве дисперсий нескольких генеральных совокупностей.

Например, следует сравнить точность двух измерительных приборов, разброс значений

контролируемого параметра при массовом производстве продукта на двух участках.

3.Гипотеза о законе распределения генеральной совокупности.

Эта гипотеза может возникнуть на основе теоретических соображений, имеющегося опыта

исследований, на основе изучения гистограммы выборки.

4.Гипотеза об однородности выборки, об отсутствии в ней выбросов.

Для проверки любой статистической гипотезы выбирается какой-либо критерий, называемый

критерием значимости.

Определение 4.3. Критерием значимости называется правило проверки статистической

гипотезы.

Выдвинутую гипотезу проверяют на основе имеющийся выборки. Для этого конструируется

функция выборочных элементов, называемая статистикой, по величине которой судят о

справедливости гипотезы.

Определение 4.4. Статистикой критерия значимости называется статистика, по

Ошибки первого и второго рода.

Суждения о принятии или отвержении выдвинутой статистической гипотезы не являются

абсолютными, а носят лишь вероятностный характер, т. е. являются правдоподобными.

Принимая или отвергая гипотезу, мы можем совершить ошибку.

Определение 2.5. Ошибкой первого рода называется ошибка отвержения правильной

гипотезы. Ошибкой второго рода называется ошибка принятия неверной гипотезы.

Вероятность ошибки первого рода равна уровню значимости, т. е. :

(4.3)

Эта формула означает, что гипотеза отвергается с вероятностью , хотя эта гипотеза верна.

Вероятность ошибки второго рода обозначается :

(4.4)

Формула (4.4) означает, что принимается гипотеза , с вероятностью , хотя верна

альтернативная гипотеза . При той схеме проверки гипотез, которая сформулирована выше, вероятность задается. Вероятность же приходится находить. Это удается в редких случаях,

так как для этого нужно знать распределение статистики Z для случая альтернативной гипотезы

. Принципы назначения уровня значимости при проверке статистической гипотезы

согласуются с опасностью совершения ошибок первого и второго рода. Эти принципы вообще

находятся вне статистики. Они выдвигаются практикой.

Для того, чтобы проверяемая гипотеза была достаточно обоснованно отвергнута, уровень

значимости выбирают достаточно малым; в практике: 0.01; 0.001. Напротив, если делается

вывод о принятии гипотезы, то уровень значимости не должен быть очень малым, ибо в этом

случае расширяется область допустимых значений V\V_k, и даже при неверной гипотезе

статистика Z критерия может попасть в эту область за счет случайных колебаний. Будет

совершена ошибка второго рода. Уровень значимости в этом случае можно взять равным

0.05; 0.10. Чем меньше уровень значимости, тем меньше вероятность забраковать верную

гипотезу, т. е. совершить ошибку первого рода, но при этом увеличивается вероятность

принятия неверной гипотезы, т. е. совершения ошибки второго рода.

Выбор является случайным.

Каждый элемент генеральной совокупности может быть выбран.

Предыдущая12 3 4 5 6 7 8 Следующая

Последнее изменение этой страницы: 2016-08-11

lectmania.ru. Все права принадлежат авторам данных материалов. В случае нарушения авторского права напишите нам сюда...