Категории: ДомЗдоровьеЗоологияИнформатикаИскусствоИскусствоКомпьютерыКулинарияМаркетингМатематикаМедицинаМенеджментОбразованиеПедагогикаПитомцыПрограммированиеПроизводствоПромышленностьПсихологияРазноеРелигияСоциологияСпортСтатистикаТранспортФизикаФилософияФинансыХимияХоббиЭкологияЭкономикаЭлектроника |
Каждый элемент генеральной совокупности может быть выбран.Выбор является случайным. Каждый элемент генеральной совокупности может быть выбран. Каждый элемент выбирается независимо от остальных. Все элементы выборки получаются в равных условиях. Виды реальных выборов. 1. Механический выбор. В этом случае элементы генеральной совокупности выбираются по какой-либо закономерности. Например, измерения производятся через равные промежутки времени, контролируется каждая десятая деталь, сходящая с конвейера, каждый пятый человек по списку. Применяется для автоматизированного контроля. 2.Серийный выбор. Элементы в этом случае выбираются не по одному, а сериями. Например, контролю подвергается не одна таблетка лекарства, а упаковка, не один человек из какой-либо группы, а вся группа. Диктуется условиями производства и обследования. 3.Типический выбор. В этом случае генеральная совокупность делится на непересекающиеся части. Из каждой части выбираются элементы в количестве, пропорциональном объему части. Так можно получить сведения о средней зарплате в отрасли, об урожайности поля, о политических предпочтениях людей. Характерен для экономических и социологических исследований. 4.Субъективный выбор - на основе какого-либо субъективного принципа. Например, обследуются не все партии продукции, а лишь одна, наиболее подозрительная на содержание брака, ведется опрос по телефону, а не всех слоев населения. Он экономит время, средства, но может привести к большим ошибкам. 5. Выбор с помощью случайных независимых измерений (температура среды, величина тока, загрязненность реки). Характерен для инженерных и естественнонаучных исследований. Все типы выборов могут комбинироваться между собой. Существуют и другие типы выборов. В математической статистике рассматривается только простой случайный выбор. Отметим одно его важное свойство - случайность (рандомизированность). Случайный выбор - объективен, гарантирует от пропуска скрытых закономерностей в генеральной совокупности, поэтому реальный выбор следует организовывать так, чтобы свойство случайности присутствовало. В механическом и субъективном выборах случайность отсутствует, поэтому они менее надежны. Обратимся снова к анализу выборки. Повторяя выборку (x1,x2,…,xn) несколько раз, мы будем в общем случае получать каждый раз новые элементы, поэтому элементы выборки рассматриваются как случайные величины. Так как они принимают значения из одной и той же генеральной совокупности, то распределены одинаково - так же, как случайная величина X, образующая рассматриваемую генеральную совокупность x1,x2,…,xn - это n копий случайной величины X. Далее, так как каждый элемент выборки получен независимо от остальных, то все элементы выборки рассматриваются как взаимно независимые случайные величины. Итак, с теоретической точки зрения выборка (x1,x2,…,xn) - это n-мерная случайная величина, все компоненты которой - взаимно независимые одинаково распределенные случайные величины. Их закон распределения - такой же, как у изучаемой случайной величины X. Такую теоретическую выборку следует отличать от ее реализации, т. е. набора n чисел, полученных в конкретном выборе (в конкретных измерениях). Чтобы подчеркнуть это различие, теоретическую выборку, т. е. n-мерную случайную величину, иногда обозначают символом (Х1, Х2,..., Хn), составленным из больших букв, а ее реализацию – символом (x1,x2,…,xn ), составленным из малых букв. В дальнейшем с целью упрощения записей и теоретическую выборку, и ее реализацию будем обозначать одним и тем же символом (x1,x2,…,xn), так как из текста обычно ясно, о чем идет речь. Обсудим еще последнее свойство простого случайного выбора - о том, что все элементы выборки получаются в равных условиях. Это свойство можно выразить, введя случайную величину X* , принимающую выборочные значения x1,x2,…,xn с одной и той же вероятностью 1/n. Дискретное равномерное распределение с законом, заданным формулой Р(Х*=xk) = 1/n, k= 1,2,...,n, (2.1) называется выборочным распределением, а его числовые характеристики - выборочными числовыми характеристиками (иначе - числовыми характеристиками выборки). К выборкам, как и к выбору, предъявляется ряд требований. Важнейшим из них является требование репрезентативности (представительности). Это требование означает, что выборка должна хорошо представлять всю генеральную совокупность. Простой случайный выбор тоже репрезентативен, так как теоретически любой элемент генеральной совокупности может попасть в выборку, но менее надежен, чем типический, так как в силу независимости и случайности выбора элементов возможна их концентрация и, следовательно, недостаточно представительный охват генеральной совокупности. Другим требованием является требование однородности выборки. Это означает, что условия проведения экспериментов для получения выборки не должны меняться. Выборка должна быть получена из одной генеральной совокупности, а не из нескольких. В ней должны отсутствовать выбросы. Неоднородная выборка не может дать правильного прогноза. Различают малые и большие выборки, так как они отличаются методами обработки. Для обработки большой выборки привлекаются асимптотические методы, основанные на центральной предельной теореме. В статистической практике принято считать выборку с объемом п > 30 большой. Для изучения двумерной случайной величины (Х,У) создается двумерная выборка, представляющая таблицу пар чисел (xi, yi) (i = 1,2,...,n). Существуют выборки любой размерности. Основные понятия, используемые при оценивании. Оценивание — определение приближенного значения неизвестной характеристики или параметра распределения (генеральной совокупности), по результатам наблюдений(определение приближенного значения неизвестного параметра генеральной совокупности по результатам наблюдений). При этом параметром генеральной совокупности может быть либо число, либо набор чисел (вектор), либо функция, либо множество или иной объект нечисловой природы. Оценивание проводят с помощью оценок — статистик, являющихся основой для оценивания неизвестного параметра распределения. Оценивание бывает двух видов — точечное оценивание и оценивание с помощью доверительной области. Точечное оценивание — способ оценивания, заключающийся в том, что значение оценки принимается как неизвестное значение параметра распределения. Пример. Пусть результаты наблюдений x1,x2,...,xn рассматривают в вероятностной модели как случайную выборку из нормального распределения N(m,σ). Т. е. считают, что результаты наблюдений моделируются как реализации n независимых одинаково распределенных случайных величин, имеющих функцию нормального распределения N(m,σ) с некоторыми математическим ожиданием m и средним квадратическим отклонением
Для оценивания математического ожидания m могут использоваться и другие статистики, например, выборочная медиана
и др. Для оценивания дисперсии σ2
где коэффициенты a(n) берут из специальных таблиц. Эти коэффициенты подобраны так, чтобы для выборок из нормального распределения
Наличие нескольких методов оценивания одних и тех же параметров приводит к необходимости выбора между этими методами. Понятие точечной статистической оценки. Требования к оценкам Определение 3.1. Точечной статистической оценкой неизвестной числовой характеристики или параметра Для каждой конкретной выборки - это число, т. е. точка на числовой оси. Определение 3.2. Статистикой называется любая функция выборочных элементов (наблюдений). статистическая точечная оценка - это статистика, по значениям которой можно судить о величине В силу многообразия оценок, применяемых для оценивания одной и той же неизвестной величины, возникает задача выбора из них лучшей в определенном смысле. все статистические оценки являются случайными, так как случайными являются элементы выборки. Определение 3.3. Оценка Это означает, что для любого
Это требование означает сближение Пример 3.1. Из предельной теоремы Бернулли теории вероятностей следует, что относительная частота Р*(А) события А является состоятельной оценкой вероятности Р(А) этого события: Определение 3.4. Оценка Свойства выборочной дисперсии Свойство 1. Выборочная дисперсия является состоятельной оценкой генеральной дисперсии:
Свойство 2. Вспомогательная формула для выборочной дисперсии
Свойство 3. Выборочная дисперсия
Вследствие смещённости выборочной дисперсии возникает задача создания несмещённой оценки дисперсии. Так как
В заключение заметим, что
7. Метод максимального правдоподобия.
Метод максимального правдоподобия, созданный Фишером (Р. Фишер -англ. математик, 1890-1962), является достаточно универсальным и плодотворным методом оценивания. Пусть имеется выборка (x1,x2,…xn) из генеральной совокупности с плотностью вероятности f(x,
Эта функция называется функцией правдоподобия для рассматриваемой выборки. Будем считать Эти интуитивные соображения приводят к тому, что за оценку
которое называется уравнением правдоподобия, а его решение При выполнении достаточно общих условий оценки максимального правдоподобия являются состоятельными и асимптотически эффективными. В общем случае они являются смещенными [10]. В случае, когда генеральная плотность вероятности
Функция правдоподобия при х > О имеет вид
Отсюда Оценки максимального правдоподобия и метода моментов параметра показательного Замечание. Выше рассмотрены два наиболее употребительных на практике метода получения оценок параметров закона распределения - методы моментов и максимума правдоподобия. Существуют и другие методы, освещенные в литературе. Назовем еще методы квантилей, минимума хи-квадрат, наименьших квадратов, наименьших абсолютных отклонений, минимакса [10,11].
8. Распределение средней арифметической для выборок из нормальной совокупности.
9. Распределение Стьюдента. 10. Распределение дисперсии в выборках из нормальной генеральной совокупности 11. Распределение Хи-квадрат Пирсона. 12. Понятие доверительного интервала
Сложной. Как правило, гипотезы о генеральном распределении - сложные.
примеры наиболее важных в практическом отношении гипотез. 1.Гипотеза о равенстве математических ожиданий двух генеральных совокупностей. Она возникает, когда нужно проверить, одинаковы ли средние значения основных параметров изделий, производимых двумя станками, участками, цехами. 2.Гипотеза о равенстве дисперсий нескольких генеральных совокупностей. Например, следует сравнить точность двух измерительных приборов, разброс значений контролируемого параметра при массовом производстве продукта на двух участках. 3.Гипотеза о законе распределения генеральной совокупности. Эта гипотеза может возникнуть на основе теоретических соображений, имеющегося опыта исследований, на основе изучения гистограммы выборки. 4.Гипотеза об однородности выборки, об отсутствии в ней выбросов.
Для проверки любой статистической гипотезы выбирается какой-либо критерий, называемый критерием значимости. Определение 4.3. Критерием значимости называется правило проверки статистической гипотезы. Выдвинутую гипотезу проверяют на основе имеющийся выборки. Для этого конструируется функция выборочных элементов, называемая статистикой, по величине которой судят о справедливости гипотезы. Определение 4.4. Статистикой критерия значимости называется статистика, по Ошибки первого и второго рода. Суждения о принятии или отвержении выдвинутой статистической гипотезы не являются абсолютными, а носят лишь вероятностный характер, т. е. являются правдоподобными. Принимая или отвергая гипотезу, мы можем совершить ошибку. Определение 2.5. Ошибкой первого рода называется ошибка отвержения правильной гипотезы. Ошибкой второго рода называется ошибка принятия неверной гипотезы. Вероятность ошибки первого рода равна уровню значимости, т. е.
Эта формула означает, что гипотеза Вероятность ошибки второго рода обозначается
Формула (4.4) означает, что принимается гипотеза альтернативная гипотеза так как для этого нужно знать распределение статистики Z для случая альтернативной гипотезы
согласуются с опасностью совершения ошибок первого и второго рода. Эти принципы вообще находятся вне статистики. Они выдвигаются практикой. Для того, чтобы проверяемая гипотеза была достаточно обоснованно отвергнута, уровень значимости выбирают достаточно малым; в практике: 0.01; 0.001. Напротив, если делается вывод о принятии гипотезы, то уровень значимости не должен быть очень малым, ибо в этом случае расширяется область допустимых значений V\Vk, и даже при неверной гипотезе статистика Z критерия может попасть в эту область за счет случайных колебаний. Будет совершена ошибка второго рода. Уровень значимости в этом случае можно взять равным 0.05; 0.10. Чем меньше уровень значимости, тем меньше вероятность забраковать верную гипотезу, т. е. совершить ошибку первого рода, но при этом увеличивается вероятность принятия неверной гипотезы, т. е. совершения ошибки второго рода.
Выбор является случайным. Каждый элемент генеральной совокупности может быть выбран. |
|
|
Последнее изменение этой страницы: 2016-08-11 lectmania.ru. Все права принадлежат авторам данных материалов. В случае нарушения авторского права напишите нам сюда... |