Главная Случайная страница


Категории:

ДомЗдоровьеЗоологияИнформатикаИскусствоИскусствоКомпьютерыКулинарияМаркетингМатематикаМедицинаМенеджментОбразованиеПедагогикаПитомцыПрограммированиеПроизводствоПромышленностьПсихологияРазноеРелигияСоциологияСпортСтатистикаТранспортФизикаФилософияФинансыХимияХоббиЭкологияЭкономикаЭлектроника






Выборочные числовые характеристики распределения

Кроме эмпирической функции распределения, для описания данных используют её числовые характеристики. Числовые характеристики случайной величины X* называются выборочными числовыми характеристиками.

Определение 2.10. Выборочной оценкой генеральной числовой характеристики называется её приближённое значение, найденное по выборке.

В качестве выборочных средних величин постоянно используют выборочное среднее арифметическое, т.е. сумму значений рассматриваемой величины, полученных по результатам испытания выборки, деленную на ее объем:

где n – объем выборки, xi – результат измерения (испытания) i-ого элемента выборки.

Другой вид выборочного среднего – выборочная медиана. Она определяется через порядковые статистики. Порядковые статистики – это члены вариационного ряда, который получается, если элементы выборки x1, x2,…, xn расположить в порядке неубывания:

В вариационном ряду элемент x(k) называется k-той порядковой статистикой. Выборочная медиана - результат наблюдения, занимающий центральное место в вариационном ряду, построенном по выборке с нечетным числом элементов, или полусумма двух результатов наблюдений, занимающих два центральных места в вариационном ряду, построенном по выборке с четным числом элементов. Таким образом, если объем выборки n – нечетное число, n = 2k+1, то медиана = x(k+1), если же n – четное число, n = 2k, то медиана = [x(k) + x(k+1)]/2, где x(k) и x(k+1) – порядковые статистики. В качестве выборочных показателей рассеивания результатов наблюдений чаще всего используют выборочную дисперсию, выборочное среднее квадратическое отклонение и размах выборки. выборочная дисперсия s2 – это сумма квадратов отклонений выборочных результатов наблюдений от их среднего арифметического, деленная на объем выборки:

Выборочное среднее квадратическое отклонение s – неотрицательный квадратный корень из дисперсии, т.е. В некоторых литературных источниках выборочной дисперсией называют другую величину:

Она отличается от s2 постоянным множителем:

Соответственно выборочным средним квадратическим отклонением в этих литературных источниках называют величину Тогда, очевидно,

Выбор , а не s2, объясняется тем, что

где Х – случайная величина, имеющая такое же распределение, как и результаты наблюдений. В терминах теории статистического оценивания это означает, что - несмещенная оценка дисперсии (см. ниже). В то же время статистика s2 не является несмещенной оценкой дисперсии результатов наблюдений, поскольку

Однако у s2 есть другое свойство, оправдывающее использование этой статистики в качестве выборочного показателя рассеивания. Для известных результатов наблюдений x1, x2,…, xn рассмотрим случайную величину У с распределением вероятностей

и Р(Y = х) = 0 для всех прочих х. Это распределение вероятностей называется эмпирическим. Тогда функция распределения Y – это эмпирическая функция распределения, построенная по результатам наблюдений x1, x2,…, xn. Вычислим математическое ожидание и дисперсию случайной величины Y:

Второе из этих равенств и является основанием для использования s2 в качестве выборочного показателя рассеивания.

Отметим, что математические ожидания выборочных средних квадратических отклонений М(s) и М(s0), вообще говоря, не равняются теоретическому среднему квадратическому отклонению σ. Например, если Х имеет нормальное распределение, объем выборки n = 3, то

Кроме перечисленных выше статистических характеристик, в качестве выборочного показателя рассеивания используют размах R –разность между наибольшим и наименьшим значениями в выборке: R = x(n) – x(1). В ряде вероятностно-статистических методов применяют и иные показатели рассеивания.

 

 

3. Группированный статистический ряд.

 

Группированный статистический ряд можно изобразить в виде таблицы, где в верхней строке указаны разряды, в нижней – соответствующие им частоты

Х:

   

 

Причём

Частота события вычисляется как отношение числа опытов, в которых значение случайной величины Х попало в i-й разряд , к общему числу n произведённых опытов.

Деля каждую частоту на длину соответствующего разряда получим таблицу плотностей частоты

Определение 2.11. Совокупность промежутков и соответствующих им частот называется группированным статистическим рядом.

При выборе k руководствуются соображениями, вытекающими из условий, что при слишком большой его величине картина распределения будет искажена случайными колебаниями частот, а при слишком малом будут сглажены и затушеваны характерные особенности распределения. На практике при пользуются полуэмпирической формулой

, (2.25)

или формулой Старджесса (2.26)

Длина промежутков определяется по формуле

.

Последнее изменение этой страницы: 2016-08-11

lectmania.ru. Все права принадлежат авторам данных материалов. В случае нарушения авторского права напишите нам сюда...