Категории: ДомЗдоровьеЗоологияИнформатикаИскусствоИскусствоКомпьютерыКулинарияМаркетингМатематикаМедицинаМенеджментОбразованиеПедагогикаПитомцыПрограммированиеПроизводствоПромышленностьПсихологияРазноеРелигияСоциологияСпортСтатистикаТранспортФизикаФилософияФинансыХимияХоббиЭкологияЭкономикаЭлектроника |
ТЕМА. Числовые характеристики дискретного статистического распределения: выборочное среднее, выборочная дисперсия, среднее квадратичное отклонение, мода, медианаМЕТОДИЧЕСКИЕ УКАЗАНИЯ ДЛЯ СТУДЕНТОВ по БИОСТАТИСТИКЕ Правило построения гистограмм: 1. Элементы выборки объемом n расположить в ранжированный ряд (по возрастанию или убыванию) 2. Вычислить размах (разность между минимальным и максимальным значением случайной величины) 3. Разбить вариационный ряд на k непересекающихся интервалов. k выбирают произвольно в пределах от 6 до 15 или вычисляют по формуле Стерднесса, предусматривающую выделение оптимального числа интервалов:
k=1+3.322lg(n) (округлить до целого)
4. Определить длину одного интервала 5. Определить границы каждого интервала 6. Определить частоты - количество ni элементов выборки, попавших в i-й интервал (элемент, совпадающий с правой границей интервала, относится к последующему интервалу) Наряду с частотами одновременно подсчитываются также накопленные частоты , относительные частоты и накопленные относительные частоты , i=1, 2, …, k. Полученные результаты сводятся в таблицу, называемую таблицей частот группированной выборки.
Для наглядного представления выборки используют гистограмму. Гистограммой частот группированной выборки называется функция, постоянная на интервалах группировки, обычно по оси ординат откладывают значения частот nj (или относительная частота или проценты)
Работа с преподавателем. Задача: Даны значения систолического артериального давления у 20 испытуемых. Представить выборку в виде таблицы частот и построить гистограмму.
110, 115, 130, 105, 110, 115, 115, 120, 120, 125, 125, 125, 110, 100, 105, 120, 120, 130, 135, 140
2) Для наглядного представления выборки используют гистограмму. Гистограммой частот группированной выборки называется функция, постоянная на интервалах группировки, обычно по оси ординат откладывают значения частот nj Строим гистограмму частот: В данном случае исследуемый признак – это систолическое артериальное давление, которое является случайной величиной X (x1, x2, x3 …..xi…… xn)
Этот график дает нам информацию о распределении случайной величины и носит название гистограммы распределения. Он показывает, насколько часто встречаются те или иные значения случайной величины. По оси ординат могут откладываться • Абсолютная частота встречаемости • Процент относительно общего объема выборки • Относительная частота встречаемости Огибающая гистограммы дает нам качественное представление о функции плотности распределения случайной величины (иногда просто говорят, распределение). Эта функция характеризует вероятность того, что случайная величина примет то или иное значение. Существует множество различных функций плотности распределения. Наиболее распространенным является нормальное распределение – оно имеет симметричный колоколообразный вид. Самостоятельная работа:Согласно своему варианту для случайной величины из таблицы данных построить гистограмму распределения. Описать полученные результаты.
Задание 1.Опишите гистограмму с указанием: · минимального и максимального значения анализируемой величины, · наиболее часто и редко встречающегося значения анализируемой величины (в процентах) · в каких пределах в основном лежит анализируемая величина (При описании приведите цифровые данные в процентах. · укажите сколько было всего обследованных. · дайте качественную оценку функции плотности распределения данной случайной величины (нормальное или отличное от нормального).
Дидактический блок Среднее значение ( )– характеристика положения значений случайной величины на оси измерений
Дисперсия (D) – характеристика разброса значений случайной величины относительно среднего значения
Среднеквадратичное отклонение (стандартное отклонение) – тоже, что и дисперсия, введена для того, чтобы избавиться от квадрата единицы измерения
Так как среднее значение, как правило, определяется по ограниченной выборке, а не по генеральной совокупности, то оно отличается от истинной (генеральной) средней, то есть имеет определенную ошибку, называемой ошибкой средней (стандартная ошибка)
Мода (Мо) – наиболее часто встречающееся значение случайной величины. Для того, чтобы определить моду все значения выборки выстраиваются в ранжированный ряд (по возрастанию или по убыванию). Может быть несколько значений моды. По ранжированному ряду находим и медиану (Ме) – это значение случайной величины, которое делит выборку на две равные части. Если число объектов выборки четное, то медиана равна среднему двух соседних значений. Нижний квартиль Q25 –это значение случайной величины, ниже которого находится 25% выборки. Верхний квартиль Q75 –это значение случайной величины, выше которого находится 25% выборки. Межквартильный (интерквартильный) размах – это разница Q75- Q25 50 % данных лежит в пределах от нижнего до верхнего квартилей. Для нахождения квартилей необходимо ранжировать данные. РАБОТА С ПРЕПОДАВАТЕЛЕМ
Самостоятельная работа:Согласно своему варианту для случайной величины из таблицы данных вычислить среднюю, дисперсию, стандартное отклонение, ошибку средней, моду, медиану, нижний и верхний квартиль, интерквартильный размах. Представить данные в графическом виде.
Работа с преподавателем СЛУЧАЙ 1. Выборки независимы. Наиболее распространенным параметрическим методом оценки различий между сравниваемыми средними значениями независимых выборок является критерий Стьюдента, или t-критерий. Нулевая гипотеза заключается в равенстве генеральных средних исовокупностей, из которых извлечены выборки, или, другими словами, проверяется нулевая гипотеза о принадлежности двух сравниваемых выборок одной и той же генеральной совокупности. Проверяемый t-критерий выражается в виде отношения:
где m1, m2 — стандартные ошибки средних значений сравниваемых выборок. Для проверки критерия знак разности средних значений не играет роли, поэтому в формуле для расчета тестовой статистики берется модуль разности. Однако знак разности важен для интерпретации результатов сравнения и заключения о преимуществе одного из сравниваемых методов. В дальнейшем при сравнении параметров в формулах для тестовых статистик мы будем опускать знак модуля. Гипотезу о равенстве средних отвергают, если фактически полученная величина t-критерия превзойдет или окажется равной табличному значению распределение Стьюдента, для принятого уровня значимости и числа степеней свободы f =.n1 + n2 – 2.При этом делается заключение о наличии статистически значимых различий между средними значениями на соответствующем уровне значимости. СЛУЧАЙ 2. Выборки зависимы. Для сравнения двух зависимых выборок или выборок с попарно связанными вариантами проверяют гипотезу о равенстве нулю среднего значения их попарных разностей. Такая задача возникает, когда имеются данные об изменении интересующего признака у каждого пациента. Например, если группа пациентов получала изучаемый метод лечения и у каждого пациента измерялось значение признака до и после лечения. В данном случае предстоит проверить нулевую гипотезу о равенстве нулю изменений этого признака в результате получения терапии. При подобных исследованиях все наблюдения можно представить в виде n-пар измерений (например, до и после) Для каждой пары вычисляется разность di, i=1, n Для полученного ряда вычисляется среднее и среднеквадратичное отклонение
Проверка гипотезы производится по таблицам распределения Стьюдента для выбранного уровня значимости и числа степеней свободы f= п — 1, в случае двустороннего теста без учета знака. Нулевая гипотеза отвергается для данного уровня значимости, если вычисленное значение превзойдет соответствующее табличное. Правильное применение t-критерия предполагает нормальное распределение совокупностей, из которых извлечены сравниваемые выборки. Если это условие не выполняется, то более эффективными будут непараметрические критерии. Работа с преподавателем. Случай 1. В группе здоровых людей и больных гепатитом было определено содержание белка в сыворотке крови (Таблица 1). Определить, достоверна ли разница в содержании белка у здоровых людей и больных гепатитом. Представить результаты в графическом виде. Таблица 1.
Решение: Определение достоверности различия Случай 2. В группе из 6 больных гипертонией изучалось влияние лекарственного препарата – адельфана, снижающего артериальное давление. В результате опыта получилось 2 вариационных ряда систолического давления: первый – до приема препарата, второй – после приема:
Таблица 1.
На какую величину снижается систолическое артериальное давление после приема адельфана? Достоверны ли полученные результаты? Представить результаты в графическом виде. Для наглядности представим данные в следующей таблице:
Таблица 2.
Самостоятельная работа: Проверить гипотезу о равенстве двух генеральных средних с использованием критерия Стъюдента. Сформулировать нулевую и альтернативную гипотезы. Сделать выводы на уровне значимости a=0,05. Представить данные в графическом виде.
Вариант 1. Скорость десневой экссудатации у детей (мл/сутки).
Вариант 2. Калий мочи (г/сутки).
Вариант 3. Содержание адренокортикотропного гормона (мл.ед).
Вариант 4. Свободный гепарин крови.
Вариант 5. Связанный холестерин крови (мг%).
Вариант 6. Скорость нестимулированного слюноотделения у детей (мл/мин).
Вариант 7. Норадреналин мочи (мкг/сутки) при грудной жабе.
Вариант 8. Микрошероховатость поверхности эмали после воздействия кислотой (Со ОЭДФ).
Вариант 9. Микрошероховатость поверхности эмали после воздействия ортофосфорной кислотой.
Вариант 10. Содержание трийодтиронина (мг/мл) при тиреотоксикозе.
Вариант 11. Вес юношей и девушек, кг
Вариант 12. Пульс юношей и девушек, уд\мин
Вариант 13. Влияние диеты на вес, кг
Вариант 14. Влияние пробежки на пульс, уд\мин
Вариант 15. Влияние операции на объем циркулирующей плазмы , мл\кг
СЛУЧАЙ 1. Выборки независимы. Используется U-критерий Манна—Уитнидля проверки гипотезы о принадлежности сравниваемых независимых выборок к одной и той же генеральной совокупности. • Объединим все значения обеих выборок в один ранжированный ряд • Каждому элементу этого ряда присвоим номер (ранг) • Если несколько элементов ряда совпадают по величине, то каждому присваивается ранг, равный среднему арифметическому их номеров • Для каждой выборки находятся суммы рангов R и рассчитываются статистики:
где i = 1 и 2 – номер выборки
• В качестве тестовой статистики выбирают минимальную величину U и сравнивают ее с табличным значением для принятого уровня значимости и объемов выборок n1, n2. • Гипотеза принимается, и различия считаются недостоверными, если рассчитанное значение больше соответствующего табличного
Работа с преподавателем Пример Проверим гипотезу о принадлежности сравниваемых независимых выборок к одной и той же генеральной совокупности с помощью непараметрического U-критерия.
Содержание вещества В в крови, моль\л
СЛУЧАЙ 2. Выборки зависимые В случае попарно связанных выборок применяется Т-критерий Уилкоксона. При этом: · Вычисляются попарные разницы значений до и после · Попарные разницы, кроме нулевых, без учета знака ранжируются в один ряд · Разницам, кроме нулевых, присваиваются ранги, при чем одинаковым по модулю величинам присваивают одинаковый ранг · Отдельно вычисляют сумму рангов положительных (Т+) и отрицательных разностей (Т—), · Меньшую из двух таких сумм без учета знака выбирают в качестве критерия • Нулевую гипотезу принимают на данном уровне значимости, если вычисленная статистика превзойдет табличное значение. Работа с преподавателем Стояла задача определить влияет ли препарат «Биоконт» на содержание белка в плазме крови. С этой целью препарат был испытан на десяти кроликах. Результаты эксперимента приведены в таблице.
Самостоятельная работа: Проверить гипотезу о принадлежности двух выборок одной генеральной совокупности с использованием непараметрических критериев. Сформулировать нулевую и альтернативную гипотезы. Сделать выводы на уровне значимости a=0,01.
Вариант 1. Скорость десневой экссудатации у детей (мл/сутки).
Вариант 2. Калий мочи (г/сутки).
Вариант 3. Содержание адренокортикотропного гормона (мл.ед).
Вариант 4. Свободный гепарин крови.
Вариант 5. Связанный холестерин крови (мг%).
Вариант 6. Скорость нестимулированного слюноотделения у детей (мл/мин).
Вариант 7. Норадреналин мочи (мкг/сутки) при грудной жабе.
Вариант 8. Микрошероховатость поверхности эмали после воздействия кислотой (Со ОЭДФ).
|