Главная Случайная страница


Категории:

ДомЗдоровьеЗоологияИнформатикаИскусствоИскусствоКомпьютерыКулинарияМаркетингМатематикаМедицинаМенеджментОбразованиеПедагогикаПитомцыПрограммированиеПроизводствоПромышленностьПсихологияРазноеРелигияСоциологияСпортСтатистикаТранспортФизикаФилософияФинансыХимияХоббиЭкологияЭкономикаЭлектроника






ТЕМА. Числовые характеристики дискретного статистического распределения: выборочное среднее, выборочная дисперсия, среднее квадратичное отклонение, мода, медиана

МЕТОДИЧЕСКИЕ УКАЗАНИЯ ДЛЯ СТУДЕНТОВ

по

БИОСТАТИСТИКЕ
ТЕМА: Анализ медико-биологических данных на основе их графического представления.

Правило построения гистограмм:

1. Элементы выборки объемом n расположить в ранжированный ряд (по возрастанию или убыванию)

2. Вычислить размах (разность между минимальным и максимальным значением случайной величины)

3. Разбить вариационный ряд на k непересекающихся интервалов. k выбирают произвольно в пределах от 6 до 15 или вычисляют по формуле Стерднесса, предусматривающую выделение оптимального числа интервалов:

 

k=1+3.322lg(n) (округлить до целого)

 

4. Определить длину одного интервала

5. Определить границы каждого интервала

6. Определить частоты - количество ni элементов выборки, попавших в i-й интервал (элемент, совпадающий с правой границей интервала, относится к последующему интервалу)

Наряду с частотами одновременно подсчитываются также накопленные частоты , относительные частоты и накопленные относительные частоты , i=1, 2, …, k.

Полученные результаты сводятся в таблицу, называемую таблицей частот группированной выборки.

 

Номер интервала, i Границы интервала Частота, nj Накопленная частота, Относительная частота Накопленная относительная частота ,

 

Для наглядного представления выборки используют гистограмму.

Гистограммой частот группированной выборки называется функция, постоянная на интервалах группировки, обычно по оси ординат откладывают значения частот nj (или относительная частота или проценты)

 

Работа с преподавателем.

Задача: Даны значения систолического артериального давления у 20 испытуемых. Представить выборку в виде таблицы частот и построить гистограмму.

 

110, 115, 130, 105, 110, 115, 115, 120, 120, 125, 125, 125, 110, 100, 105, 120, 120, 130, 135, 140

 

Номер интервала, i Границы интервала Частота, nj Накопленная частота, Относительная частота Накопленная относительная частота ,

 

2) Для наглядного представления выборки используют гистограмму.

Гистограммой частот группированной выборки называется функция, постоянная на интервалах группировки, обычно по оси ординат откладывают значения частот nj

Строим гистограмму частот:

В данном случае исследуемый признак – это систолическое артериальное давление, которое является случайной величиной X (x1, x2, x3 …..xi…… xn)

 

Этот график дает нам информацию о распределении случайной величины и носит название гистограммы распределения. Он показывает, насколько часто встречаются те или иные значения случайной величины.

По оси ординат могут откладываться

• Абсолютная частота встречаемости

• Процент относительно общего объема выборки

• Относительная частота встречаемости

Огибающая гистограммы дает нам качественное представление о функции плотности распределения случайной величины (иногда просто говорят, распределение). Эта функция характеризует вероятность того, что случайная величина примет то или иное значение. Существует множество различных функций плотности распределения. Наиболее распространенным является нормальное распределение – оно имеет симметричный колоколообразный вид.

Самостоятельная работа:Согласно своему варианту для случайной величины из таблицы данных построить гистограмму распределения. Описать полученные результаты.

 

ВАРИАНТ
Рост, см Рост, см Содержание Р в слюне, ммоль\л Содержание Р в слюне, ммоль\л Вес, кг Вес, кг Объем циркулирующей плазмы, мл\кг Объем циркулирующей плазмы, мл\кг Пульс, уд\мин Пульс, уд\мин Показатель гематокрита Показатель гематокрита Концентрация пролактина в крови (нг/мл) Содержание андростеронов в моче (мг/сутки) Концентрация пролактина в крови (нг/мл)
2,2 0,26 0,48 0,82
3,7 4,5 0,12 0,1 0,9
5,5 4,7 0,2 0,22 0,98
3,1 2,3 0,28 0,16 1,06
3,9 3,8 0,29 0,41 1,2
4,5 5,7 0,21 0,23 1,29
5,7 2,9 0,45 0,14 1,48
5,9 0,38 0,33 1,42
3,7 3,1 0,29 0,34 1,4
6,7 0,24 0,35 1,08
3,8 4,4 0,27 0,27 1,11
5,4 4,7 0,18 0,24 1,32
6,1 3,6 0,23 0,3 1,12
3,9 6,9 0,3 0,17 1,26
4,4 5,6 0,32 0,11 0,88
5,6 3,5 0,18 0,15 1,16
3,8 6,4 0,42 0,3 1,3
2,4 0,36 0,28 1,2
2,5 6,6 0,26 0,4 0,84
3,6 4,7 0,29 0,23 0,96

Задание 1.Опишите гистограмму с указанием:

· минимального и максимального значения анализируемой величины,

· наиболее часто и редко встречающегося значения анализируемой величины (в процентах)

· в каких пределах в основном лежит анализируемая величина (При описании приведите цифровые данные в процентах.

· укажите сколько было всего обследованных.

· дайте качественную оценку функции плотности распределения данной случайной величины (нормальное или отличное от нормального).

 




 

Дидактический блок

Среднее значение ( )– характеристика положения значений случайной величины на оси измерений

 

Дисперсия (D) – характеристика разброса значений случайной величины относительно среднего значения

 

Среднеквадратичное отклонение (стандартное отклонение) – тоже, что и дисперсия, введена для того, чтобы избавиться от квадрата единицы измерения

 

Так как среднее значение, как правило, определяется по ограниченной выборке, а не по генеральной совокупности, то оно отличается от истинной (генеральной) средней, то есть имеет определенную ошибку, называемой ошибкой средней (стандартная ошибка)

 
 

 

 


Мода (Мо) – наиболее часто встречающееся значение случайной величины. Для того, чтобы определить моду все значения выборки выстраиваются в ранжированный ряд (по возрастанию или по убыванию). Может быть несколько значений моды.

По ранжированному ряду находим и медиану (Ме) – это значение случайной величины, которое делит выборку на две равные части. Если число объектов выборки четное, то медиана равна среднему двух соседних значений.

Нижний квартиль Q25это значение случайной величины, ниже которого находится 25% выборки.

Верхний квартиль Q75это значение случайной величины, выше которого находится 25% выборки.

Межквартильный (интерквартильный) размах – это разница Q75- Q25

50 % данных лежит в пределах от нижнего до верхнего квартилей.

Для нахождения квартилей необходимо ранжировать данные.

РАБОТА С ПРЕПОДАВАТЕЛЕМ

Анализ роста мальчиков
n=11 х1 х2 х3 х4 х5 х6 х7 х8 х9 х10 х11
Рост мальч.  
                       
                       
                       
Dх                        
σх                        
mх                        
                         
Ранж. ряд                        
Мо                        
Ме                        
Q25                        
Q75                        
Q75- Q25                        

 

Анализ роста девочек
n=11 y1 y2 y3 y4 y5 y6 y7 y8 y9 y10 y11
Рост девоч.
                       
                       
                       
Dy                        
σy                        
my                        
                         
Ранж. ряд                        
Мо                        
Ме                        
Q25                        
Q75                        
Q75- Q25                        

 


Самостоятельная работа:Согласно своему варианту для случайной величины из таблицы данных вычислить среднюю, дисперсию, стандартное отклонение, ошибку средней, моду, медиану, нижний и верхний квартиль, интерквартильный размах. Представить данные в графическом виде.

 

ВАРИАНТ
Рост, см Рост, см Содержание Р в слюне, ммоль\л Содержание Р в слюне, ммоль\л Вес, кг Вес, кг Объем циркулирующей плазмы, мл\кг Объем циркулирующей плазмы, мл\кг Пульс, уд\мин Пульс, уд\мин Показатель гематокрита Показатель гематокрита Концентрация пролактина в крови (нг/мл) Содержание андростеронов в моче (мг/сутки) Концентрация пролактина в крови (нг/мл)
2,2 0,26 0,48 0,82
3,7 4,5 0,12 0,1 0,9
5,5 4,7 0,2 0,22 0,98
3,1 2,3 0,28 0,16 1,06
3,9 3,8 0,29 0,41 1,2
4,5 5,7 0,21 0,23 1,29
5,7 2,9 0,45 0,14 1,48
5,9 0,38 0,33 1,42
3,7 3,1 0,29 0,34 1,4
6,7 0,24 0,35 1,08
3,8 4,4 0,27 0,27 1,11
5,4 4,7 0,18 0,24 1,32
6,1 3,6 0,23 0,3 1,12
3,9 6,9 0,3 0,17 1,26
4,4 5,6 0,32 0,11 0,88
5,6 3,5 0,18 0,15 1,16
3,8 6,4 0,42 0,3 1,3
2,4 0,36 0,28 1,2
2,5 6,6 0,26 0,4 0,84
3,6 4,7 0,29 0,23 0,96

Работа с преподавателем

СЛУЧАЙ 1. Выборки независимы.

Наиболее распространенным параметрическим методом оценки различий между сравниваемыми средними значениями независимых выборок является критерий Стьюдента, или t-критерий. Нулевая гипотеза заключается в равенстве генеральных средних исовокупностей, из которых извлечены выборки, или, другими словами, проверяется нулевая гипотеза о принадлежности двух сравниваемых выборок одной и той же генеральной совокупности. Проверяемый t-критерий выражается в виде отношения:

 
 

 

где m1, m2 — стандартные ошибки средних значений сравниваемых выборок.

Для проверки критерия знак разности средних значений не играет роли, поэтому в формуле для расчета тестовой статистики берется модуль разности. Однако знак разности важен для интерпретации результатов сравнения и заключения о преимуществе одного из сравниваемых методов. В дальнейшем при сравнении параметров в формулах для тестовых статистик мы будем опускать знак модуля.

Гипотезу о равенстве средних отвергают, если фактически полученная величина t-критерия превзойдет или окажется равной табличному значению распределение Стьюдента, для принятого уровня значимости и числа степеней свободы f =.n1 + n2 – 2.При этом делается заключение о наличии статистически значимых различий между средними значениями на соответствующем уровне значимости.

СЛУЧАЙ 2. Выборки зависимы.

Для сравнения двух зависимых выборок или выборок с попарно связанными вариантами проверяют гипотезу о равенстве нулю среднего значения их попарных разностей. Такая задача возникает, когда имеются данные об изменении интересующего признака у каждого пациента. Например, если группа пациентов получала изучаемый метод лечения и у каждого пациента измерялось значение признака до и после лечения. В данном случае предстоит проверить нулевую гипотезу о равенстве нулю изменений этого признака в результате получения терапии.

При подобных исследованиях все наблюдения можно представить в виде n-пар измерений (например, до и после)

Для каждой пары вычисляется разность

di, i=1, n

Для полученного ряда вычисляется среднее и среднеквадратичное отклонение

 

 
 

Проверка гипотезы производится по таблицам распределения Стьюдента для выбранного уровня значимости и числа степеней свободы f= п — 1, в случае двустороннего теста без учета знака. Нулевая гипотеза отвергается для данного уровня значимости, если вычисленное значение превзойдет соответствующее табличное.

Правильное применение t-критерия предполагает нормальное распределение совокупностей, из которых извлечены сравниваемые выборки. Если это условие не выполняется, то более эффективными будут непараметрические критерии.

Работа с преподавателем.

Случай 1. В группе здоровых людей и больных гепатитом было определено содержание белка в сыворотке крови (Таблица 1). Определить, достоверна ли разница в содержании белка у здоровых людей и больных гепатитом. Представить результаты в графическом виде.

Таблица 1.

X1 (норма) 6,87 6,51 6,9 7,05  
X2 (гепатит) 7,2 6,92 7,52 7,18 7,25 7,1

 

Решение:

Определение достоверности различия
двух зависимых выборочных совокупностей.

Случай 2. В группе из 6 больных гипертонией изучалось влияние лекарственного препарата – адельфана, снижающего артериальное давление. В результате опыта получилось 2 вариационных ряда систолического давления: первый – до приема препарата, второй – после приема:

 

Таблица 1.

До приема
После приема

 

На какую величину снижается систолическое артериальное давление после приема адельфана? Достоверны ли полученные результаты? Представить результаты в графическом виде.

Для наглядности представим данные в следующей таблице:

 

Таблица 2.

xki (до приема) хoi (после приема) di (разница давлений)
 
 
 
 
 
 
Ср. знач.= Ср. знач.= Ср. знач.=

 

 

Самостоятельная работа:

Проверить гипотезу о равенстве двух генеральных средних с использованием критерия Стъюдента. Сформулировать нулевую и альтернативную гипотезы. Сделать выводы на уровне значимости a=0,05. Представить данные в графическом виде.

 

Вариант 1. Скорость десневой экссудатации у детей (мл/сутки).

 

Норма 0,73 0,75 0,8 0,82 0,81 0,86 0,85 0,79 0,82 0,78
Гингивит 1,32 1,8 1,7 1,4 1,5 1,49 1,52      

 

Вариант 2. Калий мочи (г/сутки).

 

Норма 2,1 1,9 1,8 2,2 2,2 1,8 2,1
легочная недостаточность 0,8 0,9 0,8 0,7 0,7 0,9 2,1

Вариант 3. Содержание адренокортикотропного гормона (мл.ед).

Норма 32,1 33,0 28,2 29,5 35,7 31,8 37,5 26,4  
Беременность 98,6 120,3 73,6 96,1 104,3 113,1 100,3 68,1 71,1

Вариант 4. Свободный гепарин крови.

Норма 5,7 5,9 6,3 6,6 5,0 3,7 4,0 4,5 5,7 5,6
Стоматит 13,9 13,5 12,0 10,3 13,0 15,7 14,7      

Вариант 5. Связанный холестерин крови (мг%).

 

Норма 58,9 53,1 64,1 59,3 69,0 62,0 53,3 61,1 58,3
Себоррея 105,3 83,7 122,2 110,6 101,1 96,8 114,5 113,0  

 

Вариант 6. Скорость нестимулированного слюноотделения у детей (мл/мин).

до операции 0,19 0,2 0,13 0,22 0,15 0,17  
после уранопластики 0,21 0,23 0,15 0,26 0,15 0,18 σd =0,014

 

Вариант 7. Норадреналин мочи (мкг/сутки) при грудной жабе.

до лечения 36,9 38,2 36,1 33,5 34,8 35,1 38,5 38,3  
после лечения 40,5 43,8 56,7 49,8 50,4 45,4 39,9 38,7 40,3 51,6 σd =7,45

 

Вариант 8. Микрошероховатость поверхности эмали после воздействия кислотой (Со ОЭДФ).

до воздействия 0,15 0,128 0,135 0,14 0,125 0,131  
после воздействия 0,192 0,175 0,165 0,15 0,11 0,125 σd =0,03

 

Вариант 9. Микрошероховатость поверхности эмали после воздействия ортофосфорной кислотой.

до воздействия 0,155 0,15 0,125 0,18 0,17 0,16 0,143  
после воздействия 0,808 0,803 0,584 0,19 0,87 0,15 0,745 σd =0,31

 

Вариант 10. Содержание трийодтиронина (мг/мл) при тиреотоксикозе.

до лечения 4,35 5,01 6,03 4,35 5,4 5,12 2,02 2,65 4,56 5,25  
после лечения 2,25 4,4 3,15 2,35 1,35 3,4 2,31 1,72 3,75 4,21 σd=1,31

 

Вариант 11. Вес юношей и девушек, кг

юноши σ=11,30
девушки σ=10,58

Вариант 12. Пульс юношей и девушек, уд\мин

юноши σ =7,74
девушки σ =4,86

 

Вариант 13. Влияние диеты на вес, кг

до диеты  
после диеты σd =14,7

 

Вариант 14. Влияние пробежки на пульс, уд\мин

 

до пробежки  
после пробежки σd = 10,3

 

Вариант 15. Влияние операции на объем циркулирующей плазмы , мл\кг

 

до операции  
после операции σd = 8

 

 

СЛУЧАЙ 1. Выборки независимы.

Используется U-критерий Манна—Уитнидля проверки гипотезы о принадлежности сравниваемых независимых выборок к одной и той же генеральной совокупности.

• Объединим все значения обеих выборок в один ранжированный ряд

• Каждому элементу этого ряда присвоим номер (ранг)

• Если несколько элементов ряда совпадают по величине, то каждому присваивается ранг, равный среднему арифметическому их номеров

• Для каждой выборки находятся суммы рангов R и рассчитываются статистики:

 

где i = 1 и 2 – номер выборки

 

• В качестве тестовой статистики выбирают минимальную величину U и сравнивают ее с табличным значением для принятого уровня значимости и объемов выборок n1, n2.

• Гипотеза принимается, и различия считаются недостоверными, если рассчитанное значение больше соответствующего табличного

 

Работа с преподавателем

Пример Проверим гипотезу о принадлежности сравниваемых независимых выборок к одной и той же генеральной совокупности с помощью непараметрического U-критерия.

 

Содержание вещества В в крови, моль\л

1 группа
2 группа

 

СЛУЧАЙ 2. Выборки зависимые

В случае попарно связанных выборок применяется Т-критерий Уилкоксона. При этом:

· Вычисляются попарные разницы значений до и после

· Попарные разницы, кроме нулевых, без учета знака ранжируются в один ряд

· Разницам, кроме нулевых, присваиваются ранги, при чем одинаковым по модулю величинам присваивают одинаковый ранг

· Отдельно вычисляют сумму рангов положительных (Т+) и отрицательных разностей (Т—),

· Меньшую из двух таких сумм без учета знака выбирают в качестве критерия

• Нулевую гипотезу принимают на данном уровне значимости, если вычисленная статистика превзойдет табличное значение.

Работа с преподавателем

Стояла задача определить влияет ли препарат «Биоконт» на содержание белка в плазме крови. С этой целью препарат был испытан на десяти кроликах. Результаты эксперимента приведены в таблице.

 

до 2,4 3,7 4,2 2,8 3,3 4,5 3,9 2,7 4,4
после 3,5 4,9 4,4 3,6 2,5 4,1
разница                    
                     
ранжир                    
ранги                    
Т+                    
Т-                    

Самостоятельная работа:

Проверить гипотезу о принадлежности двух выборок одной генеральной совокупности с использованием непараметрических критериев. Сформулировать нулевую и альтернативную гипотезы. Сделать выводы на уровне значимости a=0,01.

 

Вариант 1. Скорость десневой экссудатации у детей (мл/сутки).

 

Норма 0,73 0,75 0,8 0,82 0,81 0,86 0,85 0,79 0,82 0,78
Гингивит 1,32 1,8 1,7 1,4 1,5 1,49 1,52      

 

Вариант 2. Калий мочи (г/сутки).

 

Норма 2,1 1,9 1,8 2,2 2,2 1,8 2,1
легочная недостаточность 0,8 0,9 0,8 0,7 0,7 0,9 2,1

Вариант 3. Содержание адренокортикотропного гормона (мл.ед).

Норма 32,1 33,0 28,2 29,5 35,7 31,8 37,5 26,4  
Беременность 98,6 120,3 73,6 96,1 104,3 113,1 100,3 68,1 71,1

Вариант 4. Свободный гепарин крови.

Норма 5,7 5,9 6,3 6,6 5,0 3,7 4,0 4,5 5,7 5,6
Стоматит 13,9 13,5 12,0 10,3 13,0 15,7 14,7      

Вариант 5. Связанный холестерин крови (мг%).

 

Норма 58,9 53,1 64,1 59,3 69,0 62,0 53,3 61,1 58,3
Себоррея 105,3 83,7 122,2 110,6 101,1 96,8 114,5 113,0  

 

Вариант 6. Скорость нестимулированного слюноотделения у детей (мл/мин).

до операции 0,19 0,2 0,13 0,22 0,15 0,17
после уранопластики 0,21 0,23 0,15 0,26 0,15 0,18

 

Вариант 7. Норадреналин мочи (мкг/сутки) при грудной жабе.

до лечения 36,9 38,2 36,1 33,5 34,8 35,1 38,5 38,3
после лечения 40,5 43,8 56,7 49,8 50,4 45,4 39,9 38,7 40,3 51,6

Вариант 8. Микрошероховатость поверхности эмали после воздействия кислотой (Со ОЭДФ).

до воздействия 0,15 0,128 0,135

Последнее изменение этой страницы: 2016-07-23

lectmania.ru. Все права принадлежат авторам данных материалов. В случае нарушения авторского права напишите нам сюда...