Главная Случайная страница


Категории:

ДомЗдоровьеЗоологияИнформатикаИскусствоИскусствоКомпьютерыКулинарияМаркетингМатематикаМедицинаМенеджментОбразованиеПедагогикаПитомцыПрограммированиеПроизводствоПромышленностьПсихологияРазноеРелигияСоциологияСпортСтатистикаТранспортФизикаФилософияФинансыХимияХоббиЭкологияЭкономикаЭлектроника






Табличный процессор Microsoft Excel

а) Почти ручной счет.Используя простейшие средства ввода, редактирования данных в данной программе на основании приемов и формул, представленные в разделах 1-5 настоящего пособия, можно проводить статистические расчеты в любом объеме. Этот способ хорош тем, что он позволяет пользователю создавать при помощи компьютера свой сценарий обработки данных и дает возможность просматривать, контролировать и активно влиять на промежуточные и окончательные результаты на всех этапах решения поставленных задач. Особенно удобно представлена в этом компьютерном приложении работа с таблицами и графиками, которые, как убедился читатель, являются неотъемлемыми атрибутами статистических расчетов. Примеры использования компьютера представленным способом приводится в разделах 1, 2 и 5. Недостаток этого метода связан с его достоинствами и заключается в относительно небольшой скорости расчетов и в необходимости знать все расчетные формулы (!!!).

б). Расчет статистических характеристик при помощи встроенных функций.В табличном процессоре Excel в меню Вставка имеется опция “Вставка функции” (кнопка fх ). При выборе этой опции появляется диалоговое окно, разделенное на две части.

В левой части диалогового окна указываются категории функций. В нашем случае обычно выбирают категории Статистические и 10 недавно использовавшихся. В правой части диалогового окна выводится список функций данной категории. Если отметить какую-то функцию в этом списке, то в нижней части окна появится формула обращения к отмеченной функции, а еще ниже приводится краткое объяснение функции на русском языке. Если выбрать нужную функцию, то откроется соответствующее диалоговое окно. Для примера, выберем функцию КОРРЕЛ, которая позволяет вычислить коэффициент корреляции двух массивов (в нашем примере признаки Х и У):

 

В появившемся окне нужно ввести запрашиваемую информацию. После нажатия кнопки ОК результат вычисления записывается в ту ячейку, которая была выделена пользователем до обращения к нужной функции.

Замечание. Если результат выполнения функции ожидается в виде массива, то вместо кнопки ОК нужно одновременно нажать три клавиши

Ctrl+Shift+Enter .

Перечислим некоторые наиболее используемые в данном пособии функции

Название функции в статистическом анализе Обозначение в пособии Обращение в Excel
Выборочное среднее СРЗНАЧ
Выборочная дисперсия Dв ДИСПР
Исправленная выборочная дисперсия S2 ДИСП
Выборочное СКО sв СТАНДОТКЛОНП
Исправленное выборочное СКО S2 СТАНДОТКЛОН
Выборочный коэффициент корреляции rв КОРРЕЛ
Параметры линейной регрессии k, b ЛИНЕЙН
Коэффициент линейной регрессии k НАКЛОН
Свободный член регрессии b ОТРЕЗОК
Медиана Ме МЕДИАНА
Мода Мо МОДА
Коэффициент асимметрии А СКОС
Эксцесс Е ЭКСЦЕСС
Критические точки распределения Фишера F FРАСПОБР
Функция Лапласа Ф(х) НОРМСТРАСП – 0,5
Критические точки распределения Стьюдента t СТЬЮДРАСПОБР
Критические точки ХИ–квадрат распределения c2 ХИ2ОБР

 

в). Составление уравнений регрессии y=f(x) при помощи мастера диаграмм.В табличном процессоре Excel в меню Вставка имеется опция “Диаграмма”. При выборе этой опции появляется Мастер Диаграмм.

Нужно выбрать тип диаграммы – точечная; вид диаграммы - точечный рисунок без линий соединения. Далее нужно следовать указаниям мастера и в результате получается диаграмма следующего вида:

х у

 

 

           
             
             
             
             
             
             
             
             
                 
                 
                 

Чтобы на диаграмме появились уравнение регрессии и коэффициент детерминации R2, следует выделить полученную диаграмму; в строке меню выбрать Диаграмма и в раскрывшемся меню выбрать опцию “Добавить линию тренда”. Появится диалоговое окно:

Далее нужно отметить нужный тип линии тренда, затем перейти на вкладку Параметры и выставить опции :

ü Показывать уравнение на диаграмме;

ü Поместить на диаграмму величину достоверности аппроксимации (R^2).

После нажатия кнопки ОК на диаграмме появится необходимая информация и она примет следующий вид:

г). Расчет статистических характеристик с помощью пакета Анализ данных.В состав Microsoft Excel входит набор средств анализа данных (так называемый пакет анализа), предназначенный для решения сложных статистических и инженерных задач. Для проведения анализа данных с помощью этих инструментов следует указать входные данные и выбрать параметры; анализ будет проведен с помощью подходящей статистической или инженерной макрофункции, а результат будет помещен в выходной диапазон. Другие средства позволяют представить результаты анализа в графическом виде.

Чтобы просмотреть список доступных инструментов анализа, нужно выбрать команду Анализ данных в меню Сервис.Появится следующий список:

Здесь нужно выбрать необходимый раздел статистики и далее заполнить все требующиеся в открывшемся диалоговом окне формы.

В качестве примера возьмем задачу о нахождении уравнения множественной регрессии, которая решалась нами средствами пакета Mathcad в пункте 5.8. После ввода исходных данных в Excel и обращению к пакету Анализ данных выбирается раздел Регрессия. В появившейся форме вводятся диапазоны массивов: Y (результативный признак) и Х ( признаки Х1 и Х2 ). Далее отмечаются нужные параметры вывода. Отметим, что кроме основных статистик пользователь может получить и такие параметры как остатки, график остатков, график нормальной вероятности. После нажатия кнопки ОК компьютер выдает итоги расчетов примерно в такой форме:


 

ВЫВОД ИТОГОВ          
           
Регрессионная статистика        
Множественный R 0,782        
R-квадрат 0,612        
Нормированный R-квадрат 0,566        
Стандартная ошибка 7,373        
Наблюдения        
           
Дисперсионный анализ        
df SS MS F  
Регрессия 1455,798 727,9 13,39  
Остаток 924,189 54,36    
Итого 2379,987      
           
Коэффи циенты Стандартная ошибка t-стати стика P-Зна чение  
Y-пересечение 10,986 12,145 0,905 0,378  
X1 23,471 8,412 2,790 0,013  
X2 -0,018 0,006 -3,007 0,008  

 

Отсюда выписываем уравнение множественной регрессии и все необходимые коэффициенты:

1) Уравнение линейной регрессии имеет вид:

2) Коэффициент детерминации равен R2 = 0,612.

3) Корреляционное отношение равно R = 0,782.

4) Наблюдаемое значение критерия Фишера равно F=13,389 .

В итоге получили результаты, совпадающие с найденными ранее (п.5.8).

 

Пакет программ STATISTICA

 

Пакет STATISTICA фирмы StatSoft является интегрированной системой статистического анализа и обработки данных. Он позволяет проводить статистическую обработку данных в широком спектре на высоком профессиональном уровне, но при этом выдвигаются достаточно большие требования к пользователю в отношении теоретической подготовки в области математической статистики. Хотя и новички в статистике смогут выполнить, и, главное, интерпретировать некоторые статистические операции.

STATISTICA состоит из следующих компонент, которые объединены в рамках одной системы:

o электронных таблиц для ввода, хранения и изменения данных (Spreadsheet);

o электронных таблиц для вывода результатов статистического анализа (Scrooldsheet);

o мощной графической системы;

o набора специализированных статистических модулей, в которых собраны группы логически связанных между собой статистических процедур;

o специального инструментария для подготовки отчетов;

o встроенных языков программирования.

После запуска программы появляется пустая электронная таблица в STATISTICA File Server. Затем вводят данные в таблицу; заменяют стандартные названия переменных на требуемые; изменяют формат данных. Здесь же можно выполнить некоторые действия над данными: визуализация данных, основные статистические характеристики данных. Для более сложных действий применяют специализированные модули. Для запуска их требуется выбрать на панели инструментов Module Switcher -Переключатель модулей. Опишем основные статистические модули и их возможности.

· Basic Statistics – Модуль Основные статистики и таблицы

Этот модуль включает в себя практически все описательные статистики, группировки, доверительные интервалы; тесты на нормальный закон распределения; расчет корреляционных матриц (размеров до 300 на 300); тесты на независимость признаков; гистограммы; таблицы частот.

· Nonparametrics / Distrib. – Модуль Непараметрические статистики и подгонка распределений

Модуль содержит обширный набор непараметрических критериев согласия, в частности, критерий Колмогорова-Смирнова; ранговые критерии Манна-Уитни, Вилкоксона и многие другие.

Модуль позволяет подобрать к исходным данным подходящий закон распределения (13 наиболее известных видов).

· Multiply Regression – МодульМножественная регрессия

В этом модуле строятся зависимости между многомерными переменными; проверяется адекватность моделей; оцениваются и строятся остатки, исследуются мобели на наличие автокорреляции.

· Nonlinear Estimation – МодульНелинейное оценивание

Этот модуль незаменим, если пользователю требуется составить нелинейное уравнение регрессии, проверить его на адекватность, рассчитать тесноту связи зависимого и независимых факторов.

Перечислим остальные модули:

· Time series / Forecasting –МодульАнализ временных рядов и прогнозирование

· Cluster Analysis – Модуль Кластерный анализ

· Process Analysis – –Модуль Анализ процессов

· Canonical Analysis – Модуль Канонический анализ

· Discriminant Function Analysis – Модуль Дискриминантный анализ

· Factor Analysis –Модуль Факторный анализ

· ANOVA/MANOVA – Модульдисперсионного анализа

· Classification Trees – Модуль Классификационное дерево

· Data Management – Модуль Управление данными

· Quality Control –Модуль Контроль качества

Более подробная информация о работе с данными в среде STATISTICA содержится в [3 ]

Для примера возьмем задачу о нахождении уравнения множественной регрессии, которая решалась нами средствами пакета Mathcad в пункте 5.8 и в среде Excel в пункте 6.1.

а) Заполняем данными исходную таблицу ( приводим фрагмент таблицы):

б) Используя переключатель модулей, переходим в модуль Множественная регрессия.

Выбираем зависимые (dependent -У) и независимые (independent X1, X2) переменные (variables). После нажатия кнопки ОК результаты можно вывести в виде таблицы

Regression Summary for Dependent Variable: Y (yyy.sta)
R= ,78210169 RІ= ,61168305 Adjusted RІ= ,56599870
F(2,17)=13,389 p<,00032 Std.Error of estimate: 7,3732
    St. Err.   St. Err.    
  BETA of BETA B of B t(17) p-level
Своб.член     10,986 12,145 0,905 0,378
X1 0,454 0,163 23,471 8,412 2,790 0,013
X2 -0,490 0,163 -0,018 0,006 -3,007 0,008

 

Здесь R=0,782 – корреляционное отношение; RI=0,612 – коэффициент детерминации; F(2,17)=13,389 – наблюдаемое значение критерия Фишера; p<0,00032 – значимость ошибки первого рода, при которой гипотезу об адекватности полученной модели нужно отвергнуть. Малая вероятность говорит о том, что модель адекватная.

Параметры модели содержатся в столбце В. Они совпадают с найденными ранее. В следующих столбцах помещены СКО этих параметров; их t-статистики и уровни вероятностей ошибок. Если выбрать значимость a=0,1 , то коэффициенты регрессии при Х1 и Х2 признаются значимыми, свободный член уравнения регрессии признается незначимым. Это значит, что нужно выбрать другую спецификацию модели, возможно без свободного члена.

 

7 Задачи для самостоятельного решения

 

В этом разделе представлены задачи, связанные с проверкой статистических гипотез. Читателю предлагается решить их самостоятельно.

 

Вариант № 1

Предполагается, что применение новой технологии в разработке пластовых месторождений приведет к увеличению качества угля. Результаты контроля по качеству угля, добытого двумя бригадами, работающими в аналогичных условиях, но использующими разные технологии, приведены ниже. Замеры велись по проценту засорения угля, вырабатываемого одной бригадой за смену по старой технологии (признак Х1) и новой технологии (признак Х2).

Х1(в %): 20; 12; 11; 12; 20; 18; 10 Х2 (в %): 10; 13; 21; 7; 15; 9; 9;13

Подтверждают ли эти результаты предположение об эффективности применения новой технологии? Принять a = 0,05 .

Вариант № 2

Изучают связь между стажем работы и квалификацией работника. Последнюю измеряли качественно по итогам выполнения плана рабочим. Результаты приведены ниже:

Стаж работы Отметка о выполнении плана
Выполняет Не выполняет
Менее 5 лет
Не менее 5 лет
Всего

 

Можно ли при уровне значимости 0,05 считать, что стаж не влияет на квалификацию рабочего?

Вариант № 3

Сравнивают реальную пропускную способность (Ас) за сутки по транспортированию грузов двух штреков I и II. Получены следующие результаты:

Штрек I : выборочная средняя Ас = 3000 т; S= 20 т ; n = 7

Штрек II : выборочная средняя Ас = 3450 т; S = 25 т ; n = 10

Какой из двух штреков имеет большую реальную пропускную способность ?

Принять a = 0,1.

 

Вариант № 4

Определяют сопротивление угля резанию по двум методикам М1 и М2.

Проведены эксперименты по двум методикам и получены следующие результаты (сопротивление измерялось в кгс/см).

Методика М1 : = 210 кгс/см ; S = 5 кгс/см; n = 10

Методика М2 : = 230 кгс/см ; S = 8 кгс/см; n = 15

Какая из двух методик дает меньший разброс по измеряемому показателю?

Принять a = 0,05.

 

Вариант № 5

При измерении производительности двух агрегатов получены следующие результаты ( в кг вещества за час работы)

  Хв Дв n
Агрегат А 14,3 0,36
Агрегат Б 13,4 0,52

Можно ли считать, что производительности агрегатов А и Б одинаковы, в предположении, что выборки получены из нормально распределенных генеральных совокупностей? Принять a = 0,1.

 

Вариант № 6

Два пресса штампуют детали одного наименования. Из партии деталей, изготовленных первым прессом проверено 1000 деталей, из них 40 оказались негодными. Из 800 деталей, изготовленных вторым прессом, негодными оказались 36 деталей. Можно ли считать , что доля брака в продукции двух прессов одинакова? Принять a = 0,05 .

 

Вариант № 7

Чтобы определить, какое влияние оказывает температура окружающей среды на систематическую ошибку угломерного инструмента, проведены измерения утром ( t =10ºС) и днем (t=26ºС) . Результаты измерений ( в угловых градусах) приведены ниже:

утром – n = 15 ; = 37º ; S = 2,3º

вечером – n = 11 ; = 38º ; S = 2,9º

Можно ли считать, что температура окружающей среды влияет на систематическую ошибку угломерного инструмента? Значимость ошибки первого рода равна 0,1.

 

Вариант № 8

Проводятся работы по созданию красок с наименьшим разбросом в отпечатках. По результатам использования двух технологий создания новых красок получены данные по отпечатывающим способностям.

Первая технология: n = 7 ; = 112 ; S2 = 19,1

Вторая технология: n = 9 ; = 125 ; S2 = 28,1

Свидетельствуют приведенные данные о уменьшении разброса в отпечатках по первой технологии?

Принять a = 0,1 .

Вариант № 9

Два токарных станка изготовляют детали по одному чертежу. Для проверки отобрали некоторые детали и замерили контролируемый размер (в мм) :

Первый станок: n = 10 ; = 18,1 ; S2 = 0,09

Второй станок: n = 8 ; = 17,8; S2 = 0,16

Можно ли считать, что точность изготовления на двух станках одинакова? Принять a = 0,05 .

Вариант № 10

Предполагается, что применение новой технологии в производстве резцов приведет к увеличению выхода годной продукции. Результаты контроля двух партий продукции, изготовленных по старой и новой технологии, приведены ниже:

Изделия Технология
Старая Новая
Годные
Негодные
Всего

Подверждают ли эти результаты предположение об увеличении выхода годной продукции ? Принять a = 0,05 .

Вариант № 11

В течение одного рабочего дня отказали 24 элементов устройства А, состоящего из 840 элементов и 32 элементов устройства Б, состоящего из 1100 элементов. Верно ли, что вероятности отказов элементов обоих устройств отличаются друг от друга? Принять a = 0,01 .

 

Вариант № 12

Измерялось сопротивление двух типов проволоки ( тип А и тип В). Утверждается, что между рассеиванием их сопротивлений нет разницы. По данным результатам необходимо сделать вывод о том, какой тип проволоки имеет большее рассеивание.

Тип проволоки , Ом Дв , Ом2 n
А 0,131 0,001
В 0,122 0,002

Принять a = 0,01 .

 

Вариант № 13

Сравнивают производительность двух ленточных конвейеров в одинаковых реальных условиях работы. Результаты замера данных и их первичной обработки приводятся ниже:

Конвейер КЛА–250 : = 248 т/час ; S= 2 т/час ; n = 16

Конвейер КЛБ–250: = 246 т/час ; S= 3 т/час ; n = 9

Какой из двух конвейеров имеет большую реальную роизводительность ?

Принять a = 0,1.

Вариант № 14

Для оценки качества изделий, изготовленных двумя заводами , взяты выборки и получены следующие оценки параметров распределения.

Завод “Альфа” : объем выборки n=100; из них бракованных – 12;

завод “Сигма” : объем выборки n=130; из них бракованных – 15.

При уровне значимости 0,05 проверить гипотезу об одинаковой доле брака на каждом заводе.

Вариант № 15

Измерялось сопротивление двух типов проволоки ( тип А и тип В). Утверждается, что между рассеиванием их сопротивлений нет разницы. По данным результатам необходимо сделать вывод о том, какой тип проволоки имеет большее рассеивание.

Тип проволоки , Ом Дв , Ом2 n
А 0,135 0,003
В 0,128 0,001

Принять a = 0,01 .

 

Вариант № 16

Определяют дисперсию предела прочности на разрыв волокна по двум методикам : А и В.

Проведены эксперименты по двум методикам и получены следующие результаты (предел прочности измерялся в фунтах).

Методика А : = 160 ф; S = 8,5 ф ; n = 12

Методика В : = 170 ф; S = 10,1ф ; n = 9

Какая из двух методик дает меньшую дисперсию предела прочности? Принять a = 0,1

Вариант № 17

При измерении производительности двух агрегатов получены следующие результаты (в кг вещества за час работы)

  Дв n
Агрегат Б 24,8 0,0121
Агрегат С 23,4 0,0169

Можно ли считать, что производительности агрегатов А и Б одинаковы, в предположении, что выборки получены из нормально распределенных генеральных совокупностей? Принять a = 0,05.

 

Вариант № 18

Два пресса штампуют детали одного наименования. Из партии деталей, изготовленных первым прессом проверено 1800 деталей, из них 45 оказались негодными. Из 1000 деталей, изготовленных вторым прессом, негодными оказались 18 деталей. Можно ли считать , что доля брака в продукции двух прессов одинакова? Принять a = 0,05 .

 

Вариант № 19

Чтобы определить, какое влияние оказывает температура окружающей среды на систематическую ошибку угломерного инструмента, проведены измерения горизонтального угла объекта утром ( t =10ºС) и днем (t=26ºС) . Результаты измерений углов (в градусах):

утром – n = 15 ; = 42º ; S = 2,7º

вечером – n = 11 ; = 44º ; S = 3,9º

Можно ли считать, что температура окружающей среды влияет на систематическую ошибку угломерного инструмента? Значимость ошибки первого рода равна 0,05.

 

Вариант № 20

Проводятся работы по созданию красок с наименьшей дисперсией в отпечатках. По результатам использования двух технологий создания новых красок получены данные по отпечатывающим способностям.

Первая технология: n = 10 ; = 150 ; S2 = 29,1

Вторая технология: n = 14 ; = 130 ; S2 = 32,1

Свидетельствуют приведенные данные о уменьшении разброса в отпечатках по первой технологии? Принять a = 0,01.

 

Вариант № 21

Два токарных станка изготовляют детали по одному чертежу. Для проверки отобрали некоторые детали и замерили контролируемый размер (в мм) :

Первый станок: n = 12 ; = 28,1 ; S2 = 0,16

Второй станок: n = 8 ; = 25,8; S2 = 0,25

Можно ли считать, что точность изготовления на двух станках одинакова? Принять a = 0,01 .

 

Вариант № 22

Предполагается, что применение новой технологии в производстве сверл приведет к увеличению выхода годной продукции. Результаты контроля двух партий продукции, изготовленных по старой и новой технологии, приведены ниже:

Изделия Технология
Старая Новая
Годные
Негодные
Всего

Подверждают ли эти результаты предположение об увеличении выхода годной продукции. Принять a = 0,01 .

 

Вариант № 23

В течение одного рабочего дня отказали 42 элементов устройства Б, состоящего из 1050 элементов и 31 элемент устройства Д, состоящего из 900 элементов. Выявить устройство с наибольшей вероятностью отказа элементов. Принять a = 0,05 .

 

Вариант № 24

Измерялось рабочее сопротивление двух типов стоек. Утверждается, что между рассеиванием их сопротивлений нет разницы. По данным результатам необходимо сделать вывод , какой тип стойки имеет большее рассеивание сопротивления.

Тип стойки , тс Дв , тс2 n
Т6ПК 0,2
Т8ПК 20,4 0,1

Принять a = 0,05 .

 

Вариант № 25

Два автомата настроены на отвешивание одного и того же веса. Сделали по 10 проб на каждом из автоматов и получили следующие результаты ( в тоннах)

Автомат А : = 1,95 т; S = 0,05 т.

Автомат В : = 1,9 г; S = 0,03 т.

Можно ли при уровне значимости 0,05 считать, что автоматы обеспечивают одинаковую точность взвешивания?

Вариант № 26

Определяют дисперсию предела прочности на разрыв волокна по двум методикам : А и В. Проведены эксперименты по двум методикам и получены следующие результаты (предел прочности измерялся в фунтах).

Методика А : = 152 ф; S = 9,59 ф ; n = 12

Методика В : = 146 ф; S = 11,3 ф ; n = 9

Какая из двух методик дает меньшую дисперсию предела прочности?

Вариант № 27

Предполагается, что применение новой технологии в производстве резцов приведет к увеличению выхода годной продукции. Результаты контроля двух партий продукции, изготовленных по старой и новой технологии, приведены ниже:

Изделия Технология
Старая Новая
Годные
Негодные

Подверждают ли эти результаты предположение об увеличении выхода годной продукции ? Принять a = 0,05 .

 

Вариант № 28

Предполагается, что применение новой технологии в разработке пластовых месторождений приведет к увеличению качества угля. Результаты контроля по качеству угля, добытого двумя бригадами, работающими в аналогичных условиях, но использующими разные технологии, приведены ниже. Замеры велись по проценту эксплуатационной зольности угля, вырабатываемого одной бригадой за смену по старой технологии (признак Х1) и новой технологии (признак Х2).

Х1(в %): 30; 20; 15; 12; 25; 18; 19 Х2 (в %): 10; 25; 21; 10; 15; 24; 9; 24; 14

Подтверждают ли эти результаты предположение об эффективности (меньшей зольности) применения новой технологии? Принять a = 0,1 .

 

Вариант № 29

Изучают связь между возрастом и здоровьем шахтеров. Результаты исследования приведены ниже:

Возраст Состояние здоровья
Отличное Удовлетворительное
20 – 30 лет
30 – 45 лет
Всего

 

Можно ли при уровне значимости 0,05 считать, что возраст влияет на состояние здоровья рабочего?

Вариант № 30

Сравнивают участковую суточную добычу с двух разных пластов. Взяты выборки за 10 рабочих дней и произведена первичная обработка данных:

Пласт h7: = 980 т; S= 15 т ; n = 10

Пласт h8 : = 1020 т; S = 20 т ; n = 10

Можно ли по результатам выборок выявить пласт с большей участовой добычей ? Принять a = 0,1.

 


8. Контрольные задания по статистике для студентов дневной формы обучения

В конце изучения курса математической статистики проводится контрольная работа и коллоквиум. На выполнения контрольной работы отводится одно практическое занятие. В процессе решения задач студенты могут пользоваться калькуляторами, статистическими таблицами. Если контрольная работа проводится в компьютерном классе, то рекомендуется добавить задание по определению нужных статистических характеристик при помощи встроенных в Excel функций.

 

8.1 Основные вопросы теории математической статистики

На коллоквиум по математической статистике выносятся следующие вопросы теории:

1. Генеральная совокупность. Выборочная совокупность. Объем выборки.

2. Типы отборов и виды выборок.

3. Признак, варианта, вариационный ряд.

4. Статистический ряд распределения признака.

5. Определение шага интервала, формула Стэрджесса.

6. Гистограмма. Полигон частот. Кумулята.

7. Оценки параметров распределения и основные требования к. ним.

8. Генеральная средняя. Выборочная средняя.

9. Генеральная дисперсия. Выборочная дисперсия.

10. Генеральное среднеквадратическое отклонение.

11. Выборочное среднеквадратическое отклонение.

12. Исправленная выборочная дисперсия.

13. Исправленное выборочное среднеквадратическое отклонение.

14. Мода и медиана признака. Асимметрия и эксцесс признака.

15. Доверительный интервал. Доверительная вероятность.

16. Доверительный интервал для оценки М(Х) при известном s(Х) .

17. Доверительный интервал для оценки М(Х) при неизвестном s(Х).

18. Доверительный интервал для оценки s(Х).

19. Статистические гипотезы.

20. Нулевая, конкурирующая, основная, альтернативная гипотезы.

21. Ошибки первого и второго рода при проверке гипотез.

22. Уровни значимости ошибок a и b.

23. Статистический критерий проверки гипотез.

24. Левосторонняя, правосторонняя и двухсторонняя критические области.

25. Критические точки и принцип их нахождения.

26. Общий принцип проверки статистических гипотез.

27. Проверка соответствия данного распределения нормальному закону распределению.

28. Корреляционная связь.

29. Корреляционное поле (поле рассеяния).

30. Эмпирическая ломанная регрессии.

31. Метод наименьших квадратов. Оценки параметров линейной регрессии.

32. Генеральный коэффициент корреляции и его свойства.

33. Выборочный коэффициент корреляции.

34. Проверка значимости коэффициента корреляции.

35. Коэффициент детерминации, его смысл. Шкала Чеддока.

36. Абсолютная и относительная погрешности уравнения регрессии.

37. Понятие о нелинейной регрессии.

38. Понятие о множественной регрессии.

39. Оценка точности построенной математической модели.

Варианты контрольных работ

Вариант № 1

Задача 1. Исследуется зависимость между природной газоносностью угольного пласта (Х, м3/т сухой беззольной массы) и суточной добычей угля с одной лавы (У, тыс. тонн) :

Х
У 1,8 1,5 0,8 0,5

Требуется:

а) составить уравнение линейной регрессии;

б) найти выборочный коэффициент корреляции и проверить его на значимость;

в) построить корреляционное поле, линию регрессии и сделать вывод;

г) дать точечный прогноз по показателю У при Х=20 м3/т.

д) найти абсолютную и относительную погрешности уравнения линейной регрессии.

 

Задача 2. Пусть взята выборка по пропускам занятий студентами за одну учебную неделю:

Х, час

Требуется:

а) найти основные характеристики выборки: выборочное среднее, выборочнную дисперсию, выборочное СКО, исправленную выборочную дисперсию, исправленное выборочное СКО;

б) построить доверительный интервал для оценки математического ожидания и СКО при доверительной вероятности Р=0,99;

в) проанализировать полученные результаты и сделать выводы.


Вариант № 2

Задача 1. Исследуется зависимость между зольностью угля (У, %) и мощностью присекаемых пород почвы и кровли (Х, м) :

Х 0,5 0,6 0,25
У

Требуется:

а) составить уравнение линейной регрессии;

б) найти выборочный коэффициент корреляции и проверить его на значимость;

в) построить корреляционное поле, линию регрессии и сделать вывод;

г) дать точечный прогноз по показателю У при Х=1,1 м.

д) найти абсолютную и относительную погрешности уравнения линейной регрессии.

 

Задача 2. Пусть взята выборка из оценок студентов за контрольную работу по математической статистике:

Х, баллов

Требуется:

а) найти основные характеристики выборки: выборочное среднее, выборочнную дисперсию, выборочное СКО, исправленную выборочную дисперсию, исправленное выборочное СКО;

б) построить доверительный интервал для оценки математического ожидания и СКО при доверительной вероятности Р=0,95;

в) проанализировать полученные результаты и сделать выводы.

 


Вариант № 3

Задача 1. Исследуется зависимость между среднемесячным подвиганием очистного забоя (У, м/мес) и глубиной проведения работ (Х, км) :

Х 0,5 0,9 0,8 1,2 0,5
У

Требуется:

а) составить уравнение линейной регрессии;

б) найти выборочный коэффициент корреля

Последнее изменение этой страницы: 2016-07-23

lectmania.ru. Все права принадлежат авторам данных материалов. В случае нарушения авторского права напишите нам сюда...