Главная Случайная страница


Категории:

ДомЗдоровьеЗоологияИнформатикаИскусствоИскусствоКомпьютерыКулинарияМаркетингМатематикаМедицинаМенеджментОбразованиеПедагогикаПитомцыПрограммированиеПроизводствоПромышленностьПсихологияРазноеРелигияСоциологияСпортСтатистикаТранспортФизикаФилософияФинансыХимияХоббиЭкологияЭкономикаЭлектроника






Лабораторная работа N3. Показатели вариации для статистических данных.

Цель: в третьей лабораторной работе студенты должны научиться рассчитывать различные показатели вариации для данных, разделённых на группы. На основании эмпирического корреляционного отношения установить степень тесноты связи исследуемого и группировочного признаков.

Для проверки значимости влияния группировочного признака на исследуемый используется однофакторный дисперсионный анализ. Результаты статистического анализа представляются в виде статистических таблиц.

 

Задание 1. Проверка правила суммы дисперсий.

Рассмотрим проведение дисперсионного анализа имеющихся данных, например, для варианта 1: требуется выяснить зависит ли цена от типа дома.

Заполните первую таблицу. Для этого перенесите таблицу 1 из отчета на лист «Предобработанные данные». Затем необходимо:

1. Сделать группировку для своего варианта, например, по типам домов.

2. Найти число единиц в каждой конкретной группе с помощью функции счетесли.

3. Найти суммарное значение цены (в зависимости от варианта) функцией суммесли.

Для этого сделать отдельный столбец в листе данных своего варианта, в котором необходимо перемножить количество жилой площади, проданной риэлторами, на цену одного метра квадратного жилой площади.

4. Найти групповые средние делением стоимости домов данной группы на число единиц в данной группе.

5. Заполнить строку ИТОГОдля числа единиц совокупностии суммарного значения признака.

Далее:

1. Найти групповые дисперсии. С помощью автофильтра выбрать дома конкретной группы и скопировать столбцы в отдельную, заранее сделанную закладку (лист «вспомогательные функции»). У вас получатся столбцы, для которых и нужно подсчитать сумму квадратов отклонений значений в столбцах от частного среднего по группе – частную групповую дисперсию.

Для этого рекомендуется сделать по отдельности столбец разностей (X-Xсреднее) и столбец квадрата этой скобки. Затем посчитать сумму по столбцу квадратов и разделить на число домов в данной группе.

Повторить процедуру для всех типов домов. В результате вы будете иметь все групповые дисперсии. Занесите их в соответствующий столбец отчета и в такой же столбец листа «предобработанных данных» Microsoft Excel.

1а.Сделайте дополнительный столбец в таблице 1, в котором вычислите произведение групповых дисперсий на число домов в группе. Внизу столбца получите сумму.

Перенесите из отчета таблицу дисперсий на лист «предобработанных данных» Microsoft Excel.

2. Найти общее среднее. Для этого выбрать отдельную ячейку в таблице дисперсий на листе «предобработанных данных» и разделить в ней суммарное значение признака (ИТОГО) из таблицы 1 на общее число домов.

3. Найти общую дисперсию.Для этого на листе вашего варианта создать столбец (X-Xсреднее общее) и рядом его квадрат для всех домов. Затем посчитать сумму по столбцу квадратов и разделить на число всех домов.

4. Найти внутригрупповую дисперсию.Для этого сумму из пункта 1а разделите на полное число домов.

5. Найти межгрупповую дисперсию.Для этого в таблице 1 нужно сделать ещё один столбец разностей (Хсреднее групповое - Xсреднее общее) и столбец квадрата этой скобки, умноженной на число домов в группе. Затем посчитать сумму по столбцу квадратов, умноженных на число домов в группе, и разделить на число всех домов.

6. Проверить правило сложения дисперсий.Для этого сложить в последней ячейке таблицы дисперсий межгрупповую и внутригрупповую дисперсии. Сумма должна равняться общей дисперсии. Если это не так, то следует искать ошибку!!!

 

Задание 2. Однофакторный дисперсионный анализ.

1. Заполнить таблицы дисперсионного анализа в отчете.

2. Рассчитать Эмпирический коэффициент детерминации, hэмп2 и Эмпирическое корреляционное отношение, hэмп. .

3. Определить какую долю вариации результирующего признака определяет исследуемый факторный признак.

4. Определить степень связи между результирующим и факторным признаками.

5. Провести дисперсионный анализ. Воспользоваться распределением Фишера. Выбрать уровень значимости a и формулу для расчёта статистики критерия.

 

Задание 3. Расчёт показателей вариации.

Рассчитать показатели вариации для каждого типа дома и занести их в таблицу.

Необходимо обратить внимание, что линейным коэффициентом вариации называют отношение среднего линейного отклонения к среднему значению, а выборка считается однородной, если коэффициент вариации не превышает 33%.

 

Контрольные вопросы.

1. В чем смысл нулевой гипотезы в этой работе? Что в результате проверяется?

2. Может ли расчетное значение статистики критерия совпасть с теоретическим (табличным) значением?

3. Что такое уровень значимости?

4. Что такое степень свободы?

5. Для чего дисперсию делят на число степеней свободы?

6. Что такое остаточная дисперсия?

7. Что такое смещенная оценка?

8. Как получить несмещенную оценку?

9. Как рассчитывается среднее линейное отклонение?

10. Какова связь между коэффициентом линейной корреляции и эмпирическим корреляционным соотношением?


Лабораторная работа N4. Выявление основной тенденции динамического ряда.

 

Цель: в четвёртой лабораторной работе провести выявление основной тенденции ряда динамики различными методами и их сравнение. Рассчитать среднее значение ряда, основные и средние показатели изменения уровней ряда. Результаты статистического анализа представить в виде статистических таблиц и графиков.

 

Задание 1. Выявление основной тенденции ряда.

Сгладить ряд различными методами и показать на графиках исходный и укрупнённый ряды.

a. Метод укрупнения интервалов

Укрупнить исходный ряд в k = 3 раза. Для этого первоначально необходимо выяснить к какому из типов рядов относится данный ряд, к моментному или интервальному.

В дальнейшем вычисляется сумма из определенного числа первых по порядку уровней ряда, например, трех, затем — сумма из такого же числа уровней, начиная с четвертого, далее — начиная с седьмого, и т.д. Во вторую и третью ячейку ставится либо ноль, либо значение первой ячейки, аналогично в пятую и шестую ячейки ставится значение четвертой или ноль, а так же в восьмую и девятую значение седьмой или ноль. Различие будет только в графическом изображении.

Построить на одном графике исходный и укрупненный ряды.

в. Метод скользящей средней

Сгладить ряд методом скользящей средней с шириной окна: k = 5.

Сгладить ряд методом скользящей средней с шириной окна: k = 12.

Для удобства работы скопировать исходные данные на лист «Предобработанные данные».

Метод простой скользящей средней заключается в том, что вычисляется средний уровень из определенного числа первых по порядку уровней ряда (окна), затем — средний уровень из такого же числа уровней, начиная со второго, далее — начиная с третьего, и т.д. Таким образом, при расчетах среднего уровня окно как бы скользит по ряду динамики от его начала к концу, каждый раз отбрасывая один уровень в начале и добавляя один следующий. Отсюда название — скользящая средняя.

 

 

Рис.1

Обратить внимание: чем больше окно, тем заметнее проблемы в начале и/или в конце сглаженного ряда.

Предложить способ борьбы с этими проблемами.

Построить на одном графике исходный и усредненные ряды.

 

с. Метод скользящей медианы

Сгладить ряд методом скользящей медианы с шириной окна: k = 5.

Поставить в ячейку 3 свободного столбца знак равенства. Воспользоваться функцией медианы в пакете анализа. Выделить окно шириной в 5 ячеек. Протянуть функцию по всему столбцу.

Проанализировать результат.

Построить на одном графике исходный и усредненные ряды.

 

d. Метод простого экспоненциального сглаживания

Установить пакет анализа. Выбрать опцию анализ данных. Выбрать алгоритм: экспоненциальное сглаживание. Или использовать формулу:

Новый прогноз=альфа*(фактический результат в последний период)+(1-альфа)*(прогноз в последний период), то есть:

Ft+1=αAt+(1-α)Ft,

 

 

Рис.2

 

Сгладить ряд методом простого экспоненциального сглаживания с шириной окна: k = 5. Поставить в ячейку 3 свободного столбца знак равенства. Воспользоваться функцией экспоненциального сглаживания в пакете анализа (или формулой). Выделить окно шириной в 5 ячеек в исходных данных. Протянуть функцию по всему столбцу.

Построить на одном графике исходный и сглаженные ряды с a =0,1 и a =0,9.

Экспериментально установить параметр экспоненциального сглаживания a =_________, который наиболее подходит для выявления основной тенденции исследуемого ряда.

Проанализировать результат.

 

 

Задание 2. Расчёт среднего уровня ряда.

Выяснить исследуемый ряд является моментным или интервальным с равноотстоящими или неравноотстоящими отсчётами и вписать в таблицу соответствующую формулу из лекций для среднего уровня ряда.

Рассчитать величину среднего уровня ряда и показать на графике средний уровень ряда на фоне исходного ряда.

 

Задание 3. Расчёт основных показателей изменения уровня ряда.

a. Цепные абсолютные приросты и темпы роста

Рассчитать цепные абсолютные приросты и цепные темпы роста для тренда исследуемого ряда, по отдельности в свободных столбцах. Причем темпы роста привести в процентах.

b. Средние показатели изменения уровней ряда

Рассчитать средние показатели для тренда исследуемого ряда по значениям цепных показателей: средний абсолютный прирост, средний темп роста.

Рассчитать средние показатели для тренда исследуемого ряда по значениям начального и конечного уровней ряда: средний абсолютный прирост, средний темп роста.

Рассчитать средний темп прироста.

c. Выравнивание ряда по среднему темпу роста

Для этого в свободном столбце во второй ячейке рассчитать произведение первой ячейки на средний темп роста. В третьей ячейке умножить предыдущую цифру (во второй ячейке) на средний темп роста. Протянуть формулу из третьей ячейки по столбцу.

Построить и показать на графике в отчете исходный ряд и ряд, выравненный по среднему темпу роста.

 

Написать заключение по выполненной работе. При этом ответить на вопросы:

1. Как из моментного ряда можно сделать интервальный ряд?

2. Какой параметр экспоненциального сглаживания является наилучшим для данного ряда? И почему?

3. Какие недостатки есть у метода скользящей средней?

4. Насколько метод скользящей средней отличается от метода скользящей медианы по своим результатам?

5. Для каких рядов рационально рассчитывать средний уровень ряда?

6. Чем отличается коэффициент роста от темпа роста?

7. Для каких рядов рационально использовать выравнивание по среднему темпу роста?

8. Почему функция для экспоненциального сглаживания называется рекурсивной?


Последнее изменение этой страницы: 2016-07-22

lectmania.ru. Все права принадлежат авторам данных материалов. В случае нарушения авторского права напишите нам сюда...