Главная Случайная страница


Категории:

ДомЗдоровьеЗоологияИнформатикаИскусствоИскусствоКомпьютерыКулинарияМаркетингМатематикаМедицинаМенеджментОбразованиеПедагогикаПитомцыПрограммированиеПроизводствоПромышленностьПсихологияРазноеРелигияСоциологияСпортСтатистикаТранспортФизикаФилософияФинансыХимияХоббиЭкологияЭкономикаЭлектроника






Кафедра 71 «Экономика и менеджмент в промышленности»

НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ ЯДЕРНЫЙ УНИВЕРСИТЕТ «МИФИ»

       
 
 
   


ЭКОНОМИКО-

АНАЛИТИЧЕСКИЙ

ИНСТИТУТ

Кафедра 71 «Экономика и менеджмент в промышленности»

 
 


Елкин С.В., Щербинина М.В.

Лабораторный практикум по курсу

Статистика

(длягрупп У7-711, 712, 722, 723)

Москва, НИЯУ МИФИ - 2010


Содержание

Введение. 3

Практические рекомендации по оформлению лабораторных работ. 4

Лабораторная работа N1. «Предварительная обработка статистических данных. Представление статистических данных в виде таблиц и диаграмм». 8

Лабораторная работа N2. Обобщающие статистические показатели (абсолютные, относительные и средние). 14

Лабораторная работа N3. Показатели вариации для статистических данных. 16

Лабораторная работа N4. Выявление основной тенденции динамического ряда. 18

Лабораторная работа N5. Расчёт индивидуальных и сводных экономических индексов. 21

 


Введение

Методические указания для проведения лабораторных работ по курсу «Статистика» предназначены для более эффективного усвоения студентами учебного материала. Лабораторный практикум выполняется с использованием электронных таблиц Microsoft Excel. Овладение возможностями электронных таблиц по обработке и статистическому анализу является необходимым условием для полноценного усвоения студентами таких курсов как Эконометрика, Эконометрическое моделирование, Многомерные статистические методы и др.

Лабораторный практикум содержит 5 лабораторных работ по основным разделам курса. Перед приходом в лабораторию студент должен ознакомиться с содержанием лабораторной работы и конспектом лекции по теме предстоящего статистического исследования. Методические указания жестко привязаны к формам отчетов по каждой лабораторной работе, которые выдаются студентам в электронном виде в начале курса вместе с базами данных, составляющими целостный комплект.

Для проверки усвоения материала в конце методических указаний к каждой лабораторной работе следует воспользоваться контрольными вопросами.


Практические рекомендации по оформлению лабораторных работ

Требования по оформлению лабораторных работ:

Не допускается сдавать работу:

1. Выполненную небрежно.

2. С незаполненными таблицами.

3. Без подписей на диаграммах и графиках.

4. Имеющую неправильные округления (или без округления) результатов.

5. Без формул в соответствующих местах работы.

6. С диаграммами и графиками, находящимися не на своих местах.

 

В процессе выполнения лабораторных работ и домашних заданий студентам приходится много работать с фактическим цифровым материалом. Однако опыт показывает, что при этом совершается множество различных ошибок в представлении результатов. В целом все приемы работы с числами опираются на три простых условия: простота представления, удобство оперирования и здравый смысл.

Правила округлений.Если округляемая цифра в данном разряде числа равна 5 или больше, то на ее место ставим 0, а в следующем разряде добавляем единицу. Если округляемая цифра в данном разряде числа 4 или меньше, то на ее место ставим 0, а в следующем разряде ничего не добавляем.

Пример 1.Округлим число 3428965098 до трех значащих цифр.

3428965100 → 3428965000 → 3428970000 → 3429000000 → 3430000000 = 3,43 ·109

Представление результатов.При представлении результатов вычислений или обработанных и не обработанных данных следует пользоваться рядом принципов.

1. Всякое измерение или статистическое исследование дает лишь приблизительный результат. Поэтому необходимо указывать точность вычислений.

2. Точность вычислений определяется округлением результата и величиной погрешности.

3. Погрешность сама является приблизительной величиной и задается одной значащей цифрой. И двумя исключительно в тех случаях, когда первая цифра погрешности единица.

Вычисление с большей точностью теряет смысл. Этому правилу есть соответствующее обоснование в курсе математической статистики.

4. Округление результата и погрешности необходимо делать в одном и том же разряде числа (единицах, десятках, сотнях, тысячных, и т.д.).

5. Нужно учитывать (здравый смысл), что эти общие принципы могут иметь некоторую незначительную коррекцию определяемую спецификой предмета экономики, в которой главной функционирующей величиной являются денежные средства.

Пример 2.

  1. Средний курс продажи доллара в обменных пунктах задается 4 значащими цифрами:

P = (36, 20 ±0,15)р = 36р 20к ±15к

Здравый смысл считает такую точность достаточной, т.к. суммы наличной валюты при обмене не очень велики.

  1. Средний биржевой курс продажи доллара на некотором временном интервале задается 6 значащими цифрами:

P = (36, 2106 ±0,0005)р

В этом случае здравый смысл считает точность в 4 значащих цифры недостаточной, т.к. суммы биржевых продаж очень велики и могут достигать сотен миллионов, т.е. шесть порядков. При таком положении дел требуется более точный расчет среднего значения.

3. Если биржевые колебания достаточно велики, то приводится среднее значение, а вместо погрешности интервал колебаний за период времени.

 

Пример 3.Пусть средняя стоимость 4-х комнатной квартиры в Москве задана следующим образом:

Р = (14668954,53 ± 560,677)р.

Воспринимать такой результат крайне неудобно. Причиной же является целый ряд ошибок в записи. Приведем правильный вариант:

Р = (14669,0 ± 0,6) тыс. р.

Этот результат воспринимается гораздо лучше, а заодно позволяет увидеть, что величина погрешности занижена.

Пример 4.Пусть величина грузоперевозок по железной дороге составляет следующую величину:

Z = 1345267890000000000000000 т* км

Оперировать такой цифрой крайне сложно. Правильно будет её представить в виде

Z = 1,35 ·1022 т* км

Или Z = 1,35 + Е22 т* км.

Снова правила округлений.Если число имеет много значащих цифр, то во-первых, пользоваться таким числом неудобно, а во-вторых, в большинстве случаев часть значащих цифр не имеет ни какого смысла. Важно отметить, что порядок округления часто задает степень точности.

Пример 5.Пустьваловой внутренний продукт имеет величину

ВВП = 23045067400987р. 65к.

Очевидно, эта запись совершенно бессмысленна и может только вводить в заблуждение, т.к. определить с такой точность ВВП, во-первых, невозможно, а во-вторых, пользоваться неудобно. ВВП нужно определять с точность не большей, чем до миллиона рублей. Тогда ВВП имеет вид:

ВВП = 23045067 млн.р.

Но даже и такая точность избыточна. Реально достаточно точности в миллиард рублей.

Вычисление средних величин и погрешностей. В реальных экспериментах и статистических исследованиях для определения изучаемой величины проводят, как правило, серию измерений (получают выборку). В результате получается n значений (Х1,Х2,…ХN), по ним находится среднее значение <x>и погрешность∆x .Окончательно результат записывается так: X= (<x> ± ∆x)ед.измерения; Ех=δx

Здесь Ех=δx–относительная погрешность среднего значения х,которая определяется по формуле:

δx = 100% .

Простейшим способом нахождения среднего значения является нахождение среднего арифметического, которое определяется по формуле

.

Заметим, что этой формулой мы пользуемся в предположении, что все значения х получаются с равной вероятностью Р=1/n (если все х различны).

В качестве погрешности ∆xобычно указывается так называемаястандартная погрешность –σ,для которой доверительная вероятность (выбираемая самим студентом) того, что истинное значение лежит в пределах доверительного интервала (<x> –σ) - (<x> + σ), равна приблизительно 0,7. Это означает, что если проделать 1000 таких же серий измерений, то приблизительно для 700 серий средние значения окажутся в пределах указанного доверительного интервала, а для остальных случаев – вне его.

При определении и расчете погрешностей важно знать следующее:

при единственном измерении величины невозможно оценить случайную погрешностьσ (хотя она и присутствует), так как она имеет статистический характер и её можно обнаружить только в серии измерений; она определяется по формуле:

σ= .

При построении графиков необходимо следовать следующим правилам:

1. Размер листа бумаги должен быть равен половине листа лабораторного журнала. Нестандартный размер графика используется только в случае необходимости.

2. Каждый график обязательно должен быть подписан. Например: «График зависимости стоимости дома от его типа». Недопустимо в названии делать сокращения типа: «Зависимость L от T». Название графика пишется в верхней части.

3. Масштаб должен выбираться так, чтобы одновременно выполнялись следующие требования:

а. экспериментальные данные и зависимость занимали большую часть листа (более 60%);

б. одна клетка (1см) соответствовала 1, 2, 5, 10 единицам величины, откладываемой на оси;

в. если необходимо отложить по осям цифры, например: 20000, 30000, 40000 и т.д., проставляются 2,3,4 и т.д., а в конце оси около стрелки, переменная умножается на 10-4

г. угол наклона графика (если это линейная зависимость) должен быть в пределах 40–70 градусов;

д. каждая из осей должна отстоять от края листа примерно на 1,5-2 см.

Часто студенты, проводя разметку осей, стараются проставлять цифры начиная с нуля. Однако в этом нет необходимости. Разрешается при построении графиков на пересечении осей ставить требуемую (но положительную) величину.

4. На осях проставляются только цифры масштаба и не проставляются цифры экспериментальных точек.

5. В конце оси около стрелки проставляется переменная и, через запятую, знак единицы измерения, например: m х 10-3, кг.

6. Вклеивать график в лабораторный журнал необходимо осторожно, на левую сторону тетради, используя небольшое количество клея по двум соседним углам листа. Допустимо использовать тонкие полоски скотча. График не должен выступать из тетради.

Графики недопустимо прикреплять степлером.

7. При построении графиков зависимостей важно понимать следующее:

а. экспериментальные зависимости не могут проходить в область, где отсутствуют экспериментальные результаты, за исключением оговоренных случаев: при аппроксимации (прогнозе), с целью сравнения с теорией или другими экспериментальными результатами, и т.д.;

б. экспериментальные зависимости проводят через область погрешности результатов и имеют сглаженный характер;

в. при построении графика теоретической зависимости не указываются погрешности точек, кроме тех случаев, когда в теоретические формулы подставляются значения величин с погрешностями;

г. как правило, экспериментальные зависимости желательно иметь в виде прямых (линейной зависимости), так как угол наклона и точки пересечения с осями зачастую содержат важную информацию. Для этого графики строят так, что по одной или по обеим осям откладывают данные в логарифмическом, квадратичном или ином масштабе;

д. нельзя строить линейную зависимость по двум точкам, а зависимость, построенная по трём точкам весьма недостоверна, и поэтому надо стремиться сделать достаточное количество измерений (достаточный объем выборки), что бы быть уверенным в своих выводах.

8. Экспериментальные точки на графике фиксируются в виде маленьких кружков, а если зависимостей несколько, то другие серии данных изображаются треугольниками, квадратами, пустыми или затушеванными. Зависимости также изображаются разными линиями: сплошными, пунктирными, штрихпунктирными, около них допустимо ставить указатели с номерами, а в углу графика подписывать какой график какой зависимости соответствует.

 

Заключение к лабораторной работе является учебной моделью описания выводов для всякого научного исследования. Оно представляет собой формализованный текст, назначение которого - дать читателю возможность в короткое время, не обращаясь к самой работе, получить логически ясное представление о полученных результатах. Одновременно, оно является видом творческой деятельности и требует от студента четкого понимания, что он делал и что получил, умения пользоваться научной терминологией и выработки особого стиля изложения.

Заключение к лабораторной работе должно формально содержать следующие основные блоки:

1. Краткое описание того, что и каким методом выполнялось. При этом не должно быть пересечений с описанием, данным во введении к лабораторной работе. То есть, не следует переписывать в заключении введение к лабораторной работе.

Например: «В данной работе изучалась зависимость стоимости дома от его типа. Для этого была проведена группировка данных по типам домов».

2. Описание выбранного диапазона, в котором производилось исследование, интервалов и количества измерений, а также, по возможности. обоснование такого выбора.

3. Описание, каким методом обрабатывались данные (если это имело место) и как использовались результаты, например, строились графики, рассчитывались константы и т.д.

4. Описание полученных графиков. При этом необходимо различать экспериментальные данные и построенные по ним кривые и теоретические зависимости. Важно понимать следующее:

а. теоретические и экспериментальные зависимости не обязаны совпадать;

б. никакая экспериментальная зависимость не является абсолютно достоверной, так как всегда могут при дополнительных измерениях найтись точки, изменяющие картину; степень достоверности зависит от количества данных (и распределения их в диапазоне измерений) и их погрешностей;

в. с помощью эксперимента нельзя доказать или проверить теорию, ибо экспериментальные данные могут лишь свидетельствовать в пользу той или иной теоретической модели, поэтому принято говорить о степени согласия с теорией или выдвинутой статистической гипотезой.

Например, неверно: «Полученные данные доказывают справедливость закона...».

Нужно: «Полученные данные находятся в хорошем (удовлетворительном, плохом) согласии с законом...».

5. Описание результатов, полученных из графиков или другими методами, а также их погрешностей с указанием, как эти погрешности рассчитывались. При этом необходимо указать характер погрешности: случайный, систематический, ошибки репрезентативности.

6. Обсуждение источников погрешностей. Необходимо попытаться найти реальную причину неточностей в методике статистического исследования.

7. Обсуждение согласия теории (если такая имеется) и статистического исследования. Необходимо обязательно указать, совпали ли результаты в пределах погрешности или нет. Здесь необходимо также высказать своё мнение, и допустимы неточные оценки: «удовлетворительно согласуется, находится в хорошем согласии, не согласуется» и т.д.

Заключение чаще всего пишется в безличной форме, например: «В данной работе исследовалась зависимость …». Не рекомендуется писать от первого или третьего лица. Необходимо строго соблюдать единый стиль изложения, недопустимо использовать чрезмерно усложнённые грамматические конструкции, пытаться все заключение написать одним предложением, нарушать последовательность изложения и делать смысловые разрывы в тексте.

В заключение не принято вставлять таблицы с результатами измерений, допустимы лишь небольшие таблицы с окончательными результатами. Недопустимо вклеивать в заключение графики и иллюстрации. На них можно и нужно ссылаться.

Результат необходимо сравнивать с табличными или теоретическими значениями, если таковые имеются. Не допустимо представлять экспериментальные и табличные значения в разных системах единиц. Необходимо также обсуждать в заключении расхождение в результатах статистического исследования и теоретических значений. Для простоты сравнения результаты должны быть представлены в одинаковом виде.

Лабораторная работа N1. «Предварительная обработка статистических данных. Представление статистических данных в виде таблиц и диаграмм».

Цель: осуществлять группировку статистических данных по грузоперевозкам по железным дорогам РФ по качественным и количественным признакам, а затем представить результаты статистического анализа в виде таблиц и диаграмм.

В первой лабораторной работе по курсу «Статистика», имеющей вводный характер, студенты учатся:

  1. оценивать данные с точки зрения их пригодности для статистического исследования;
  2. подготавливать данные для дальнейшей статистической обработки;
  3. проводить анализ признаков статистической совокупности;
  4. осуществлять группировку статистических данных по качественным и количественным признакам;
  5. представляют результаты статистического анализа в виде статистических таблиц и диаграмм.

Задание 1.

В качестве статистической совокупности используется база (или часть базы) РЖД по грузоперевозкам различными организациями в РФ, заданная в формате Microsoft Excel.

Перед началом работы необходимо открыть базу РЖД и сформировать свой собственный вариант задания. Для этого каждый студент получает свой собственный номер на основании списка группы, а затем свой вариант базы и задания.

Внимание!Перед началом работы необходимо удостовериться, что c функции Автофильтр (в меню Данные -> Фильтр ->) снят флажок (галочка). В дальнейшем не оставлять включенный Автофильтр, т.к. он будет искажать результаты.

Для заполнения таблицы b необходимо записать признаки, которые являются статистическими, и рассчитать их характеристики.

Рис.1 Функция «Автофильтр».

 

Для выяснения числа вариантов для признака «тип собственности» следует воспользоваться функцией «автофильтр». Для чего выделить столбец с типами собственности и затем включить эту функцию. Кликнув по кнопке (рис.1) можно получить окно, в котором будут перечислены все типы собственности в данной базе.

 

Для определения «Числа ед. совокупности, у которых проявляется признак» необходимо убрать автофильтром все пустые строки и сосчитать оставшиеся. Для счета строк используется функция в правом нижнем углу интерфейса

 

Рис.1.а

 

или воспользоваться функцией СЧЕТ:

 

Рис.2 Вызов встроенной функции.

 

Для этого кликнуть по значку функции указанной на рисунке 2. Возникнет окно, указанное на рисунке 3. Выбрать функцию СЧЕТ. Изучить ее параметры (аргументы). Полезно нажимать на кнопку рис.4, чтобы свернуть окно для последующего ввода аргументов, например, диапазона суммирования или счета. Некоторые аргументы могут не заполняться, если вам это не нужно. После введения диапазона счета в окне должна появиться запись наподобие рис.5.

 

 

Рис.3 Параметры функции СЧЕТ.

 

 

 

Рис.4 Ввод значений в функцию СЧЕТ.

 

 

Рис.5 Ввод значений с помощью выделения нужного столбца.

После введения диапазона счета нажать Enter. В окне будет мелким шрифтом дано число строк.

 

 

Рис.6. Результат счета.

 

Затем необходимо заполнить строку «единица измерения», т.е ввести натуральную размерность или натуральные измерители: человек, тонн, штук, и т. д.

Далее, воспользовавшись функциями MIN и MAX, найти минимальные и максимальные значения по каждому признаку. Можно также воспользоваться «автофильтром», но мы рекомендуем использовать функции.

Окончательно для данного задания необходимо просуммировать значения по каждому признаку, воспользовавшись функцией СУММ.

 

Задание 2.

В задании 2 необходимо первоначально заполнить столбец с типами собственности, копируя названия типов собственности из исходных данных. В противном случае, если набирать текст «вручную», будут возникать ошибки при задании ссылок на эти типы. Затем заполните второй столбец, используя функцию СЧЕТЕСЛИ.

Для этого поставьте в таблице 2 в первой рабочей ячейке второго столбца знак «равно» и, вызвав функцию, заполните диапазон суммирования по столбцу «тип собственности» в исходных данных, а для критерия сделайте ссылку на «тип собственности» в таблице задания 2. После нажатия Enter в таблице появится значение.

Далее эту процедуру можно не повторять, т.к. достаточно скопировать эту ячейку по всему столбцу вниз. Перед копированием необходимо зафиксировать значения диапазона суммирования знаком «доллар», например:

=СЧЁТЕСЛИ('Исходные данные'!M$2:M$640;C15).

 

Просуммировать весь столбец. ИТОГО предприятий должно быть равно числу, заданному для вашего варианта.

Теперь нужно заполнить столбец с долями предприятий от общего их числа. Для этого в первой ячейке написать формулу для доли:

Доля = количество предприятий с данной формой собственности/количество всех предприятий.

Значения должны быть в процентах. В противном случае правой кнопкой мыши вызвать формат ячейки и ввести формат «процентный»:

 

Рис. 7 Изменение формата ячейки.

 

В следующем столбце рассчитать суммарное значение признака, используя функцию СУММЕСЛИ. Само значение, по которому ведется суммирование, задается преподавателем. Обычно это «число работников». В качестве диапазона прохода можно взять диапазон из столбца собственности, критерий «тип собственности» из первого столбца таблицы, а диапазон суммирования из столбца «численность работников».

Должно получиться следующее:

 

=СУММЕСЛИ('Исходные данные'!M$2:M$640;C15;'Исходные данные'!N$2:N$640)

 

Далее заполняем столбец «среднее значение признака», деля число работников для фирм данного типа собственности на число предприятий с данным типом собственности.

Наконец заполняем столбец «доля» (доля работников при данном типе собственности от общего числа работников, например, =F15/F$26).

Построить диаграммы:

1. Круговая диаграмма для распределения предприятий по типу собственности

  1. Лепестковая диаграмма для распределения среднего значения ________________ по типу собственности
  2. Линейчатая диаграмма для распределения среднего значения _________________ по типу собственности

Для этого воспользоваться в меню «ВСТАВКА» опцией ДИАГРАММА или ГИСТОГРАММА.

Задание 3.

Представить данные для анализа распределения предприятий по количественному признаку в виде простой группировки данных по численности работников. Т.е., например, получить зависимость величины грузоперевозок от численности работников (производительность труда). Для этого надо разбить численность работников на интервалы. Воспользуйтесь формулой Стерджесса:

K=1+3,322 lgN,

где k - число групп (интервалов),

N – число единиц в совокупности ( данном случае число работников).

Ширина интервала определяется как: Δx=(Xmax-Xmin)/k.

Представить результаты анализа распределения предприятий по заданному признаку в виде столбиковой диаграммы.

 

Контрольные вопросы.

1. Что такое массовое явление?

2. Что такое статистическая совокупность?

3. Какие закономерности называют статистическими?

4. Какими бывают количественные статистические признаки?

5. Какими бывают качественные статистические признаки?

6. Каковы стадии статистического исследования?

7. Как называются показатели, достижение которых прогнозируется в будущих периодах?

8. Как называют абсолютные величины, которые получаются, как правило, путем суммирования отдельных индивидуальных величин?

9. Для чего нужны условно натуральные единицы измерения?

10. К какому типу относительных величин относится уровень производительности труда (выпуск продукции на одного работника или в единицу рабочего времени)?

11. К какому типу относительных величин относится число городских жителей, приходящихся на 100 сельских жителей?


 

Задание 1. Обобщение данных об объёмах продаж каждого вида продукции.

Откройте лист с заданием 1. В ячейки столбца А введите названия консервов из вашего варианта.

Столбец «количество проданных единиц» необходимо заполнить данными в условных банках. Для этого возьмите объем одной условной банки у.б.=125см3.

Затем после последнего столбца в данных вашего варианта сделайте ещё один столбец «количество у.б.» и рассчитайте значения по формуле = количество единиц * объем одной банки / объем условной банки.

Скопируйте формулу на весь столбец.

Внизу таблицы первого задания сделайте строку итого,и просуммируйте количество всех условных банок.

В третьем столбце C рассчитайте объем продаж в рублях по каждому виду товара, для этого воспользуйтесь формулой суммесли,например:

 

1. Поставьте знак равенства в ячейку таблицы 1 задания 1.

2. Вызовите функцию суммесли.

3. Перейдите в закладку (лист) вашего варианта и выделите основной столбец, например, А.

4. Вернитесь в таблицу и введите в функцию условие, кликнув по соответствующей ячейке, затем вернитесь в вариант данных и выделите столбец, который вы собираетесь суммировать. У вас должно получиться следующее значение ячейки:

суммесли (вар1!A2:A511;A5;вар1!G2:G511).

5. Закрепите значения с помощью знака доллар:

суммесли (вар1!A$2:A$511;A5;вар1!G$2:G$511).

6. Нажмите кнопкуОкв форме функциисуммесли.

7. В ячейке таблицы 1 должно появиться значение объема продаж для данного товара (условия).

8.Скопируйте формулу во все ячейки столбца вашей таблицы.

9. Внизу столбца введите сумму итого.

 

В четвертом столбце D рассчитайте структуру проданных единиц в у.б. как долю у.б. данного товара ко всему количеству у.б. в процентах.

В пятом столбце Е рассчитайте структуру проданных единиц, как долю проданного (в рублях), данного, товара ко всему количеству выручки в процентах.

В шестом столбце нужно рассчитать цену одной условной банки для каждого вида товара, как отношение всей выручки по данному виду консервов к количеству условных банок этого продукта.

Окончательно нужно рассчитать среднюю цену одной условной банки, как весь объем продаж, деленный на все условные банки.

Задание 2. Вычисление среднего времени оплаты счета каждым покупателем.

Во втором задании первый столбец таблицы заполните покупателями из таблицы исходных данных. Для этого можно воспользоваться автофильтром в меню «Данные».

Второй столбец заполните количеством счетов по каждому покупателю. Для этого можно воспользоваться функцией счетесли.При этомориентируйтесь на методику, изложенную в первом задании для функции суммесли.

Третий столбец заполните значением суммы счетов в рублях по каждому покупателю. Воспользуйтесь функцией суммесли.

Для заполнения четвертого столбца необходимо создать вспомогательный столбец в окне исходных данных (вслед за столбцом условных банок). По каждой строке вычтите из даты оплаты счета дату выставления счета. Например, =F2-E2. Формат ячейки должен быть общий. И, наконец, воспользовавшись функцией суммеслинайдите Суммарное время оплаты счетов в суткахпо каждому покупателю.

Например:

=СУММЕСЛИ(вар1!D$2:D$511;A5;вар1!K$2:K$511). Скопируйте формулу во все ячейки столбца.

В следующем столбце найдите Среднее время оплаты счета, сутки (ti). Очевидно, как суммарное время, деленное на количество счетов.

Найдите Сумму произведений времени оплаты счета на его величину (цену) . Для этого создайте столбец в данных, в котором умножьте стоимость одной закупки (величину счет) на время оплаты этого счета. Затем воспользуйтесь формулой суммесли,например,

=СУММЕСЛИ(вар1!D$2:D$511;A5;вар1!M$2:M$511).

 

В последнем столбце найдите средневзвешенное время оплаты счета по формуле:

.

В конце постройте диаграммы среднего и средневзвешенного времен.

Выберите лучшего покупателя и обоснуйте ваше решение в виде небольшого заключения к работе.

 

Контрольные вопросы.

1. Какие типы средних величин Вы знаете?

2. Для чего используются структурные средние?

3. Что такое доля?

4. Что такое процентиль и как его подсчитать?

5. Как найти моду для ряда с неравновеликими интервалами?

6. Чему равна медиана в квартилях, квинтилях и процентилях?

7. Как найти интерквартильную широту?

8. Чем отличается частость от частоты?


Задание 1. Проверка правила суммы дисперсий.

Рассмотрим проведение дисперсионного анализа имеющихся данных, например, для варианта 1: требуется выяснить зависит ли цена от типа дома.

Заполните первую таблицу. Для этого перенесите таблицу 1 из отчета на лист «Предобработанные данные». Затем необходимо:

1. Сделать группировку для своего варианта, например, по типам домов.

2. Найти число единиц в каждой конкретной группе с помощью функции счетесли.

3. Найти суммарное значение цены (в зависимости от варианта) функцией суммесли.

Для этого сделать отдельный столбец в листе данных своего варианта, в котором необходимо перемножить количество жилой площади, проданной риэлторами, на цену одного метра квадратного жилой площади.

4. Найти групповые средние делением стоимости домов данной группы на число единиц в данной группе.

5. Заполнить строку ИТОГОдля числа единиц совокупностии суммарного значения признака.

Далее:

1. Найти групповые дисперсии. С помощью автофильтра выбрать дома конкретной группы и скопировать столбцы в отдельную, заранее сделанную закладку (лист «вспомогательные функции»). У вас получатся столбцы, для которых и нужно подсчитать сумму квадратов отклонений значений в столбцах от частного среднего по группе – частную групповую дисперсию.

Для этого рекомендуется сделать по отдельности столбец разностей (X-Xсреднее) и столбец квадрата этой скобки. Затем посчитать сумму по столбцу квадратов и разделить на число домов в данной группе.

Повторить процедуру для всех типов домов. В результате вы будете иметь все групповые дисперсии. Занесите их в соответствующий столбец отчета и в такой же столбец листа «предобработанных данных» Microsoft Excel.

1а.Сделайте дополнительный столбец в таблице 1, в котором вычислите произведение групповых дисперсий на число домов в группе. Внизу столбца получите сумму.

Перенесите из отчета таблицу дисперсий на лист «предобработанных данных» Microsoft Excel.

2. Найти общее среднее. Для этого выбрать отдельную ячейку в таблице дисперсий на листе «предобработанных данных» и разделить в ней суммарное значение признака (ИТОГО) из таблицы 1 на общее число домов.

3. Найти общую дисперсию.Для этого на листе вашего варианта создать столбец (X-Xсреднее общее) и рядом его квадрат для всех домов. Затем посчитать сумму по столбцу квадратов и разделить на число всех домов.

4. Найти внутригрупповую дисперсию.Для этого сумму из пункта 1а разделите на полное число домов.

5. Найти межгрупповую дисперсию.Для этого в таблице 1 нужно сделать ещё один столбец разностей (Хсреднее групповое - Xсреднее общее) и столбец квадрата этой скобки, умноженной на число домов в группе. Затем посчитать сумму по столбцу квадратов, умноженных на число домов в группе, и разделить на число всех домов.

6. Проверить правило сложения дисперсий.Для этого сложить в последней ячейке таблицы дисперсий межгрупповую и внутригрупповую дисперсии. Сумма должна равняться общей дисперсии. Если это не так, то следует искать ошибку!!!

 

Задание 2. Однофакторный дисперсионный анализ.

1. Заполнить таблицы дисперсионного анализа в отчете.

2. Рассчитать Эмпирический коэффициент детерминации, hэмп2 и Эмпирическое корреляционное отношение, hэмп. .

3. Определить какую долю вариации результирующего признака определяет исследуемый факторный признак.

4. Определить степень связи между результирующим и факторным признаками.

5. Провести дисперсионный анализ. Воспользоваться распределением Фишера. Выбрать уровень значимости a и формулу для расчёта статистики критерия.

 

Задание 3. Расчёт показателей вариации.

Рассчитать показатели вариации для каждого типа дома и занести их в таблицу.

Необходимо обратить внимание, что линейным коэффициентом вариации называют отношение среднего линейного отклонения к среднему значению, а выборка считается однородной, если коэффициент вариации не превышает 33%.

 

Контрольные вопросы.

1. В чем смысл нулевой гипотезы в этой работе? Что в результате проверяется?

2. Может ли расчетное значение статистики критерия совпасть с теоретическим (табличным) значением?

3. Что такое уровень значимости?

4. Что такое степень свободы?

5. Для чего дисперсию делят на число степеней свободы?

6. Что такое остаточная дисперсия?

7. Что такое смещенная оценка?

8. Как получить несмещенную оценку?

9. Как рассчитывается среднее линейное отклонение?

10. Какова связь между коэффициентом линейной корреляции и эмпирическим корреляционным соотношением?


Задание 1. Выявление основной тенденции ряда.

Сгладить ряд различными методами и показать на графиках исходный и укрупнённый ряды.

a. Метод укрупнения интервалов

Укрупнить исходный ряд в k = 3 раза. Для этого первоначально необходимо выяснить к какому из типов рядов относится данный ряд, к моментному или интервальному.

В дальнейшем вычисляется сумма из определенного числа первых по порядку уровней ряда, например, трех, затем — сумма из такого же числа уровней, начиная с четвертого, далее — начиная с седьмого, и т.д. Во вторую и третью ячейку ставится либо ноль, либо значение первой ячейки, аналогично в пятую и шестую ячейки ставится значение четвертой или ноль, а так же в восьмую и девятую значение седьмой или ноль. Различие будет только в графическом изображении.

Построить на одном графике исходный и укрупненный ряды.

в. Метод скользящей средней

Сгладить ряд методом скользящей средней с шириной окна: k = 5.

Сгладить ряд методом скользящей средней с шириной окна: k = 12.

Для удобства работы скопировать исход

Последнее изменение этой страницы: 2016-07-22

lectmania.ru. Все права принадлежат авторам данных материалов. В случае нарушения авторского права напишите нам сюда...