Главная Случайная страница


Категории:

ДомЗдоровьеЗоологияИнформатикаИскусствоИскусствоКомпьютерыКулинарияМаркетингМатематикаМедицинаМенеджментОбразованиеПедагогикаПитомцыПрограммированиеПроизводствоПромышленностьПсихологияРазноеРелигияСоциологияСпортСтатистикаТранспортФизикаФилософияФинансыХимияХоббиЭкологияЭкономикаЭлектроника






Припущення, на яких базується дисперсійний аналіз

Припущення 1. Величина у - нормально розподілена випадкова

величина з центром розподілу і з дис-персією .

Це вимоги стаціонарності зміни випадкової величини у. Таким чи-ном, фактори визначають величину у лише в середньому, залишаючи прос-тір для випадкових помилок спостережень, які підпорядковуються нор-мальному за­кону.

Припущення 2. Дисперсія одиничного спостереження , обу-мовлена випадковими помилками, постійна в усіх дослідженнях і не зале-жить від , тобто дисперсії будуть дорівнювати од-на одній при j = 1,2…,N, а їх вибіркові оцінки будуть однорідні - це умова відтворення дослідів.

Кожне із цих припущень необхідно перевіряти по результатам дос-ліджувального експерименту.

З даних задачі та зазначених припущень зрозуміло, що чим більший вплив деякого фактора х на вихідний параметр у , тим більше розходження між со­бою середніх арифметичних серій паралельних спостережень, зроблених при різних сполученнях рівнів варіювання досліджуваних факторів. Статистична значимість такого розходження вказує на суттєвий вплив факторів.

При двох серіях спостережень порівняння середніх і перевірка нуль-гіпотези здійснюються за допомогою t-критерію методом Ст’юдента. В сформульованій задачі вимагається одночасно довільно порівняти велику кількість середніх і на основі цього зробити висновок про значимість впливу того чи іншого фактора.

 

Ідея дисперсійного аналізу

Щоб мати можливість оцінити вплив кожного фактора на вихідний параметр і порівняти вплив різних факторів, визначимо деякий показник цього впливу.

Нехай за відсутності помилок досліду при варіюванні фак-тора х на різних рівнях отримані фактичні значення вихідного параметру у. Тоді в якості показника впливу фактора х приймаємо величину, яку називають, по аналогії зі звичайною, дисперсією фактора х, тобто

 

(2.1)

 

де

.

При цьому треба мати на увазі, що числа уі не є випадковими і тому дисперсія не пов’язана ні з якою випадковою величиною, так як ми припускаємо, що .

Вивчати вплив факторів по величинам їх дисперсій зручно, оскільки це простіша міра розсіювання, і до того ж аналогічна мірі впливу фактора випадкових причин, тобто аналогічна дисперсії одиничного спостереження (відтворення) . Завдяки цьому є можливість порівнювати вплив будь-якого досліджуваного і випадкового факторів. Таке дослідження факторів по їх дисперсіях називається дисперсійним аналізом. Цей аналіз був вве-дений в 20-х роках нашого сторіччя Р.А. Фішером і розвинений Йєйтсом.

Розглянемо ідею дисперсійного аналізу на прикладі вивчення впливу одного фактора на фоні випадкових похибок, коли дисперсія відтворення відома. При варіюванні фактора х на u рівнях в результаті спостережень отримаємо значення , розсіювання яких можна характеризувати вибірковою дисперсією:

(2.2)

з числом мір свободи .

Якщо різниця між s2 і σ2 незначна, то з цього випливає, що розкид спостережень, який зумовлений цією різницею, зв’язаний лише з випад-ковими причинами. Тому вплив фактора х незначний, якщо різниця між s2 і σ2 значна, то підвищений розкид спостережень викликаний не лише ви-падковими причинами. Цей розкид спостережень також викликаний впли-вом фактора х, який тепер необхідно визначити суттєвим.

Оскільки в останньому випадку додаються впливи двох незалежних факторів - випадкових причин (з дисперсією s2) і фактора х (з дисперсією sх2), що призводить до загального розсіювання спостережень, то загальна дисперсія буде сумою двох вище вказаних , а її оцінка буде

. (2.3)

Тому дисперсія фактора визначається за виразом

(2.4)

У загальному випадку, коли дисперсія відтворення s2 невідома, схема дисперсійного аналізу повинна дозволити знайти її оцінку поряд з оцінками дисперсій досліджуваних факторів. З цією метою планується проведення серій дублюючих дослідів по кожному з усіх можливих сполучень рівнів досліджуваних факторів.

Таким чином, основна ідея дисперсійного аналізу полягає в розкладенні загальної дисперсії s2 на складові, які залежать від випадкових причин, від кожного з розглянутих факторів і по їх взаємодії окремо, а також в оцінці статистичної значимості дисперсій останніх з урахуванням похибки відтворення досліду.

Розглянемо лише найпростіші способи застосування дисперсійного аналізу, техніка проведення якого доволі різноманітна.

 

Однофакторний аналіз

Розглянемо вплив лише одного фактора х.

В таблиці 2.1 записані результати експерименту (u m) спостере-жень . Індекс j - порядковий номер рівня варіювання фактора, l - по-рядковий номер дублюючого досвіду в серії на кожному j-му рівні, (для спрощення розрахунків, не порушуючи загальсті висновків, розглянемо спочатку випадок рівнокількісних спостережень на всіх рівнях, тобто m1= m2=…= mj=…= mu=m).

За такого розташування спостережень розсіювання між стовпцями буде визначатися помилкою відтворення, а розсіювання між рядками - додатковою дією досліджуваного фактора.

Розрахуємо середнє арифметичне серій із m повторних спостережень для кожного j-го рівня фактора

(2.5)

і загальне середнє арифметичне у всіх u·m спостережень за всіма u рівнями

(2.6)

Розсіювання окремих спостережень відносно загального середнього обумовлено дією випадкових причин і впливом факторів. Дія фактора випадковості проявляється (з дисперсією s2 ) в розсіюванні спостережень серій дублюючих дослідів на кожному рівні х навколо середнього арифметичного своєї серії.

Таблиця 2.1 - Результати експерименту

l дублюючого досліду номер j рівня фактора х 1 2 … lm
y11 y12 … y1l … y1m
y21 y22 … y2l … y2m
...
j yj1 yj2 … yjl … yjm

Продовження таблиці 2.1

u yu1 yu1 … yul … yum
   

 

Вплив фактора х (з дисперсією sх2) викликає підвищене розсію-вання середніх серій відносно загального середнього. Кожне з цих трьох розсіювань можна охарактеризувати відповідною сумою квадратів відхи-лень.

Розкладання сум квадратів

У відповідності з основною ідеєю дисперсійного аналізу розкладемо суму квадратів відхилень спостережень від загального середнього на дві складові суми, одна з яких буде характеризувати вплив фактора випадковості, а друга - фактора мінливості х.

 

(2.7)

,

оскільки

, (2.8)

а

,

як сума відхилень спостережень j-ї серії від середнього тієї ж серії, де

(2.9)

- “загальна” сума квадратів відхилень окремих спостережень від загального середнього . Ця сума характеризує розсіювання спостережень в результаті дії обох факторів як випадковості (з дисперсією s2), так і досліджуваного x (з дисперсією s2).

(2.10)

- сума квадратів відхилень "в середині серій", тобто сума квадратів роз-ходжень між окремими спостереженнями і середнього відповідної серії. Ця сума характеризує залишкове розсіювання випадкових похибок досвіду, тобто їхнє відтворення (з дисперсією s2).

(2.11)

- сума квадратів відхилень "між серіями" або розсіювання за рівнями, тобто взважена (з урахуванням кількості спостережень в кожній серії) сума квадратів різниць між середнім окремих серій і загальним середнім по всій сукупності спостережень. Сума характеризує розсіювання середніх серій за рахунок випадкових причин (з дисперсією для середніх серій) і досліджуваного фактора (з дисперсією ).

 

Оцінка дисперсій

Припустимо, що вплив фактора x на вихідний параметр буде від-сутній, тобто нуль-гіпотеза про однорідність вірна. Тоді всі серії паралельних спостережень можна розглядати як випадкові вибірки з однієї і тієї ж нормальної сукупності і, отже:

1) не зміщена загальна оцінка дисперсій відновлення s2 за всіма u·m спостереженнями визначається з виразу

(2.12)

з кількістю ступеней свободи

2) вибіркова дисперсія розсіювання "в середині серій", або залиш-кова оцінка дисперсії відновлення s2 знаходиться як середнє з вибіркових дисперсій за кожною серією окремо

(2.13)

з кількістю ступеней свободи

3) вибіркова дисперсія розсіювання між середніми серій є не зміще-ною оцінкою дисперсії , а нормально розподілені (незалежні одна від іншої) середні серій:

 

(2.14)

з кількістю ступеней свободи

Звідси легко отримуємо третю оцінку дисперсії відновлення, вибіркову дисперсію розсіювання "між серіями":

(2.15)

з кількістю ступеней свободи

Кількість ступеней свободи перевіряється зі співвідношенням

4) В результаті більш глибокого аналізу можна довести, що S0 і Sx незалежні один від одного. Зі сказаного видно, що через відсутність впли-ву фактора x вибіркові оцінки s2, і sx однорідні, оскільки є оцінками однієї і тієї ж генеральної дисперсії s2.

Припустимо тепер, що вплив фактора x на вихідний параметр істотний, тобто нуль-гіпотеза про однорідність вірна. Тоді серії паралельних спостережень можна розглядати як випадкові вибірки u незалежних нормально розподілених випадкових величин з однією і тією ж дисперсією s2 та різними центрами розподілу . Отже:

1) вибіркова дисперсія s2 характеризує вплив як фактора випадковості, так і фактора x, тобто

; (2.16)

2) оскільки сума S0 не змінюється при заміні на то вибіркова дисперсія також не змінюється і так само є не зміщеною оцінкою для s2, тобто

(2.17)

3) оскільки сума Sx враховує не тільки випадкові, але й систематичні розходження між середніми серій і збільшується за рахунок впливу фактора x, то дисперсія при цьому також збільшується і перестає бути оцінкою тільки для , тобто

Тому легко отримуємо

(2.18)

4) незалежність S0 і Sx один від іншого зберігається.

Таким чином, для дисперсії фактора x тепер можна дати дві наближені оцінки

(2.19)

(2.20)

Перша оцінка менш точна через похибки величин s2 і . Точність другої вище, оскільки дисперсії, які входять в неї, поділені на m.

Виходячи з другого припущення зрозуміло, що за умови впливу фактора x вибіркові оцінки s2, , sx неоднорідні. Отже, зіставляючи ці ви-біркові дисперсії, можна прийняти рішення про справедливість першого або другого припущення щодо значимості впливу фактора x (з дисперсією ) на вихідний параметр. З огляду на точність виразів (2.19), (2.20), для оцінки будемо порівнювати дисперсії і .

 

Оцінка впливу фактора

Для того щоб вплив фактора x був значним необхідно і до-сить, щоб дисперсія значно відрізнялася від . Перевірку нуль-гіпо-тези щодо однорідності цих вибіркових оцінок можна здійснити за допо-могою критерію

(2.21)

Якщо обчислене за результатами спостережень дисперсійне відношення F переважає табличне Fq(nx, n0) за розподілом Фішера, для обраного рівня значимості q за відповідних ступеней свободи nx і n0, то вплив фактора x визнається значним , і навпаки - незначним , якщо

У дисперсійному аналізі перевіряють нуль-гіпотезу за альтернативи тому користуються одностороннім F-критерієм. При цьому звичайно вибирають рівень значимості q = 0,05. Варто мати на увазі, що дисперсійний аналіз спостережень експерименту дозволяє визначати вплив фактора лише в цілому, не даючи кількісних оцінок цього впливу. Також варто пам’ятати, що висновки, отримані з його допомогою, відносяться лише до даного звітного матеріалу, за даної його систематизації. Так, наприклад, за зміни діапазону варіювання досліджуваного фактора х, оцінка впливу х буде мінятися.

Якщо вплив фактора x вважається незначним, то дисперсію відновлення s2 можна оцінити вибірковою загальною дисперсією s2, що має на u-1 ступінь свободи більше, ніж . Якщо ж вплив фактора x вважається значним, то за результатами спостережень можна оцінити:

1) дисперсію відновлення s2 вибіркової залишкової дисперсії

тобто (2.22)

і визначити довірчий інтервал для s2 за c-розподілом з u·(m-1) ступенями свободи,

2) дисперсію фактора x за формулою

, (2.23)

3) розбіжність центрів серій, обумовлену впливом фактора x. Оскільки

(2.24)

то можна показати, що

(2.25)

де

і тоді

(2.26)

Оцінкою величини буде вибіркова характеристика

(2.27)

4) розбіжність між центрами будь-яких двох серій. Оскільки параметр

(2.28)

відповідає розподілу Ст’юдента з кількістю ступенів свободи

то інтервал

(2.29)

буде довірчим (1-q)% інтервалом для .

 

Последнее изменение этой страницы: 2016-08-20

lectmania.ru. Все права принадлежат авторам данных материалов. В случае нарушения авторского права напишите нам сюда...