Категории: ДомЗдоровьеЗоологияИнформатикаИскусствоИскусствоКомпьютерыКулинарияМаркетингМатематикаМедицинаМенеджментОбразованиеПедагогикаПитомцыПрограммированиеПроизводствоПромышленностьПсихологияРазноеРелигияСоциологияСпортСтатистикаТранспортФизикаФилософияФинансыХимияХоббиЭкологияЭкономикаЭлектроника |
Припущення, на яких базується дисперсійний аналізПрипущення 1. Величина у - нормально розподілена випадкова величина з центром розподілу і з дис-персією . Це вимоги стаціонарності зміни випадкової величини у. Таким чи-ном, фактори визначають величину у лише в середньому, залишаючи прос-тір для випадкових помилок спостережень, які підпорядковуються нор-мальному закону. Припущення 2. Дисперсія одиничного спостереження , обу-мовлена випадковими помилками, постійна в усіх дослідженнях і не зале-жить від , тобто дисперсії будуть дорівнювати од-на одній при j = 1,2…,N, а їх вибіркові оцінки будуть однорідні - це умова відтворення дослідів. Кожне із цих припущень необхідно перевіряти по результатам дос-ліджувального експерименту. З даних задачі та зазначених припущень зрозуміло, що чим більший вплив деякого фактора х на вихідний параметр у , тим більше розходження між собою середніх арифметичних серій паралельних спостережень, зроблених при різних сполученнях рівнів варіювання досліджуваних факторів. Статистична значимість такого розходження вказує на суттєвий вплив факторів. При двох серіях спостережень порівняння середніх і перевірка нуль-гіпотези здійснюються за допомогою t-критерію методом Ст’юдента. В сформульованій задачі вимагається одночасно довільно порівняти велику кількість середніх і на основі цього зробити висновок про значимість впливу того чи іншого фактора.
Ідея дисперсійного аналізу Щоб мати можливість оцінити вплив кожного фактора на вихідний параметр і порівняти вплив різних факторів, визначимо деякий показник цього впливу. Нехай за відсутності помилок досліду при варіюванні фак-тора х на різних рівнях отримані фактичні значення вихідного параметру у. Тоді в якості показника впливу фактора х приймаємо величину, яку називають, по аналогії зі звичайною, дисперсією фактора х, тобто
(2.1)
де . При цьому треба мати на увазі, що числа уі не є випадковими і тому дисперсія не пов’язана ні з якою випадковою величиною, так як ми припускаємо, що . Вивчати вплив факторів по величинам їх дисперсій зручно, оскільки це простіша міра розсіювання, і до того ж аналогічна мірі впливу фактора випадкових причин, тобто аналогічна дисперсії одиничного спостереження (відтворення) . Завдяки цьому є можливість порівнювати вплив будь-якого досліджуваного і випадкового факторів. Таке дослідження факторів по їх дисперсіях називається дисперсійним аналізом. Цей аналіз був вве-дений в 20-х роках нашого сторіччя Р.А. Фішером і розвинений Йєйтсом. Розглянемо ідею дисперсійного аналізу на прикладі вивчення впливу одного фактора на фоні випадкових похибок, коли дисперсія відтворення відома. При варіюванні фактора х на u рівнях в результаті спостережень отримаємо значення , розсіювання яких можна характеризувати вибірковою дисперсією: (2.2) з числом мір свободи . Якщо різниця між s2 і σ2 незначна, то з цього випливає, що розкид спостережень, який зумовлений цією різницею, зв’язаний лише з випад-ковими причинами. Тому вплив фактора х незначний, якщо різниця між s2 і σ2 значна, то підвищений розкид спостережень викликаний не лише ви-падковими причинами. Цей розкид спостережень також викликаний впли-вом фактора х, який тепер необхідно визначити суттєвим. Оскільки в останньому випадку додаються впливи двох незалежних факторів - випадкових причин (з дисперсією s2) і фактора х (з дисперсією sх2), що призводить до загального розсіювання спостережень, то загальна дисперсія буде сумою двох вище вказаних , а її оцінка буде . (2.3) Тому дисперсія фактора визначається за виразом (2.4) У загальному випадку, коли дисперсія відтворення s2 невідома, схема дисперсійного аналізу повинна дозволити знайти її оцінку поряд з оцінками дисперсій досліджуваних факторів. З цією метою планується проведення серій дублюючих дослідів по кожному з усіх можливих сполучень рівнів досліджуваних факторів. Таким чином, основна ідея дисперсійного аналізу полягає в розкладенні загальної дисперсії s2 на складові, які залежать від випадкових причин, від кожного з розглянутих факторів і по їх взаємодії окремо, а також в оцінці статистичної значимості дисперсій останніх з урахуванням похибки відтворення досліду. Розглянемо лише найпростіші способи застосування дисперсійного аналізу, техніка проведення якого доволі різноманітна.
Однофакторний аналіз Розглянемо вплив лише одного фактора х. В таблиці 2.1 записані результати експерименту (u m) спостере-жень . Індекс j - порядковий номер рівня варіювання фактора, l - по-рядковий номер дублюючого досвіду в серії на кожному j-му рівні, (для спрощення розрахунків, не порушуючи загальсті висновків, розглянемо спочатку випадок рівнокількісних спостережень на всіх рівнях, тобто m1= m2=…= mj=…= mu=m). За такого розташування спостережень розсіювання між стовпцями буде визначатися помилкою відтворення, а розсіювання між рядками - додатковою дією досліджуваного фактора. Розрахуємо середнє арифметичне серій із m повторних спостережень для кожного j-го рівня фактора (2.5) і загальне середнє арифметичне у всіх u·m спостережень за всіма u рівнями (2.6) Розсіювання окремих спостережень відносно загального середнього обумовлено дією випадкових причин і впливом факторів. Дія фактора випадковості проявляється (з дисперсією s2 ) в розсіюванні спостережень серій дублюючих дослідів на кожному рівні х навколо середнього арифметичного своєї серії. Таблиця 2.1 - Результати експерименту
Продовження таблиці 2.1
Вплив фактора х (з дисперсією sх2) викликає підвищене розсію-вання середніх серій відносно загального середнього. Кожне з цих трьох розсіювань можна охарактеризувати відповідною сумою квадратів відхи-лень. Розкладання сум квадратів У відповідності з основною ідеєю дисперсійного аналізу розкладемо суму квадратів відхилень спостережень від загального середнього на дві складові суми, одна з яких буде характеризувати вплив фактора випадковості, а друга - фактора мінливості х.
(2.7) , оскільки , (2.8) а , як сума відхилень спостережень j-ї серії від середнього тієї ж серії, де (2.9) - “загальна” сума квадратів відхилень окремих спостережень від загального середнього . Ця сума характеризує розсіювання спостережень в результаті дії обох факторів як випадковості (з дисперсією s2), так і досліджуваного x (з дисперсією s2). (2.10) - сума квадратів відхилень "в середині серій", тобто сума квадратів роз-ходжень між окремими спостереженнями і середнього відповідної серії. Ця сума характеризує залишкове розсіювання випадкових похибок досвіду, тобто їхнє відтворення (з дисперсією s2). (2.11) - сума квадратів відхилень "між серіями" або розсіювання за рівнями, тобто взважена (з урахуванням кількості спостережень в кожній серії) сума квадратів різниць між середнім окремих серій і загальним середнім по всій сукупності спостережень. Сума характеризує розсіювання середніх серій за рахунок випадкових причин (з дисперсією для середніх серій) і досліджуваного фактора (з дисперсією ).
Оцінка дисперсій Припустимо, що вплив фактора x на вихідний параметр буде від-сутній, тобто нуль-гіпотеза про однорідність вірна. Тоді всі серії паралельних спостережень можна розглядати як випадкові вибірки з однієї і тієї ж нормальної сукупності і, отже: 1) не зміщена загальна оцінка дисперсій відновлення s2 за всіма u·m спостереженнями визначається з виразу (2.12) з кількістю ступеней свободи 2) вибіркова дисперсія розсіювання "в середині серій", або залиш-кова оцінка дисперсії відновлення s2 знаходиться як середнє з вибіркових дисперсій за кожною серією окремо (2.13) з кількістю ступеней свободи 3) вибіркова дисперсія розсіювання між середніми серій є не зміще-ною оцінкою дисперсії , а нормально розподілені (незалежні одна від іншої) середні серій:
(2.14) з кількістю ступеней свободи Звідси легко отримуємо третю оцінку дисперсії відновлення, вибіркову дисперсію розсіювання "між серіями": (2.15) з кількістю ступеней свободи Кількість ступеней свободи перевіряється зі співвідношенням 4) В результаті більш глибокого аналізу можна довести, що S0 і Sx незалежні один від одного. Зі сказаного видно, що через відсутність впли-ву фактора x вибіркові оцінки s2, і sx однорідні, оскільки є оцінками однієї і тієї ж генеральної дисперсії s2. Припустимо тепер, що вплив фактора x на вихідний параметр істотний, тобто нуль-гіпотеза про однорідність вірна. Тоді серії паралельних спостережень можна розглядати як випадкові вибірки u незалежних нормально розподілених випадкових величин з однією і тією ж дисперсією s2 та різними центрами розподілу . Отже: 1) вибіркова дисперсія s2 характеризує вплив як фактора випадковості, так і фактора x, тобто ; (2.16) 2) оскільки сума S0 не змінюється при заміні на то вибіркова дисперсія також не змінюється і так само є не зміщеною оцінкою для s2, тобто (2.17) 3) оскільки сума Sx враховує не тільки випадкові, але й систематичні розходження між середніми серій і збільшується за рахунок впливу фактора x, то дисперсія при цьому також збільшується і перестає бути оцінкою тільки для , тобто Тому легко отримуємо (2.18) 4) незалежність S0 і Sx один від іншого зберігається. Таким чином, для дисперсії фактора x тепер можна дати дві наближені оцінки (2.19) (2.20) Перша оцінка менш точна через похибки величин s2 і . Точність другої вище, оскільки дисперсії, які входять в неї, поділені на m. Виходячи з другого припущення зрозуміло, що за умови впливу фактора x вибіркові оцінки s2, , sx неоднорідні. Отже, зіставляючи ці ви-біркові дисперсії, можна прийняти рішення про справедливість першого або другого припущення щодо значимості впливу фактора x (з дисперсією ) на вихідний параметр. З огляду на точність виразів (2.19), (2.20), для оцінки будемо порівнювати дисперсії і .
Оцінка впливу фактора Для того щоб вплив фактора x був значним необхідно і до-сить, щоб дисперсія значно відрізнялася від . Перевірку нуль-гіпо-тези щодо однорідності цих вибіркових оцінок можна здійснити за допо-могою критерію (2.21) Якщо обчислене за результатами спостережень дисперсійне відношення F переважає табличне Fq(nx, n0) за розподілом Фішера, для обраного рівня значимості q за відповідних ступеней свободи nx і n0, то вплив фактора x визнається значним , і навпаки - незначним , якщо У дисперсійному аналізі перевіряють нуль-гіпотезу за альтернативи тому користуються одностороннім F-критерієм. При цьому звичайно вибирають рівень значимості q = 0,05. Варто мати на увазі, що дисперсійний аналіз спостережень експерименту дозволяє визначати вплив фактора лише в цілому, не даючи кількісних оцінок цього впливу. Також варто пам’ятати, що висновки, отримані з його допомогою, відносяться лише до даного звітного матеріалу, за даної його систематизації. Так, наприклад, за зміни діапазону варіювання досліджуваного фактора х, оцінка впливу х буде мінятися. Якщо вплив фактора x вважається незначним, то дисперсію відновлення s2 можна оцінити вибірковою загальною дисперсією s2, що має на u-1 ступінь свободи більше, ніж . Якщо ж вплив фактора x вважається значним, то за результатами спостережень можна оцінити: 1) дисперсію відновлення s2 вибіркової залишкової дисперсії тобто (2.22) і визначити довірчий інтервал для s2 за c-розподілом з u·(m-1) ступенями свободи, 2) дисперсію фактора x за формулою , (2.23) 3) розбіжність центрів серій, обумовлену впливом фактора x. Оскільки (2.24) то можна показати, що (2.25) де і тоді (2.26) Оцінкою величини буде вибіркова характеристика (2.27) 4) розбіжність між центрами будь-яких двох серій. Оскільки параметр (2.28) відповідає розподілу Ст’юдента з кількістю ступенів свободи то інтервал (2.29) буде довірчим (1-q)% інтервалом для .
|
|||||||||||||||||||||||||
Последнее изменение этой страницы: 2016-08-20 lectmania.ru. Все права принадлежат авторам данных материалов. В случае нарушения авторского права напишите нам сюда... |