Категории: ДомЗдоровьеЗоологияИнформатикаИскусствоИскусствоКомпьютерыКулинарияМаркетингМатематикаМедицинаМенеджментОбразованиеПедагогикаПитомцыПрограммированиеПроизводствоПромышленностьПсихологияРазноеРелигияСоциологияСпортСтатистикаТранспортФизикаФилософияФинансыХимияХоббиЭкологияЭкономикаЭлектроника |
Дисперсия параметра оптимизацииМы рассмотрели, как по дочитывается дисперсия ж каждом опыте, т. е. в каждой горизонтальной строке матрицы планирования. Матрица планирования состоит из серии опытов, и дисперсия всего эксперимента получается в результате усреднения дисперсий всех опытов. По терминологии, принятой в планировании эксперимента, речь идет о подсчете дисперсии параметра оптимизации sfy} или, что то же самое, дисперсии воспроизводимости эксперимента s^oei!y. Вы помните, что дисперсия в каждом опыте, состоящем из п повторных наблюдений, подсчитавается по формуле ^(Vi-y)2 При подсчете дисперсии параметра оптимизации квадрат разности между значением ys в каждом опыте и средним значением из п повторных наблюдений у нужно просуммировать по числу опытов в матрице N, а затем разделить на N (п—1). Так мы приходим к формуле N п „2 ____ 1 1____________ — N (п — 1) ' где 2=1,2........... N; д=1, 2,...,п. Такой формулой можно пользоваться в случаях, когда число повторных опытов одинаково во всей матрице. Для двух повторных опытов формула принимает совсем простой вид N 2 2 „2 __ _1_________ — yv Дисперсию воспроизводимости проще всего рассчитывать, когда соблюдается равенство числа повторных опытов во всех экспериментальных точках. На практике часто приходится сталкиваться со случаями, когда число повторных опытов различно. Это происходит вследствие отброса грубых наблюдений, неуверенности экспериментатора в правильности некоторых результатов (в таких случаях возникает желание еще и еще раз повторить опыт) и т. п. Тогда при усреднении дисперсий приходится пользоваться средним взвешенным значением дисперсий, взятым с учетом числа к * —+*у*+ • • •+ S Jf sw — f1+h + ...+/ где sf — дисперсия первого опыта, s^ — дисперсия второго опыта и т. д., /х — число степеней свободы в первом опыте, равное числу параллельных опытов пг минус 1, т. е. fi—щ—1; /2 — число степеней свободы во втором опыте и т. д. Число степеней свободы средней дисперсии принимается равным сумме чисел степеней свободы дисперсий, из которых она вычислена. , Обращаем ваше внимание на то, что вы совершите ошибку, если возьмете среднее значение дисперсий без учета числа степеней свободы, а также если возьмете среднее значение стандартных отклонений. Стандартные отклонения нужно возвести в квадрат и затем взять взвешенное среднее, как указано выше. Случай С- неравным числом наблюдений, который мы рассмотрели выше,' связан с нарушением ортогональности матрицы. Поэтому здесь нельзя использовать расчетные формулы для коэффициентов, приведенные в гл. 6. и 7. Этот вопрос мы рассмотрим в гл. 9, когда будем рассказывать о расчете дисперсии адекватности. Итак, вы имеете формулы для расчета дисперсии] воспроизводимости эксперимента. Казалось бы, все обстоит хорошо. И все же. . . вы уже, наверное, чувствуете, что1 речь пойдет о «некоторых» ограничениях. Действительно, это так. Формулами 22 2 f<s< sl) = 1 N{n-i)----------- и SU — ^J- 1 можно пользоваться только в том случае, если дисперсии однородны. Последнее означает, что среди всех суммируемых дисперсий нет таких,' которые бы значительно превышали все остальные. Одним из требований регрессионного анализа, с которым вы познакомитесь в следующей главе, является однородность дисперсий.
Вы, конечно, понимаете, что для проверки неоднородности дисперсий нужны количественные критерии. Для того чтобы познакомиться с ними, нужно перейти к следующему параграфу. 8.5. Проверка однородности дисперсий Проверка однородности дисперсий производится с помощью различных статистических критериев. Простейшим из них является критерий Фишера, предназначенный для сравнения двух дисперсий. Критерий Фишера (/^-критерий) представляет собою отношение большей дисперсии к меньшей. Полученная величина сравнивается с табличной величиной /^-критерия (см. стр. 152). Если полученное значение дисперсионного отношения больше приведенного в таблице для соответствующих степеней свободы и выбранного уровня значимости, это означает, что дисперсии значимо отличаются друг от друга, т. е. что они неоднородны. Пример 3. Пусть s|=5,14, щ—7 и /1=6; s|==0,324 для п2=6 и /2—5. В данном примере отношение дисперсий равно 5,14/0,324=15,9 при =6 и /2=5 Почти в каждом пособии по математической статистике помещена таблица отношений дисперсий для различных степеней свободы и различного уровня значимости. Имеется она и в нашей книге. Выбираем наиболее популярный уровень значимости 0,05. В таблице по горизонтали отложены числа степеней свободы для большей дисперсии /15 а по вертикали — числа степепей свободы для меньшей дисперсии /2. Для Д=6 и /2=5 FTt6j=4,40. Это значит: вероятность того, что экспериментальное значение F будет больше чем 4,40, равна 0,05 или 5%. Наше ^8ЖСП=15,90. Оно значительно превышает табличное зйачение. Мы проверяли гипотезу об однородности дисперсий. Наша гипотеза состояла в том, что обе группы экспериментальных данных получены из одной и той же совокупности и дают одинаковое рассеяние. Установили, что одна дисперсия значимо отличается от другой (для выбранного уровня значимости). Если сравниваемое количество дисперс-й больше двух и одна дисперсия значительно превышает остальные, можно воспользоваться критерием Кохрена. Этот критерий пригоден для случаев, когда во всех точках имеется одинаковое число повторных опытов. При этом подсчитывается дисперсия в каждой горизонтальной строке матрицы п Ъ^-У)*
а затем из всех дисперсий находится наибольшая smlx, которая делится на сумму всех дисперсий. Критерий Кохрена — это отношение максимальной дисперсии к сумме всех дисперсий S2 х С »тжм критерием связаны числа степеней Яфёоды /x=re-— 1 и ft—N. Гипотеза об однородности дисперсий подтверждается, 9 Зака» N 588 N п 2 2 {у*ч — у<)2 N(n — i) Пример 4. В начале главы, показывая, как нужно оформлять журнал, мы привели матрицу 23 с двумя повторными опытами. Мы сказали: вот с такой таблицей можно приступать к обработке экспериментальных данных. Воспользуемся зтой таблицей для расчета дисперсии воспроизводимости. Перепишем ее так, чтобы было удобно производить расчет (табл. 8.4). Таблица 8.4 Расчет дисперсии воспроизводимости
Дисперсия в каждом опыте равна 2 2 Максимальная дисперсия оказалась в опыте № 4. Экспериментальный критерий Кохрена равен 6=1,620/5,214=0,31. Табличный критерий Кохрена равен: G=0,68. Экспериментальный критерий Кохрена не превышает значения табличного. Гипотеза об однородности дисперсий подтверждается» Дисперсия воспроизводимости равна 1 2 • 2,607 "{*> =------ 8----- = 8 = 0-652- Пример 5. Теперь обратимся к примеру с различным числом повторных опытов (табл. 8.5) Проведем подсчет дисперсии в каждом опыте и дисперсию воспроивво- димости (если не возникнет предположение, что дисперсии неоднородны). Таблица 8.5
Матрица планирования 2*-1 с различным числом повторных опытов *
= (0,422 + 0,422)/(2 - 1) = 0,844; si = (0,062 + 0,062)/(2 - 1) =0,124; s§ = (0,422 + 0,723 + 0,122 + 0,022)/(4 - 1) = 0,429; si = (0,137 + 0,281 + 0,029)/(3 — 1) =0,223; 2 0,844-1 +0.124-1 +0,429-3 + 0,223-2 2,701 s{y)— ,1 +1 + 3 + 2 — 7 —U,38b' В данном примере не возникает предположение о неоднородности дисперсий, поскольку все они имеют одинаковый порядок. Если возникает предположение о наличии неоднородности, следует попытаться его проверить. Для этой цели можно воспользоваться критерием Бартлета. По уже знакомой вам формуле подсчитывается дисперсия воспроизводимости я i n 1 /1 Далее находится величина где с«0,4343^1 H-j^^-fj . Здесь число степеней свободы равно N—1, где N — число сравниваемых дисперсий. При планировании эксперимента типа 2 это число равно числу опытов в матрице, Бартлет показал, чш величина-^-^/lgs'^—ПРИ" ближенно подчиняется ^-распределению с (N—1) степенями свободы. Значимость критерия Бартлета проверяется обычным способом. Критерий Бартлета базируется на нормальном распределении. Если имеются отклонения от нормального распределения, то проверка неоднородности дисперсий может привести к ошибочным результатам. Пример 6. Предлагаем вашему вниманию следующую задачу. В четырех опытах с неравным числом повторных наблюдений получены результаты, приведенные в табл. 8.6.
мы получаем: и s|yj=5,79. Находим величину с
с = 0,4343 1 3 (4 -1) Теперь мы можем определить х2
X2 = "ol850 (15 lg 5,79 - 4 lg 3'50 '
— 3 lg 5,88 — 3 lg 11,36) = 1,567. Экспериментальное значение х8-критерия равно 1,567. Табличное значение для трех степеней свободы и уровня значимости 0,05 равно 7,815, и мы приходим к выводу, что дисперсии однородны. Приступать к расчету ошибки воспроизводимости, к регрессионному анализу (а также к дисперсионному анализу, который мы не. рассматриваем в этой книге) можно только после того, как дисперсии выдержали проверку на однородность. Экспериментаторы часто пренебрегают такой проверкой, объясняя это трудоемкостью расчетов и сложностью критерия Бартлета. Экспериментаторам, которым претит кропотливая работа при экспериментальных расчетах, можно предложить использование /^-критерия даже в тех случаях, когда число дисперсий больше двух. Делается это следующим образом. Из всех дисперсий выделяются наибольшая и наименьшая. По /^-критерию производится проверка, значимо ли они различаются между собой. Ясно, что если наибольшая и наименьшая дисперсии не отличаются значимо, то дисперсии, имеющие промежуточные значения, также не могут значимо отличаться друг от друга. Тогда всю группу дисперсий можно считать принадлежащей к единой совокупности. В таких случаях нет надобности применять критерий Бартлета. Мы показали вам, как нужно проверять гипотезу об однородности дисперсий. Вы теперь знаете, какими формулами нужно пользоваться, если гипотеза об однородности дисперсий верна. А что же делать экспериментатору, если дисперсии все-таки оказались неоднородными? В таких случаях часто оказывается полезным изменение масштаба для параметра оптимизации. При этом вводится некоторая математическая функция от параметра оптимизации, например квадратный корень или логарифм. Использование таких методов выходит за рамки элементарного анализа, и в случае необходимости экспериментатору целесообразно обращаться за советом к специалисту по планированию эксперимента. 8.6. Рандомизация Сотри случайные черты —■ И ты увидишь: мир прекрасен. А. Блок Чтобы исключить влияние систематических ошибок, вызванных внешними условиями (переменой температуры, сырья, лаборанта и т. д.), рекомендуется случайная последовательность при постановке опытов, запланированных матрицей. Опыты необходимо рандомизировать во времени. Термин «рандомизация» происходит от английского слова random — случайный. Почему рандомизация опытов важна, мы попытаемся показать на следующем примере. Пример 7. В табл. 8.7 приведена матрица 23, полученная из матрицы 22 обычным способом: два раза повторен план 2*, причем в первых четырех опытах хя имеет верхнее значение, а в последних четырех опытах — нижнее значение. Допустим, что экспериментатор может поставить в первый день четыре опыта и во второй день также четыре опыта. Можно ли опыты ставить подряд и в первый день реализовать опыты № 1, 2, 3 и 4, а во второй — 5, 6, 7 и 8? Ставя опыты подряд, вы разбиваете матрицу на две части или на два блока: в первый блок"входят опыты № 1» 2, 3 и 4, во второй — № 5, 6, 7 и 8. Если внешние условия первого дня каким-то образом отличались от внешних условий второго дня, то это способствовало возникновению некоторой систематической ошибки. Обозначим
ь»=-g-1 Сг/ж +«) + + 0 + (ys ++ + (f4+«) — vs — у» — y-t — Ув1 -►Ps + y» где Рз — истинное значение коэффициента при хъ. Таким образом, возможное различие во внешних условиях смешалось с величиной линейного коэффициента Ьъ и исказило это значение. В такой последовательности опыты ставить нельзя. Опыты нужно рандомизировать во времени, т. е. придать последовательности опытов случайный характер. - Приведем простой пример рандомизации условий эксперимента. В полном факторном эксперименте 23 предполагается каждое значение параметра оптимизации определять по двум параллельным опытам. Нужно случайно расположить всего 16 опытов. Присвоим параллельным опытам номера с 9 по 16, и тогда опыт № 9 будет повторным по отношению к первому опыту, десятый — ко второму и т. д. Следующий этап рандомизации — использование таблицы случайных чисел. Обычно таблица случайных чисел приводится в руководствах по математической статистике. Фрагмент таблицы помещен на стр. 135. В случайном месте таблицы выписываются числа с 1 по 16 с отбрасыванием чисел больше 16 и уже выписанных. В нашем случае, начиная с четвертого столбца, можно получить такую последовательность: 2; 15; 9; 5; 12; 14; 8; 13; 16; 1; 3; 7; 4;,6; 11; 10. Это значит, что первым реализуется опыт № 2, вторым — опыт № 7 и т. д. Выбранную случайным образом последовательность опытов не рекомендуется нарушать,
8.7. Разбиение матрицы типа 2к на блоки Если экспериментатор располагает сведениями о предстоящих изменениях внешней среды, сырья, аппаратуры и т. п., то целесообразно планировать эксперимент таким образом, чтобы эффект влияния внешних условий был смешан с определенным взаимодействием, которое не жалко потерять. Так, при наличии двух партий сырья матрицу 23 можно разбить на два блока таким образом, чтобы эффект сырья сказался на величине трехфакторного взаимодействия. Тогда все линейные коэффициенты и парные взаимодействия будут освобождены от влияния неоднородности сырья (табл. 8.8). В этой матрице при составлении блока 1 отобраны все строки, для которых хгх2х3=-\-1, а при составлении блока 2 — все строки, для которых хгх2х3=—1. Различие в сырье можно рассматривать как новый фактор х4. Тогда матрица 23. разбитая на два блока, представляет собой полуреплику 24"1 с определяющим ьонграслом 1 —х^х^х^х^»
Мы предлагаем вам для данной матрицы (табл. 8.8) рассчитать все коэффициенты и посмотреть, какие коэффициенты смешаны с эффектом сырья: bo = J Itifi + е) + (г/а + «) + СУз + + (У* + е) + Уь + Уъ + У7 "Ь V-P. + T'" 6i = -g-t-(fi + e) + (y2 + e) —+ + — ~ Уь + У & — У, + ftl* К= J Г- (j/a + 0 - (У2 + e) + (Уя + s) + (щ + 6) _ — Уь~ У« + Ут + Vsi b.2~* fa K = jl(!/1 + S) — (Уз + е) -(f/3 + f) + (j/i4-£) - — Уь + Ув + У? — ftl» b ► 3 • 12 ^ i 12' bi3 = j l— (Vi +s) — (г/г + e) -f (г/з +f) + (y4 +s) + + & + Ув—г/?—УвЬ К я~~* Раз» b12S = I [ (tfi + e) + (г/2 + + (г/з + s) + (г/4 + e) — — Уь — Уъ — Ут — У^ h R -L — UV1V. Г123 I 2 ' Эффект сырья отразился на подсчете свободного члена Ь0 и эффекта взаимодействия второго порядка Ьпз. Аналогично можно разбить на два блока любой эксперимент типа 2к. Главное — правильно выбрать взаимодействие, которым можно безболезненно пожертвовать. При отсутствии априорных сведений выбирают взаимодействие самого высокого порядка: х,х2х8 для 23, xjx2xgx4 для 24, х^х2х^х4ха для 25 и т. д. Т1о если экспериментатору известно, что одно из парных взаимодействий лишено, например, физико-химического смысла, то можно пожертвовать парным взаимодействием. В нашей практике встречалось много задач, в которых взаимо- деГгствия высокого порядка оказывались более значимыми, чем парные взаимодействия. Когда взаимодействие выбрано, в первый блок группируются все опыты, в которых это взаимодействие равпо +1, а во второй, где оно равно —1. Теперь посмотрим, как можно разбить матрицу на четыре блока. Пусть нужно поставить эксперимент 24. Заведомо известно, что имеется четыре источника неоднородности, которые могут значительно исказить результаты эксперимента. При наличии четырех источников неоднородности нужно матрицу 24 разбить на четыре блока так, чтобы линейные эффекты были освобождены от влияния межблокового эффекта. Чтобы произвести разбиение матрицы 21 на четыре блока по четыре опыта в каждом, нужно выбрать три взаимодействия, которыми можно пожертвовать (число взаимодействий определяется числом степеней свободы, смешивающимися с различием между блоками: /=4—1=3). Два таких взаимодействия можно выбрать произвольно, а третье оказывается однозначно определенным по следующему правилу: нужно взять алгебраическое произведение первых двух выбранных взаимодействий и заменить единицей каждый множитель, стоящий в квадрате. Так, если двумя произвольно выбранными взаимодействиями являются парные хлхг и хях4, то третьим будет х^ТзХ^ Если выбранными являются тройные хгх2хв и х^х?х4, то третьим будет хгх4. При разбиении матрицы 24 на четыре блока одно из парных взаимодействий окажется неизбежно смешанным с межблоковым эффектом Пусть мы выбрали для смешивания три взаимодействия: Включаем в первый блок те опыты, которые имеют четное количество букв, одинаковых g буквами, входящими в символы трех выбранных взаимодействий (при этом удобно пользоваться кодовым обозначением матрицы с помощью латинских букв). При разбиении на блоки принято обозначать факторы заглавными латинскими буквами. Мы будем пользоваться этими обозначениями наряду с нашими х}. Опыт (1), где все факторы на нижних уровнях, удовлетворяет этому условию, так как имеется 0 общих букв со всеми взаимодействиями. Опыт Ъс также удовлетворяет этому условию, так как его символ имеет две общие буквы с xtx2xa (ABC) и x2x-,,xi (BCD) и ни одной с (AD). Двумя другими, удовлетворяющими условию опытами, будут acd и abd, имеющие по две буквы со всеми взаимодействиями. В результате получается блок 1 (табл. 8.9). Для определения состава следующего блока выбираем какое-либо неиспользованное испытание, например а, и умножаем на этот символ каждый член блока 1, получаем блок 2. Блок 1 БЛОК 2 Блок 3 Блок 4 (1) а Ь d Ъс abc е bed acd cd abed ас abd bd ad ab Аналогичная операция проводится для определения состава блоков 3 и 4. Путем Выбора неиспользованного испытания Ъ получаем блок 3, используя d — блок 4. Запишем эту матрицу
в кодовом обозначении +1 и —1 и проверим, какие взаимодействия смешаны с межблоковым эффектом. В матрице табл. 8.9 можно видеть, что в каждом блоке для всех эффектов, за исключением смешанных, соблюдается равенство числа +1 и —1. Следовательно, межблоковый аффект отразится на подсчете b0, 614, Ьпз и 6234. Остальные коэффициенты регрессии освобождены от влияния источников неоднородности. Матрицу типа 2к ^можно разбить на количество блоков 2" (п — степень двойки) при п < к. Так, матрица 23 разбивается на два блока по четыре опыта в каждом и на четыре блока по два опыта в каждом. Матрица 24 — на два блока по восемь опытов в каждом, на четыре блока по четыре опыта и на восемь блоков по два опыта и т. д. Мы не имеем возможности подробно останавливаться на этом вопросе. С разбиением матриц на блоки вы можете познакомиться в работе [3,4] 8.8. Резюме В этой главе мы обратили ваше внимание на то, что к опыту нужно тщательно готовиться: собрать и наладить опытную установку, проверить приборы, подготовить -исходное сырье, разработать журнал. Тщательная подготовка к опыту будет способствовать уменьшению ошибки опыта. Ошибка опыта является суммарной величиной, состоящей из ряда ошибок: ошибок при измерении факторов, параметра оптимизации и ошибок при прове- дении4опыта. Ошибки подразделяются ,на случайные и систематические. Для того чтобы компенсировать влияние систематических ошибок, опыты нужно рандомизировать во времени. Если экспериментатору^ заранее известны источники систематических ошибок, например > известно количество различных партий сырья, следует разбивать матрицу планирования на блоки. При этом межблоковый эффект заведомо смешивается с взаимодействиями, которыми экспериментатор может пренебречь. Особое внимание следует уделять проверке однородности дисперсий, так как это — одна из предпосылок, лежащих в основе регрессионного анализа. Для проверки однородности дисперсий можно использовать критерии Фишера, Кохрена или Бартлета. Очень важно отбросить грубые наблюдения — брак при постановке повторных опытов. Воспроизводимость эксперимента является одним из важнейших требований планирования эксперимента. Литература 1. Н. Вейли. Статистические методы в биологии. М., ИЛ, 1962. 2. В. В. Налимов. Применение математической статистики при анализе вещества. М., Физматгиз, 1960. 3. Е. В. Маркова, А. Н. Лисенков. Планирование эксперимента в условиях неоднородностей. М., «Наука», 1973. 4. К. А. Враунли. Статистические исследования в производстве. М., ИЛ., 1949. Глава девятая |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Последнее изменение этой страницы: 2016-07-23 lectmania.ru. Все права принадлежат авторам данных материалов. В случае нарушения авторского права напишите нам сюда... |