Категории: ДомЗдоровьеЗоологияИнформатикаИскусствоИскусствоКомпьютерыКулинарияМаркетингМатематикаМедицинаМенеджментОбразованиеПедагогикаПитомцыПрограммированиеПроизводствоПромышленностьПсихологияРазноеРелигияСоциологияСпортСтатистикаТранспортФизикаФилософияФинансыХимияХоббиЭкологияЭкономикаЭлектроника |
ОБРАБОТКА РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТАКогда все сугдее, сменяясь каждый час, В нестройный, резким хор сливается вкр^г нас, Кто звуки мерные в порядке размещает, Чьей речи верный ритм и.ивиклен и тверд, "Кто единичное искусно обобщав Объединяя все в торжественный аккорд? Пте. Фауст Тщательное, скрупулезное выполнение эксперимента, несомненно, является главным условием успеха исследования. Это общее правило, и планирование эксперимента не относится к исключениям. Однако нам не безразлично, как обработать полученные данные. Мы хотим извлечь из них всю информацию И сделать соответствующие выводы. Как всегда, мы находимся между Сцил- лой и Харибдой. С одной стороны, не извлечь из эксперимента все, что из него следует, — значит пренебречь нелегким трудом экспериментатора. С другой стороны, сделать утверждения, не следующие из экспериментальных данных, — значит создавать иллюзии, заниматься самообманом (и обманом тоже, хотя и невольным). Статистические методы обработки результатов позволяют нам не перейти разумной меры риска. Поэтому мы отводим эту главу для ifx рассмотрения [1—8]. 9.1. Метод наименьших квадратов Статистики разработали много разнообразных методов обработки результатов эксперимента. Но, пожалуй, ни один из них не может конкурировать по популярности, по широте приложений с методом наименьших квадратов (МНК), который был развит усилиями Лежандра и Гаусса более 150 лет назад. Давайте попробуем разобраться в этом методе. Начнем с про- того случая: один фактор, линейная модель. Интересующая нас функция отклика (которую мы будем также называть уравнением регрессии) имеет вид У = ъо + ЬА- Это хорошо известное вам уравнение прямой линии. Наша цель — вычисление неизвестных коэффициентов Ь0 и bv Мы провели эксперимент, чтобы использовать при вычислениях его результаты. Как это сделать наилучшим образом? Если бы все экспериментальные точки лежали строго на прямой линии, то для каждой из них было бы справедливо равенство у> -К—Vi,=°. где 4=4, 2, N ~ номер опыта. Тогда не было бы никакой проблемы. На практике это равенство нарушается и вместо него приходится писать yt — = где — разность между экспериментальным и вычисленным до уравнению регрессии значениями у в г-й экспериментальной точке. Эту величину иногда называют невязкой. Действительно, невязка возникает по двум причинам: из-за ошибки эксперимента и из-за непригодности модели. Причем эти причины смешаны и мы не можем, не получив дополнительной информации, сказать, какая из них преобладает. Можно постулировать, что модель пригодна. Тогда невязка будет порождаться только ошибкой опыта. (Еще можно, конечно, постулировать, что ошибка опыта равна нулю. Тогда невязка будет связана только с пригодностью модели, и пригодной будет такая модель, для которой все невязки равны нулю.) Обычно оценивают независимо опщбку опыта (помните предыдущую главу?) и проверяют пригодность модели. Конечно,-мы хотим найти такие коэффициенты регрессии, при которых невязки будут минимальны. Это требование можно записать по-разному. В зависимости от этого мы будем получать разные оценки коэффициентов. Вот одна из возможных записей n min> <=i которая приводит к методу наименьших квадратов. N Возможен и метод наименьших кубов 2 1 = min, так как i=i условие, которое мы выбираем, произвольно. Беда заключается в том, что он хуже МНК с другой точки зрения: мы будем получать оценки коэффициентов со значительно меньшей точностью. Да и в вычислительном отношении этот путь сложнее. Существует и метод, в котором минимизируется сумма модулей (абсолютных величин) невязок. Но этот путь связан с дополнительными вычислительными трудностями. Условие МНК — это удачный компромисс. В последнее время были предложены другие подходы. Можно, например, минимизировать модуль максимальной невязки. Это записывается такз min max | |. » Предложений можно сделать сколько угодно, но мы не будем более на них останавливаться и перейдем непосредственно к МНК. Когда мы ставим эксперимент, то обычно стремимся провести больше (во всяком случае не меньше) опытов, чем число неизвестных коэффициентов. Поэтому система линейных уравнений lt = y(~bo-bi*u оказывается переопределенной и часто противоречивой (т. е. она может иметь бесконечно много решений или может не иметь решений). Переопределенность возникает, когда число уравнений больше числа неизвестных; противоречивость—когда некоторые из уравнений несовместимы друг с другом. Только если все экспериментальные точки лежат на прямой, тО система становится определенной и имеет единственное решение. МНК обладает тем замечательным свойством, что он делает определенной любую произвольную систему уравнений. Он делает число уравнений равным числу неизвестных коэффициентов. Наше уравнение "регрессии имеет вид У = ьо + В нем два неизвестных коэффициента. Значит, применяя МНК, мы получим два уравнения. Давайте попробуем их получить. Мы писали n »=i Это соотношение можно записать иначе я я и—2 8=2 (у( — К — bixiif=min- >=i »=i Вы, конечно, помните из курса математики, что минимум некоторой функции, если он существует, достигается при одновременном равенстве нулю частных производных по всем неизвестным, т. е. дЪ0 —и' дЬг и- Вот откуда берутся наши уравнения для определения коэффициентов. Теперь, как говорится, дело техники: n n —2 2 (Vt ~bo — bixu) = °> —2 2 (у, — Ь0- \хи) хи --= »=1 «=1 Для вычислений удобно раскрыть скобки и провести простые преобразования, которые дают n n nn n лч+2 у^ 2 xiA+2 ж?А=2 у<хи • i=l i=l t=l 1=1 1=1
Окончательные формулы для вычисления коэффициентов регрессии, которые удобно находить с помощью определителей, имеют вид n n n n.
2 Vi 2 я1<—2У{Хи 2Хи »=1 i=i
Посмотрим теперь, как вычисляются суммы, входящие в эти формулы. Результаты эксперимента представляются следующей матрицей (табл. 9.1). Для выполнения вычислений ее расширяют так, как представлено в табл. 9.2. Вы, конечно, заметили, что в этой таблице сделано больше вычислений, чем требуется для расчета Ь0 и Ьг. Эти «лишние» данные нужны для проверки правильности расчетов. Возможны два способа проверки. Первый из условия n n n n 2 (хи+У=2 хЬ + 2 2 у<хи + 2 УЬ »=1 »=i i=i »■=1 которое хорошо вам известно еще из школьной математики. (Оно должно выполняться не только для сумм, но и в каждой строчке таблицы.) Второй способ использует условие у = Ъ0-\-Ъ1х1. Подставляя в это соотношение у и % из последней строки таблицы и один из коэффициентов, можно найти другой коэффициент и сравнить с расчетным. Вторая из проверок является наиболее полной, наиболее жесткой. Она проверяет не только вычисления сумм, но и вычисления коэффициентов.
На практике используют обе проверки, чтобы в случае ошибок в таблице не считать зря коэффициенты. Имейте в виду: никакая проверка не гарантирует вас от ошибок в записи исходных данных. Будьте внимательны! Имейте в виду: никакие результаты вычислений нельзя ни использовать, ни даже обсуждать, пока они не проверены. Иначе вы рискуете впасть в заблуждение и, в лучшем случае, потерять время. Ну вот мы и научились вычислять коэффициенты. Давайте нанесем исходные данные и полученное уравнение на график (рис. 25). Выделим для удобства рассмотрения несколько экспериментальных точек и отрезок нашего уравнения в большем масштабе (рис. 26). Мы выбрали пять экспериментальных точек, которые пронумеровали цифрами 1, 2, 3, 4, 5. Четвертая точка оказалась лежащей на линии. МНК состоит в том, чтобы минимизировать сумму квадратов отрезков, характеризующих расхождение между экспериментальными точками и полученным уравнением. Мы минимизировали сумму квадратов пунктирных отрезков. Если бы наше уравнение регрессии имело вид х1=Ъо+Ъ1 У' то мы минимизировали бы сумму сплошных отрезков. Во всех формулах тогда пришлось бы % и у поменять местами и коэффициенты получились бы другими (если, конечно, не все невязки равны нулю). Ю Заказ М 588 Мы находим невязки по оси у, поэтому и минимизируется сумма квадратов вертикальных отрезков. Обе линии совпадут только в том случае, если все невязки равны нулю, т. е. если все экспериментальные точки лежат точно на прямой линии.
Теперь мы можем узнать, какая же получилась сумма квадратов невязок. Будем называть ее остаточной суммой квадратов.
Из рисунков видно, что для этого надо вычислить по уравнению значения у в условиях каждого опыта. Будем называть такое значение предсказанным и обозначать у. Затем надо найти все невязки (отрезки), возвести их в квадрат и сложить (табл. 9.3).
S*1 п Величина 2 и есть остаточная сумма квадратов, которую 1=1 мы раньше обозначили 2 МНК гарантирует, что эта величина минимально возможная. Итак, мы научились находить наилучшие в смысле МНК оценки коэффициентов линейного уравнения для одного фактора. Это, конечно, полезно, но нас интересую^ многофакторные задачи. Обобщение на многофакторный случай не связано с какими- либо принципиальными трудностями. Правда, вычисления значительно усложняются и требуют привлечения аппарата алгебры матриц. Рассмотрим его в следующей главе. А пока мы воспользуемся тем, что наши матрицы планирования ортогональны. Если вы забыли это понятие, то обратитесь к стр. 84 и повторите его. Далее будем рассматривать только этот случай, который позволяет резко упростить вычисления, что составляет одно из преимуществ планирования эксперимента. Можно показать, что для любого числа факторов коэффициенты будут вычисляться по формуле n 2 у*хз* В этой формуле 7=0, 1, 2 . . . , к — номер фактора. Ноль записан для вычисления bQ. Действительно, посмотрите на формулы для вычисления коэффициентов регрессии на стр. 144. В первой формуле n 2 хи=о i=i в силу симметричности плана. Поэтому после сокращения формулы приобретают вид n n ,2 у* 2 y>Xit 7 ___ » = 1 7 __ »=1_____ °0 --- /у » °1---- n > t=i где i=i что совпадает с написанным выше. Так как каждый фактор (кроме х0) варьируется на двух уровнях +1 и —1, то вычисления сводятся к приписыванию столбцу у знаков соответствующего фактору столбца и алгебраическому сложению полученных значений. Деление результата на число опытов в матрице планирования дает искомый коэффициент. Это очень простая формула, но вам необходимо научиться пользоваться ею безошибочно. При вычислениях линейных моделей по дробным репликам никаких особенностей не появляется. Все точно так же. Допол- 10» У = ъо + bixi + Ь2х2 + ... + Ъкхк + МА + ~Ь \гх1хг • • • Н~ кхк-ххк' Конечно, можно интересоваться не всеми эффектами взаимодействия, а только определенными. В полном факторном эксперименте можно оценить все взаимодействия. Для дробных реплик это не так. Если вы построили полуреплику 24-1 с определяющим контрастом 1=ж1ж2ж3ж4, то раздельных оценок Ь12 и bSi получить нельзя, так как имеет место соотношение ххх2=хъх4. В этом можно легко убедиться, если выписать столбцы интересующих нас эффектов. А это необходимо для вычисления коэффициентов. В нашем случае столбец ххх2 совпадает со столбцом xsx4. Формулу для вычислений коэффициентов можно записать так: n V ViXuiXj( £ _J=i_________ V*J — N Здесь и, 7=1,2, . . ., к — номера факторов, Обратите внимание, что в силу ортогональности эффекты взаимодействия оцениваются независимо от линейных эффектов. 9.2. Регрессионный анализ До сих пор мы пользовались МНК как вычислительным приемом. Нам нигде не приходилось вспоминать о статистике. Но, как только мы начинаем проверять какие-либо гипотезы о пригодности модели или о значимости коэффициентов, приходится вспоминать о статистике. И с этого момента МНК превращается в регрессионный анализ. А регрессионный анализ, как всякий статистический метод, применим при определенных предположениях, постулатах. Первый постулат. Параметр оптимизации у есть случайная величина с нормальным законом распределения. Дисперсия воспроизводимости, которую мы научились находить в седьмой главе, — одна из характеристик этого закона распределения. В данном случае, как и по отношению к любым другим постулатам, нас интересуют два вопроса: как проверить его выполнимость и к чему приводят его нарушения? При наличии большого экспериментального материала (десятки параллельных опытов) гипотезу о нормальном распределении можно проверить стандартными статистическими тестами (например, ^-критерием). К сожалению, экспериментатор редко располагает такими данными, поэтому приходится принимать этот постулат на веру. (Кроме тех случаев, когда заведомо известно, что это не так и требуется специальное рассмотрение. Мы не будем на них останавливаться.) В том, что у — случайная величина, обычно сомневаться не приходится. Какие последствия связаны, по вашему мнению, с нарушением первого постулата? При нарушении нормальности мы лишаемся возможности установления вероятностей, с которыми справедливы те или иные высказывания. В этом таится большая опасность. Мы рискуем загипнотизировать себя численными оценками и вероятностями, за которыми ничего не стоит. Это даже хуже волюнтаризма. Вот почему надо очень внимательно относиться к возможным нарушениям предпосылок. Второй постулат. Дисперсия у не зависит от абсолютной величины у. С этим требованием мы уже встречались в восьмой главе. Выполнимость этого постулата проверяется с помощью критериев однородности дисперсий в разных точках факторного пространства. Нарушение этого постулата недопустимо. Если однородность дисперсий все же отсутствует, то необходимо такое преобразование у, которое делает дисперсии однородными. Увы, его не всегда легко найти. Довольно часто помогает логарифмическое преобразование, с которого обычно начинают поиски. Третий постулат. Значения факторов суть неслучайные величины. Это несколько неожиданное утверждение практически означает, что установление каждого фактора на заданный уровень и его поддержание существенно точнее, чем ошибка воспроизводимости. Нарушение этого постулата приводит к трудностям при реализации матрицы планирования. Поэтому оно обычно легко обнаруживается экспериментатором. Существует еще четвертый постулат, налагающий ограничения на взаимосвязь между значениями факторов. У нас он выполняется автоматически в силу ортогональности матрицы планирования. Если с постулатами все в порядке, то можно проверять статистические гипотезы. 9.3. Проверка адекватности модели Первый вопрос, который нас интересует после вычисления коэффициентов модели, это проверка ее пригодности. Мы будем называть такую проверку проверкой адекватности модели. Ниже (рис. 27, а, б) приведены два рисунка с одинаковым расположением экспериментальных точек и, следовательно, одинаковым разбросом относительно линии регрессии, но с различ В данном случае разброс в точках такого же порядка, что и разброс относительно линии. Поэтому можно предполагать, что построенная модель пригодна. (Дальше мы выясним, как проверить это количественно.) Во втором случае опыты «слишком» точны. Требуется более сложная модель, чтобы точность ее предсказания была сравнима с точностью эксперимента.
Это качественные соображения, а нам нужна количественная мера. Для характеристики среднего разброса относительно линии регрессии вполне подходит остаточная сумма квадратов. Неудобство состоит в том, что она зависит от числа коэффициентов в уравнении: введите столько коэффициентов, сколько вы провели независимых опытов, и получите остаточную сумму, равную нулю. Поэтому предпочитают относить ее на один «свободный» опыт. Число таких опытов называется числом степеней свободы (/). Числом степеней свободы в статистике называется разность между числом опытов и числом коэффициентов (констант), которые уже, вычислены по результатам этих опытов независимо друг от друга. Если, например, вы провели полный факторный эксперимент 28 и -нашли линейное уравнение регрессии, то число степеней свободы f = N — (А + 1) = 8 — (3 + 1) = 4. Остаточная сумма квадратов, деленная на число стеценей свободы, называется остаточной дисперсией, или дисперсией адекватности n 2 »=1 S2 : »* tse Рассмотрим пример. Требуется найти число степеней свободы для в следующем случае: план 24-1 и четыре параллельных опыта в нулевой точке для вычисления ошибки опыта; модель линейная. Один из возможных ответов — семь степеней свободы — основан на следующих предположениях. Вероятно, вы рассуждали так. Проделано 12 опытов: 24-1=8 плюс 4 нулевых. В уравнение входит 5 коэффициентов. Следовательно, /=12—5=7. Здесь не учтено, что параллельные опыты нельзя считать самостоятельными, так как они дублируют друг друга. Поэтому" они все дают одну степень свободы. Другой неправильный ответ — 4 степени свободы. Этот неправильный ответ получился, вероятно, из следующего рассуждения. Проделано 12 опытов: восемь по матрице планирования и четыре нулевых. Так как все нулевые опыты тож- жественны, то они дают одну степень свободы. Число коэффициентов в модели равно пяти. Следовательно, /=9—5=4. Вы не обратили внимание на то, что опыты в нулевой точке не используются при вычислении коэффициентов и- не могут поэтому входить в число степеней свободы. Правильный ответ — три степени свободы. Действительно, мы провели 12 опытов, но четыре опыта в нулевой точке были проведены для других целей и в вычислении коэффициентов не участвовали, поэтому они не входят в число степеней свободы. (А если бы входили — такие случаи возможны, то давали бы не четыре, а только одну степень свободы.) Число коэффициентов модели — пять. Следовательно, / = 8-5 = 3. Запомните правило: в планировании эксперимента число степеней свободы для дисперсии адекватности равно числу различных опытов, результаты которых используются при подсчете коэффициентов регрессии, минус число определяемых коэффициентов. Вам еще представится случай поупражняться в определении числа степеней свободы для дисперсии адекватности. Для проверки гипотезы об адекватности можно использовать F-критерий (этот критерий уже использовался для сравнения двух дисперсий)
Величину, стоящую в числителе этой формулы, мы только что научились считать, а знаменатель — старый знакомый (см. гл. 8) — это дисперсия воспроизводимости со своим числом степеней свободы. Удобство использования критерия Фишера состоит в том, что проверку гипотезы можно свести к сравнению с табличным значением. Фрагмент соответствующей таблицы, который может удовлетворить ваши нужды не только в упражнениях этой книги, но и в большинстве случаев практики, приведен ниже (табл. 9.4).
Таблица построена следующим образом. Столбцы связаны с определенным числом степеней свободы для числителя fx, строки — для знаменателя /2. На пересечении соответствующих строки и столбца стоят критические значения /^-критерия. Как правило, в технических задачах используется уровень значимости 0,05. Если рассчитанное значение /^-критерия не превышает табличного, то с соответствующей доверительной вероятностью модель можно считать адекватной. При превышении табличного значения эту приятную гипотезу приходится отвергать. Если модель адекватна, то мы можем перейти к крутому восхождению. Если нет — приходится преодолевать дополнительные трудности. Это мы обсудим ниже. Но во всех случаях интересно проверять еще значимость отдельных коэффициентов регрессии. 9.4. Проверка значимости коэффициентов Проверка значимости каждого коэффициента проводится независимо. Ее можно осуществлять двумя равноценными способами: проверкой по ^-критерию Стьюдента или построением доверительного интервала. При использовании полного факторного эксперимента или регулярных дробных реплик доверительные интервалы для всех коэффициентов (в том числе и эффектов взаимодействия) равны друг другу. Прежде всего надо, конечно, найти дисперсию коэффициента регрессии s'fj^}. Она определяется в нашем случае по формуле _ Лу} b{bj)—' если параллельные опыты отсутствуют. Из формулы видно, что дисперсии всех коэффициентов равны ДРУГ Другу, так как они зависят только от ошибки опыта и числа опытов. Теперь легко построить доверительный интервал ( Д &,= ±ts{bj). Здесь t — табличное значение критерия Стьюдента при числе степеней свободы, с которыми определялась s2^}, и выбранном уровне значимости (обычно 0,05); — квадратичная ошибка коэф фициента регрессии *{ьу> = + N/«{6;>- Формулу для доверительного интервала можно записать в следующей эквивалентной форме: Коэффициент значим, если его абсолютная величина больше доверительного интервала. Доверительный интервал задается верхней и нижней границами Ь^.+ ДЬ^ и bj—ДЪ Для отыскания значений ^-критерия можно воспользоваться таблицей, фрагмент из которой приведен в табл. 9.5. Таблица построена следующим образом. Столбцы соответствуют различным степеням свободы и значениям критерия. Пусть в двух разных задачах случайно оказались два численно равных коэффициента регрессии. Доверительные интервалы для них оказались различными. Из них значим только второй Задача Ьу Дbj 1 5,3 +5,5 2 5,3 +2,6 Таблица 9.5 Значения i-критерия Стьюдента при 5%-ном уровне значимости [2]
В действительности чем уже доверительный интервал (при заданном а), тем с большей уверенностью можно говорить о значимости коэффициента. Помните рабочее правило: если абсолютная величина коэффициента больше, чем доверительный интервал, то коэффициент значим. Если вам больше .нравится проверять значимость коэффициентов по (-критерию, то воспользуйтесь формулой *lbj} ' Вычисленное значение ^-критерия сравнивается с табличным при заданном а и соответствующем числе степеней свободы. Полученные выводы о значимости коэффициентов, конечно, должны совпадать с предыдущими. Так производится проверка значимости коэффициентов. 9,5. Резюме Итак, в этой главе вы освоили основные методы обработки экспериментальных данных, полученных при планировании эксперимента. Вы научились не только вычислять коэффициенты регрессии, но й проводить статистические оценки адекватности и значимости. Мы подробно рассмотрели метод наименьших квадратов —эффективный и простой способ получения оценок коэффициентов регрессии. Этд оценки приводят к минимально возможной остаточной сумме квадратов и в этом смысле являются оптималь- Одновременно мы установили важное требование обязательной проверки правильности вычислений и научились выполнять это требование при применении метода наименьших квадратов. Вы узнали, что МНК становится частью регрессионного анализа при проверке статистических гипотез. При этом должны выполняться следующие постулаты: 1) параметр оптимизации — случайная величина с нормальным законом распределения; 2) дисперсия параметра оптимизации не зависит от значений параметра оптимизации; 3) значения факторов — неслучайные величины; 4) факторы не коррелированы. Мы выяснили, как можно проверить выполнимость этих постулатов и к чему приводит их нарушение. Всякая модель ценна постольку, поскольку она верно отражает описываемое явление. Мы выбрали подходящий статистический метод проверки адекватности модели, основанный на критерии Фишера, и научились им пользоваться. Кроме проверки адекватности следует проводить проверку значимости коэффициентов. Эта проверка осуществляется с помощью критерия Стьюдента. Мы рассмотрели два варианта такой проверки: с помощью построения доверительных интервалов и непосредственно сравнением с табличным значением критерия. Литература 1. Е. С. Вентцелъ. Теория вероятностей. М., «Наука», 1969. 2. К. Доерфелъ. Статистика в аналитической химии. М., «Мщ>», 1969. 3. В. П. Спиридонов, А. А. Лопаткин. Математическая обработка физико- химических данных. М., изд-во МГУ, 1970. 4. Д. Худсон. Статистика для физиков. Изд. 2-е. М., «Мир»т 1970. 5. Я. Дрейпер, Г. Смит. Прикладной регрессионный анализ. М., «Статистика», 1973. 6. С. А. Айвазян. Статистическое исследование зависимостей. М., «Металлургия», 1966. 7. Ю. Нейман. Вводный курс теории вероятностей и математической статистики. М., «Наука», 1968. 8. Л. Яноши. Теория и практика обработки результатов измерений. М., «Мир», 1968. Глава десятая |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Последнее изменение этой страницы: 2016-07-23 lectmania.ru. Все права принадлежат авторам данных материалов. В случае нарушения авторского права напишите нам сюда... |