Студопедия

Главная страница Случайная страница

КАТЕГОРИИ:

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Тема 07 (часть 2). Построение эмпирических статистических моделей ХТП




§3. Регрессионный и корреляционный анализ Определение коэффициентов линейной или линеаризованной модели вида: методом аппроксимации (конкретно МНК) приводит к матричной формуле: где значения элементов матрицы независимых переменных зависят только от входных переменных и вида функций : а вектор экспериментальных значений (вектор наблюдений) присутствует в этом матричном соотношении в качестве линейного сомножителя. Поэтому целесообразно ввести матрицу : После чего матричную формулу МНК для определения коэффициентов модели можно записать: Статистический анализ результатов вычисления необходим, так как вектор , который влияет на значения в соответствии с (36), является случайным вектором (это приводит к тому, что - также случайный вектор). Причины случайного характера вектора , полученного в результате опытных измерений: а)используется случайная выборка ; б)результаты измерения каждого - случайные величины. Один из видов статистического анализа – регрессионный анализ – предполагает, что компоненты вектора - случайные величины, распределённые по нормальному закону распределения, т.е. для плотности распределения Yi (i –го измерения) будет справедливо:

т.е. числовыми характеристиками случайной

величины Yi будут: - математическое ожидание, - дисперсия, - среднеквадратичное отклонение или стандарт. Допущение о нормальном законе распределения компонентов вектора - это Первое допущение регрессионного анализа. Второе допущение регрессионного анализа – о неслучайности компонентов вектора , т.е. xi - неслучайные величины. Из этих двух допущений следует, что в соответствии со свойством линейности нормального закона распределения компоненты вектора из соотношения (36) также являются случайными величинами, распределёнными по нормальному закону, т.е. также могут характеризоваться следующими числовыми характеристиками: - математическим ожиданием, - дисперсией, - среднеквадратичным отклонением или стандартом. Третье допущение регрессионного анализа заключается в допущении об однородности дисперсии случайных величин Yi . Свойство однородности предполагает несущественное отличие дисперсий Yi -ых, что позволяет усреднять их оценки или значения, полученные по ограниченным выборкам и распространять на всю исследуемую область, и проверяется с помощью специальных критериев, которые здесь не рассматриваются. В соответствии с регрессионным анализом всегда рассчитывается оценка коэффициентов (оценка обозначается ^) (36). в результате получается приближенная зависимость: Для получения строгой зависимости и т.к. Y – случайная величина – необходима зависимость математического ожидания от значений x, называемая уравнением регрессии: где aj - истинные значения коэффициентов регрессии, называемых теоретическими коэффициентами регрессии ; - условное математическое ожидание случайной величины Y.



3.1 Этапы регрессионного анализа1)Определение оценок коэффициентов регрессии МНК по формуле (37) 2)Определение значимости коэффициентов регрессии, т.е. существенного отличия их от нуля с помощью t – критерия Стьюдента. 3)Определение адекватности уравнения регрессии (38) с помощью F – критерия Фишера.

3.2 Определение числовых характеристик случайных величин измерений выходной переменной . - вектор математических ожиданий Для дисперсий yi и yj справедливо: Ковариация двух случайных величин равна математическому ожиданию произведения : Для независимых нормально-распределённых случайных величин Yi и Y j Для нормально-распределённых случайных величин вместо размерной величины целесообразно пользоваться коэффициентом корреляции:

В этом случае для линейно-зависимых случайных величин yi и yj :

А для независимых - ( Для дисперсий в n экспериментальных точках создаётся специальная матрица дисперсий – ковариаций:

В результате матрица дисперсий-ковариаций для экспериментальных значений имеет вид:

Если принять два допущения: 1)о независимости измерений 2)об однородности дисперсии, т.е. несущественном отличии и их равенстве , то получается диагональная матрица дисперсий - ковариаций для измеряемых значений с одинаковыми дисперсиями :



3.3. Определение оценок дисперсий коэффициентов регрессии Так как - случайная величина, распределённая по нормальному закону, По аналогии с (39) составим матрицу дисперсий-ковариаций для : В соответствии с (37): Для определения элементов матрицы дисперсий-ковариаций необходимо подставить (37) и (46) в матричную формулу (45). Если в результате подстановки матрица (45) получится диагональной, то по аналогии с (41) коэффициенты регрессии можно считать статистически независимыми. Выполним эту подстановку: ( т.к. ) т.к., согласно (44), ,

т.к. матрица - симметрична, Назовём обратную матрицу корреляционной матрицей : Тогда Отсюда: Для дисперсий Для ковариаций Таким образом, в соответствии с (49) и (50) независимость коэффициентов определяется тем, будут ли недиагональные элементы в матрице корреляции (47) равны нулю. В соответствии с (48) и (24) значения элементов этой матрицы определяются экспериментальными величинами и видом функций , т.е. зависят от того, как поставлен (спланирован) эксперимент. В случае активного эксперимента (например, полного факторного эксперимента – ПФЭ и ортогонального центрального композиционного плана эксперимента - ОЦКП) его проводят так, чтобы матрица стала диагональной, т.е. коэффициенты регрессии будут статистически независимы. В случае произвольного пассивного эксперимента матрица оказывается недиагональной и поэтому коэффициенты будут статистически зависимы. Матрица называется корреляционной, т.к. с помощью её элементов в соответствии с (42) можно рассчитать корреляции коэффициентов регрессии:

3.4. Определение оценок дисперсии .Оценка определяется из экспериментов. Пусть выходная переменная y зависит от r входных переменных (независимых переменных ). Для оценки дисперсии проводятся два типа экспериментов: а)С изменением независимых переменных ; б)Параллельные опыты, когда независимые переменные не меняются.

3.4.1.Определение оценок дисперсий в экспериментах с изменением независимых переменных с различным числом параллельных опытов в каждой точке . а) Определение остаточной дисперсии определяется из экспериментов с изменяющимися значениями (пассивный эксперимент): где р - число значимых выборочных коэффициентов регрессии, в частном случае – когда коэффициенты значимы – р = m+1, - остаточная дисперсия - характеризует погрешности уравнений (или моделей) и погрешности экспериментов; - определяются с помощью коэффициентов (37) по уравнению регрессии; - экспериментальные значения; SSR - сумма квадратов остаточной дисперсии; fR - число степеней свободы остаточной дисперсии; n - число опытных измерений; p - число значимых коэффициентов регрессии. Остаточная сумма квадратов SSR равна сумме квадратов дисперсии адекватности SSad , характеризующей погрешность уравнения регрессии и сумме квадратов дисперсии воспроизводимости SSe , характеризующей погрешность экспериментов.

Соответственно для числа степеней свободы остаточной дисперсии будет справедливо: б) Определение дисперсии воспроизводимости . Дисперсия воспроизводимости определяется из параллельных опытов, когда их число различно в каждой экспериментальной точке и равно : где в) Определение дисперсии адекватности . В этом случае в соответствии с приведёнными ранее равенствами где, как следует из равенств (53) и (54):

3.4.2.Определение оценок дисперсий с одинаковым числом параллельных опытов в каждой точкеkс изменением независимых переменных. Возьмём i –ую строку из предыдущей таблицы пассивного эксперимента и повторим в ней опыты k раз: при этом среднее значение , где - дисперсия воспроизводимости – характеризует погрешность эксперимента в i-ой опытной точке; - экспериментальные значения, полученные в параллельных опытах в i-ой точке;

- усреднённое экспериментальное значение в i-ой точке; - сумма квадратов дисперсии воспроизводимости в i-ом эксперименте; - число степеней свободы дисперсии воспроизводимости в i-ой точке; k - число параллельных опытов в i-ой экспериментальной точке.

3.4.3. Определение оценок дисперсий, когда параллельные опыты проведены в любой отдельно взятой точке. Если k параллельных опытов проведены во всех экспериментальных точках первой таблицы эксперимента, то в соответствии со свойством однородности дисперсии с учётом (57): т.к. и fe = n( k – 1 ). Для одинакового числа параллельных опытов в каждой экспериментальной точке ( k ) дисперсия адекватности определяется: В этом случае остаточная дисперсия равна дисперсии адекватности Для оценки дисперсий в (44) целесообразно использовать , а при отсутствии параллельных опытов - . Для определения оценок дисперсий коэффициентов в соответствии с (49) используют оценку - остаточную дисперсию , дисперсию воспроизводимости и дисперсию адекватности .

3.5. Определение значимости коэффициентов регрессии. (Выполнение второго этапа регрессионного анализа). Для этого используется нормированная случайная величина: подчиняющаяся t –распределению Стьюдента. Воспользовавшись оценкой дисперсии из (49) и , можно записать вероятностное соотношение: В этом случае табличное значение t берётся при доверительной вероятности β (чаще всего 0,95) и числе степеней свободы дисперсии воспроизводимости (48) – fe . Если предположить, что математическое ожидание коэффициента (т.е. истинное его значение равно нулю), то условие незначимости коэффициента aj имеет вид (62): Для значимых коэффициентов в соответствии с (62), раскрывая неравенство, получим следующий доверительный интервал: Это означает, что вместо оценки коэффициентов регрессии можно пользоваться их крайними значениями в соответствии с (64). Это в свою очередь приведёт к различным величинам в уравнении: В результате на графике вместо одной кривой, полученной по оценочным значениям коэффициентов регрессии, получается три: одна - минимальных значений aj , вторая – максимальных значений aj и третья – сплошная, для оценочных значений коэффициентов регрессии:

3.5.1. Процедура исключения незначимых коэффициентов регрессии. В соответствии с (63) незначимые коэффициенты следует исключать из уравнения регрессии (38). Однако так как матрица в общем случае недиагональная, и коэффициенты статически зависимы, то после исключения одного коэффициента необходимо пересчитать оставшиеся и рассчитать сумму квадратов остаточной дисперсии SSR . Если она не ухудшилась (не стала больше), то исключение было правомочным. В противном случае исключение было неправомочным. В случае незначимости нескольких коэффициентов всегда исключается только один (т.к. существует статистическая зависимость коэффициентов), причём тот, для которого отношение является наименьшим. Остальные коэффициенты пересчитываются, и, как указывалось выше, определяется SSR . Исключение незначимых коэффициентов по одному производится до тех пор, пока остаточная сумма квадратов не ухудшается. В случае незначимости нескольких коэффициентов в активном эксперименте из-за диагональности матрицы можно одновременно исключать все незначимые коэффициенты.

3.6. Проверка адекватности уравнения регрессии - математической модели. (Выполнение третьего этапа регрессионного анализа). В результате успешного решения задачи идентификации (параметрической и структурной) должна получиться адекватная математическая модель (ММ). Под адекватностью ММ понимается: 1)Качественное и количественное соответствие поведения ММ и объекта моделирования. 2)Выполнение этого соответствия как при одном наборе режимных параметров (адекватность состояния), так и при различных наборах режимных параметров (адекватность поведения). 3)Возможность интерполяции и экстраполяции свойств реального объекта с помощью ММ.

3.6.1. Оценка адекватности уравнения регрессии.Отношение дисперсии адекватности к дисперсии воспроизводимости используется для статистической оценки адекватности уравнения регрессии. Для этой цели применяются таблицы F – распределения Фишера при доверительной вероятности β (0,9; 0,95; 0,99) и двух числах степеней свободы – дисперсии адекватности ( fad ) и дисперсии воспроизводимости ( fe ). При использовании статистического распределения Фишера всегда рассматривается отношение большей дисперсии (в данном случае - ) к меньшей (в данном случае - ), равное F и для адекватной модели её рассчитанное значение должно быть не больше стандартного (табличного) значения распределения Фишера: В противном случае модель считается неадекватной. Если нет параллельных опытов, то либо сравнивают для моделей остаточные дисперсии либо сравнивают эту величину с оценкой разброса опытных данных относительно среднего значения - дисперсией среднего: Так как последняя дисперсия больше , то для критерия Фишера рассматривают отношение к и условие адекватности будет иметь вид:

3.6.2. Качественное и количественное соответствие свойств ММ и объекта моделирования Качественное соответствие – это когда тенденции изменения переменных в реальном объекте и ММ совпадают. При оценке количественного критерия соответствия следует использовать аппарат статистического (в нашем случае – регрессионного) анализа. Получаемый в результате количественный критерий соответствия не должен компенсировать качественное несоответствие. Строго говоря, при анализе количественного критерия соответствия должны сравниваться: - экспериментальные значения случайной величины yij , полученные в j – ом параллельном опыте i – го эксперимента с

- математическим ожиданием рассчитанной по модели величины выходной переменной для значений входных переменных в i – ом эксперименте. Если также ввести среднее значение в i – ом эксперименте и рассчитанное по ММ (уравнению регрессии) это же значение , полученное при тех же величинах входных переменных , что и в эксперименте, дающем , то будет справедливо: Оценкой первых разностей будет дисперсия воспроизводимости , которая характеризует ошибку экспериментов. Оценкой вторых разностей будет дисперсия адекватности , которая характеризует ошибку уравнения (модели) в сравнении с экспериментальными величинами (если нет параллельных опытов в каждой экспериментальной точке – это не среднее значение, а просто измеренная величина). Оценкой третьего слагаемого является дисперсия рассчитанного значения выходной переменной (определяемая по аналогии с и ). где р - число значимых коэффициентов уравнения регрессии. Аппарат дисперсионного анализа указанных выше трёх дисперсий , и позволяет решить две задачи: А)оценить адекватность уравнения регрессии ( ) с использованием критерия Фишера (67); Б)определить совместную доверительную область для истинных значений коэффициентов регрессии ( ).

3.6.3. Оценка совместной доверительной области коэффициентов регрессииОтношение дисперсии рассчитанной величины выходной переменной y к остаточной дисперсии подчиняется распределению Фишера ( F ) с доверительной вероятностью β, и условием их малой различимости является:

В соответствии с логикой рассматриваемого анализа эти величины должны мало различаться, и граница области, где это условие выполняется, задаётся уравнением: или Величина - значение критерия, полученное при реализации программы минимизации. Значение SSy можно заменить матричным произведением: т.к. и . Подставляя матричное произведение вместо SSy, получается квадратичная форма вида: Геометрической интерпретацией этой квадратичной формы является эллипсоид, оси которого пропорциональны собственным значениям матрицы определяемой из характеристического уравнения вида: Для двух коэффициентов a0 и a1 получается эллипс вида: Получена совместная доверительная область для коэффициентов (здесь a0 и a1) в линейной модели. Её можно сравнить с прямоугольником, образованным оценками доверительных интервалов коэффициентов регрессии (64). Длинная, вытянутая доверительная область (собственные значения матрицы существенно отличаются) указывает на то, что коэффициенты сильно коррелированны и значения коэффициентов плохо оценены. _ ____________________________________ Результатом высокой корреляции коэффициентов является то, что неправильно оцененное значение одного из коэффициентов можно сбалансировать при проведении подгонки компенсирующим исправленным значением другого параметра. В результате подгонка даёт почти столь же хороший результат, как и результат, получаемый при использовании наилучших оценок. Поверхность суммы ( Cr ) квадратов задаётся уравнением:

 

Тема 07 (часть 3). Построение эмпирических статистических моделей ХТП §4. Построение эмпирических моделей по данным активного эксперимента При проведении опытных исследований различают пассивный и активный эксперимент. Методология пассивного экспериментирования предполагает проведение большой серии опытных исследований с поочередным варьированием значений входных переменных и анализом результатов измерений выходной переменной y (лабораторный эксперимент или эксперимент на пилотной установке). К пассивному эксперименту принято относить также и сбор опытных данных в режиме эксплуатации промышленной установки – т.н. промышленный эксперимент. Обработка результатов пассивного эксперимента проводится методами регрессионного и корреляционного анализа, и выбор вида эмпирической модели (уравнения регрессии), т.е. решение задачи структурной идентификации является достаточно сложной задачей. Это связано с тем, что вид уравнения регрессии необходимо определять по характеру изменения переменных на графике эмпирической линии регрессии, полученной по выборке экспериментальных данных. Для решения этой задачи для одной входной переменной x предложены эффективные методы, в которых предусматривается преобразование системы координат как для входной ( x ), так и для выходной переменной ( y ). При большем числе входных переменных ( x1,…xm ) надёжных методов определения вида уравнения регрессии (вида эмпирической модели) в настоящее время не существует. Активный эксперимент проводится по заранее составленному плану, в соответствии с которым ставится задача не только определения оптимальных условий проведения эксперимента, но и оптимизации процесса (оптимальное планирование эксперимента). При этом уравнения регрессии (эмпирические модели) описывают данные активного эксперимента, в основном, в двух ограниченных областях и имеют следующий вид: - вдали от экстремального значения выходной переменной y : - вблизи экстремального значения выходной переменной y («в почти стационарной области»):

 

Приведённые уравнения являются линейными относительно коэффициентов регрессии и имеют достаточно простой вид. Они включают слагаемые с двойным взаимодействием входных переменных и не учитывают взаимодействия более высоких порядков (тройные, четверные и т.д.), вероятность которых существенно меньше. Последнее уравнение включает слагаемые с квадратами входных переменных и его коэффициенты получаются при обработке результатов активных экспериментов II-го порядка (верхний индекс II при ) – например, ОЦКП – ортогонального центрального композиционного плана эксперимента. Предпоследнее уравнение не включает слагаемые с квадратами входных переменных и его коэффициенты получаются при обработке результатов активных экспериментов I-го порядка – верхний индекс I при - например, ПФЭ – полный факторный эксперимент. При определении оптимальных условий проведения процесса с использованием эмпирических моделей (например, методом Бокса-Вильсона) выходная переменная является критерием оптимальности или целевой функцией. В теории активного экспериментирования выходную (зависимую) переменную принято называть функцией отклика, а входные (независимые) переменные – факторами. Соответственно - координатное пространство с координатами ( x1, x2, …xm ) - факторным пространством, а геометрическое изображение функции отклика в факторном пространстве – поверхностью отклика. Активный эксперимент планируется таким образом, чтобы упростить обработку его результатов методами регрессионного и корреляционного анализа. Ортогональные планы экспериментов, используемые при активном экспериментировании, обеспечивают диагональный вид корреляционной матрицы при регрессионном анализе и, соответственно, статистическую независимость коэффициентов регрессии. К другим достоинствам активного экспериментирования относятся: а)возможность предсказания количества опытов, которые следуют провести; б)определение точек факторного пространства, где следует проводить опыты; в)отсутствие проблем, связанных с выбором вида уравнения регрессии; г)возможность определения оптимальных параметров процесса экспериментально-статистическим методом; д)сокращение объёма опытных исследований.

 

4.1. ПФЭ и обработка его результатов. Полный факторный эксперимент (ПФЭ) относится к экспериментам I-го порядка, т.к. описывающее его уравнение не включает факторы в квадрате. Для двух факторов ( x1 и x2 ) и без учёта взаимодействия факторов соответствующая эмпирическая модель может быть записана: В соответствии с теорией ПФЭ при проведении опытных исследований каждый из факторов варьируется только на двух уровнях – минимальном (кодированное значение -1) и максимальном (кодированное значение +1). При этом реализуются возможные комбинации минимальных и максимальных значений факторов, в результате чего общее число опытов (n) в ПФЭ равно 2m и полный факторный эксперимент обычно называется ПФЭ типа 2m . Для определения числа опытов применяется формула: n = 2m В последнее уравнение включаются кодированные значения факторов zj вместо xj , значения которых получаются по следующей схеме кодирования: где В результате план проведения эксперимента с учётом вышесказанного и кодирования факторов имеет вид: (число факторов равно 2 - m = 2, число опытов n = 2m = 22 = 4) При этом уравнение регрессии, описывающее эти опытные данные, записывается с использованием кодированных факторов zj ( j = 0, 1, 2 ) и соответственно кодированных коэффициентов регрессии : В кодированном факторном пространстве в соответствии с указанным планом проведения эксперимента проведённые опыты представляются точками вершин квадрата:

Для параметрической идентификации кодированного уравнения регрессии используется метод регрессионного анализа, включающий три этапа: а)определение кодированных коэффициентов уравнения регрессии методом наименьших квадратов; б)оценка значимости кодированных коэффициентов регрессии с использованием t – критерия Стьюдента; в)проверка адекватности кодированного уравнения регрессии с использованием F – критерия Фишера. Реализация двух последних этапов возможна при выполнении свойства однородности дисперсий (одно из требований регрессионного анализа) и проведении параллельных опытов, например, в точке с координатами z1 = 0 и z2 = 0 (центр плана, на рисунке – тёмная точка). При проведении k параллельных опытов в центре плана среднее значение определяется как среднее арифметическое результатов измерений во всех параллельных опытах:

4.2. Определение кодированных коэффициентов регрессии (ПФЭ) В этом случае используется применяемая при линейном регрессионном анализе матричная формула метода наименьших квадратов (МНК), которая с учётом кодирования факторов имеет вид: где кодированная матрица, зависящая от независимых переменных для двух факторов включает только +1 и -1 и имеет вид: Матрица при активном экспериментировании называется матрицей планирования и обладает тремя оптимальными свойствами: а)симметричности: сумма элементов всех столбцов матрицы, кроме первого (точнее, нулевого) равна нулю б)ортогональности: скалярное произведение двух любых столбцов матрицы равно нулю

в)нормировки: скалярное произведение двух одинаковых столбцов матрицы равно n ( n = 2m в ПФЭ) Благодаря перечисленным оптимальным свойствам матрицы планирования информационная матрица в ПФЭ при m=2 равна т.е. она является диагональной с одинаковыми элементами на главной диагонали, равными n=22=4. Соответственно, корреляционная матрица также будет диагональной и с одинаковыми элементами главной диагонали: Результатом подстановки последних соотношений в матричную формулу для определения кодированных коэффициентов регрессии будет простая формула: При учёте взаимодействия двух факторов z1 и z2 кодированное уравнение регрессии принимает вид: и в матрицу планирования включается ещё один дополнительный последний столбец, каждый элемент которого равен произведению элементов столбцов, соответствующих взаимодействующим факторам При этом матрица планирования сохраняет все три оптимальных свойства – симметричности, ортогональности и нормировки, а кодированный коэффициент уравнения регрессии при члене, характеризующем взаимодействие факторов, определяется по формуле:

В теории ПФЭ доказывается, что при увеличении числа факторов ( m >2 ) матрица планирования строится с использованием рассмотренной методики, в том числе и с учётом взаимодействия факторов (не только двойного, но и тройного, четверного и т.д.). В этом случае число столбцов матрицы p зависит от числа учёта взаимодействий факторов n = 2m и матрица планирования сохраняет перечисленные оптимальные свойства. Поэтому для определения кодированных коэффициентов регрессии используются приведённые выше формулы. Для расчёта натуральных значений коэффициентов в кодированное уравнение регрессии вместо кодированных факторов zj ( j = 1, … m ) следует подставить выражения для последних через натуральные значения факторов x j ( j = 1, … m ) в соответствии с приведённой выше схемой кодирования.

4.3. Определение значимости кодированных коэффициентов регрессии (ПФЭ) Незначимость кодированных коэффициентов регрессии определяется с использованием квантиля t – распределения Стьюдента при помощи неравенства: где β – доверительная вероятность (в инженерных расчётах равная 0,95); feчисло степеней свободы дисперсии воспроизводимости (при одной серии параллельных опытов равная k -1). ____________________________________________________________________________Выборочное значение квадратного корня дисперсии кодированного коэффициента регрессии определяется по формуле: где Se - квадратный корень из дисперсии воспроизводимости, определяемой по k параллельным опытам в центре плана эксперимента: где SSe - сумма квадратов дисперсии воспроизводимости; fe- число степеней свободы дисперсии воспроизводимости. Как было показано выше, диагональные элементы корреляционной матрицы в ПФЭ при кодировании факторов одинаковы и равны 1/n, вследствие чего В результате условие незначимости кодированных коэффициентов регрессии принимает вид: Так как корреляционная матрица в этом случае является диагональной, то кодированные коэффициенты регрессии статистически независимы и при одновременной незначимости нескольких кодированных коэффициентов регрессии они (в отличие от процедуры обработки пассивного эксперимента) могут быть сразу, все вместе, исключены из кодированного уравнения регрессии.

 

4.4. Проверка адекватности уравнения регрессии (ПФЭ) Проводится так же, как и при проведении пассивного эксперимента, с использованием табличного значения критерия Фишера, выбранного при доверительной вероятности β (чаще всего равной 0,95) и числе степеней свободы остаточной дисперсии fR и дисперсии воспроизводимости fe . Условие адекватности проверяется с использованием неравенства: где остаточная дисперсия, характеризующая точность уравнения, определяется по формуле: При этом fR = n - p , где n – число экспериментов при различных значениях факторов; p - число значимых коэффициентов регрессии. К недостаткам ПФЭ относится резкое увеличение числа опытов при возрастании количества факторов больше, чем 5 ( при m = 5 n = 25 = 32 ). Для проведения регрессионного анализа при пренебрежении целым рядом несущественных взаимодействий факторов достаточно проводить меньшее число опытов. В этом случае можно реализовать часть ПФЭ, т.н. дробный факторный эксперимент (ДФЭ), который здесь не рассматривается.

4.5. ОЦКП и обработка его результатов Ортогональный центральный композиционный эксперимент (ОЦКП) относится к экспериментам II – го порядка, так как описывающее его уравнение включает факторы в квадрате и поэтому может описывать поверхности функций отклика в окрестности их экстремальных значений. Для двух факторов ( x1 и x2 ) с учётом только двойного взаимодействия факторов соответствующая эмпирическая модель может быть записана:

В соответствии с методикой ортогонального центрального композиционного плана эксперимента (ОЦКП) здесь, также как и для ПФЭ, осуществляется кодирование факторов по приведённой выше схеме, и для обеспечения ортогонального свойства матрицы планирования эксперимента в уравнение регрессии включается некоторая постоянная S. В результате уравнение регрессии при m = 2 принимает вид:

Для определения большего числа кодированных коэффициентов, чем при обработке ПФЭ, и описания поверхности функции отклика вблизи её экстремума («почти стационарной области»), количество опытов в этом случае увеличивается. При этом опыты, проводимые при ПФЭ n = 2m , дополняются опытами в «звёздных» точках факторного пространства nα = 2m и опытами в центре плана с координатами z1 = 0 и z2 = 0 ( nc ).

 

«Звёздные» точки в факторном пространстве располагаются на осях координат на расстоянии + α и – α от центра плана эксперимента; причём величина α называется «звёздным» плечом и её значения, так же как величина S, определяются из условия ортогональности матрицы планирования для ОЦКП. Общее число опытов N в ортогональном центральном композиционном эксперименте определяется по формуле: N = n + nα + nc , или с учётом приведённых выше равенств: N = 2m + 2m + nc . Для случая двух факторов (m = 2): N = 8 + nc .

Расположение опытных точек в факторном пространстве для случая двух факторов в приведённой ранее кодированной системе координат может быть представлено: План проведения экспериментов в этом случае может быть представлен: Матрица планирования представляет собой часть плана проведения эксперимента без горизонтальных и вертикальных заголовков таблицы и вектора наблюдения (правого столбца).

 

4.6. Определение величины «звёздного плеча» α и S из условия ортогональности матрицы планирования . Матрица планирования была бы ортогональной, если бы выполнялись следующие равенства: и Раскрывая первое равенство, можно получить: Откуда: Раскрывая второе равенство, получаем: Откуда: Последнее выражение используется для определения S. Приравнивая правые части двух выражений для S, можно найти формулу для определения α : В результате звёздное плечо α можно определить по формуле:

4.7. Определение кодированных коэффициентов регрессии (ОЦКП) В соответствии с методом наименьших квадратов эти коэффициенты определяются по матричной формуле: где Из-за свойства ортогональности матрицы планирования необходимо определить только диагональные элементы информационной матрицы: а затем диагональные элементы корреляционной матрицы:

 

 

4.8. Определение диагональных элементов информационной и корреляционной матриц. Обобщая уравнение регрессии на случай m факторов и учитывая только все двойные взаимодействия факторов, число которых определяется по формуле: общее число коэффициентов уравнения регрессии для m факторов равно: диагональные элементы информационной матрицы определяются: i00 = N - число таких элементов равно 1; ijj = n + 2α2 ( j = 1, …m ); iju = n ( u > j ) - число таких элементов равно: Для определения при квадратах факторов ijj можно записать:

Количество таких диагональных элементов – m. Диагональная матрица имеет размер: что соответствует числу определяемых параметров p. В результате диагональная корреляционная матрица размером р х р для m факторов и с учётом их двойных взаимодействий имеет вид: Элементы корреляционной матрицы определяются по матричной формуле МНК: Кодированные коэффициенты регрессии определяются: (число коэффициентов )

Для пересчёта этих коэффициентов регрессии в натуральные значения необходимо вместо кодированных факторов z подставить их натуральные величины xj в соответствии с приведённой схемой кодирования.

4.9. Определение значимости кодированных коэффициентов регрессии (ОЦКП) В отличие от ПФЭ значимость коэффициентов регрессии определяется по разным формулам для различных коэффициентов, так как диагональные элементы корреляционной матрицы отличаются друг от друга. С учётом общей формулы для определения незначимости коэффициентов регрессии незначимость каждого вида коэффициентов регрессии определяется: (число коэффициентов )

4.10. Проверка адекватности уравнения регрессии (ОЦКП) Осуществляется с использованием критерия Фишера – так же, как и в случае с ПФЭ.

4.11. Определение экстремума функции отклика Уравнение регрессии с m факторами вида: может применяться для определения экстремума функции отклика с использованием необходимого условия экстремума функции многих переменных:

 

Полученная система линейных уравнений (СЛАУ) позволяет расчётным путём определить и после подстановки


mylektsii.ru - Мои Лекции - 2015-2019 год. (0.026 сек.)Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав Пожаловаться на материал