Разделы сайта

Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Теория однофакторного дисперсионного анализа

⇐ ПредыдущаяСтр 2 из 5Следующая ⇒

При сформулированном выше допущении наш «чёрный ящик» выглядит (см. рисунок) очень просто. Здравый смысл и очевидные соображения подсказывают, что для вы-

явления влияния фактора А на величину от-

ИССЛЕДУЕМАЯ СИСТЕМА клика следует несколько раз (например, n раз)

измерить этот отклик при разных уровнях

Фактор А Отклик У фактора А (например, при а₁, а₂,.. а _i,..., а _n),

получив при этом n штук (y ₁, y ₂, _….. y_i_…, y_n),

Рис. 7.3 по всей видимости, разных значений отклика.

Очевидно, что каждое y_i из этих значений будет определяться реальным средним значением Y (n) _Ср = y_i и прибавкой к нему ± Δ y_i, обусловленной влиянием (если такое влияние имеет место) фактора А на данном (а _i) уровне, и ошибкой ± έ _ипизмерительного прибора.

Фиксируем этот факт математически: y_i = Y _Ср ± Δ y_i ± έ _ип.

Далее Y (n) _Ср будем обозначать символом Yn, а έ _ип – символом έ _n

Соотношение y_i = Y_n ± Δ y_i ± έ n равносильно (y_i – Y_n) = ± Δ y_i ± έ n и говорит о том, что дисперсия σ ²Генеральной совокупности слагается из двух составляющих:

- σ _έ²– дисперсии, обусловленной неточностью измерений έ _n и

- σ _А²– дисперсии, обусловленной возможным влиянием фактора А.

Аддитивность дисперсии позволяет записать: σ ²= σ _А²+ σ _έ²или σ _А²= σ ²– σ _έ².

На базе множества (y_i – Y _n), где i = 1, 2, 3… n,

можно сформировать упомянутую выше исправленную выборочную дисперсию

s_и² = [ (y_i)²– ( y_i)²], которая является оценкой дисперсии σ ²Генеральной совокупности реальных значений отклика (s_и² ~ σ ²), ибо σ _n ²≡ σ ²). Но это – смешанзная оценка (s_и² ~ σ _А²+ σ _έ²) потому, что в ней обе составляющие не разделены. Разделить составляющие этой смешанной оценки, ограничившись только этими n измерениями, невозможно. Предварительно следовало бы найти отдельно оценку s²_и_έ для дисперсии σ _έ² и только потом можно искать σ _А²простым вычитанием: s² – s²_и_έ. ~ σ _А²

Для нахождения выборочной оценки s²_и_έ для дисперсии σ _έ² необходимо создать такую выборку { y_kj } _m из Генеральной совокупности { y_ij }, в которой разброс значений был бы обусловлен только ошибками измерений. Это мог бы быть, например, набор { y_k_j } _m из m значений отклика, полученных в одинаковых условиях эксперимента, включая и постоянство уровня фактора А (один из столбцов: а _i = а _k = Const, а j=1, 2, 3,.., m).

Эта выборзка позволяет вычислить её (выборки) параметры

Y _k= y_k_j и s ²_и_έ _m = (y_k_j – Y _m_k)².

Однако, найденную на базе такой выборки по соответствующей формуле исправленную выборочную дисперсию s²_и_έ _m уже нельзя вычитать из s_и², ибо они не есть слагаемые одной оценки Генеральной дисперсии. Они – параметры разных выборок. Из этого следует, что в ходе эксперимента необходимо получить ещё одну выборку { y_i_j }_q – такую, на базе которой можно вычислить и s²_и_q_έ, и s_q².

Реализовать это можно следующим образом.

Выполнив эксперимент, который был выше представлен первым и предполагал, что y_k_j = Y _k ± Δ _k_j ± έ _k_j, и получив m значений отклика, нужно проделать эту же операцию n раз и получить n малых выборок типа{ y_i_j } _m, где j=1, 2, 3,.., m, и i=1, 2, 3,.., n.

Получившаяся новая большая выборка { y_i_j }_q – выборка из Генеральной совокупности с объёмом q = nm. то есть для неё теперь Y(nm) _Ср ≡ Y_q = y_i_j.

В итоге мы можем записать: σ _q² = σ _А²+ σ _έ², где:

- σ _έ² – дисперсия, обусловленная инструментальной погрешностью, которая не зависит от индекса измеряемого параметра, а σ _q²≡ σ ²– общая дисперсия большой Генеральной совокупности { y }, выборочной оценкой для которой теперь будет

s _q²= (Σ _q): f _q= (Σ _nm): f_nm = [ (y_i_j)² – ( y_i_j )² ] =

= [СК_q – КЧ_q]. где: - nm – объём большой выборки и потому выше:

- f _q= nm–1 ≡ f_n_m, - (Σ _q) = СК _n_m– КЧ _n_m ≡ СК_q – КЧ_q = (Σ _n_m)

- СК_q = (y_i_j)² ≡ (y_n_m)²= СК _n_m и

- КЧ_q = ( y_i_j)²≡ ( y_k_m)²= КЧ _n_m

Общая дисперсия σ ², как и всегда, выглядит составленной из дисперсии σ _q_ип²≡ σ _έ², которая обусловлена только случайными факторами, и дисперсии σ _А², которая обусловлена только изменениями уровня фактора А, то есть: σ ²= σ _А²+ σ _έ².

Если теперь на базе любой части { y_k_j) _m общей выборки { y_i_j }_q, которая получена при одном и том же значении фактора А, то есть на базе малой выборки { y_k_j) _m при i=k, вычислить исправленную выборочную дисперсию s ²_έ _m = (y_k_j– Y _k)², тоона будет оценкой групповой исправленной дисперсии малой выборки.

Таких оценок здесь будет n штук, и каждая из них будет характеризовать разброс значений отклика, обусловленный внутри своей малой выборки только случайными факторами.

Но n штук малых выборок образуют большую выборку из единой Генеральной совокупности всех возможных значений отклика. В таких случаях математическая статистика позволяет усреднять групповые оценки s ²_έ _m, а результат усреднения s ²_έ_q – рассматривать в качестве выборочной оценки s ²_έ_q дисперсии σ _έ_q²≡ σ _έ²≡ σ _вэ², которую ещё называют дисперсией воспроизводимости эксперимента (s ²_έ_q ≡ s ²_вэ ~ σ _έ²).

Итак, s ²_έ_q ≡ s ²_вэ = [s²_έ _m ], а s ²_έ _m = [ (y_k_j)² – ( y_k_j)²].

То есть s ²_вэ = [ (y_k_j)² – ( y_k_j)²] =

= [ (y_k_j)² – ( y_k_j)²] = [СК_q – КЧ_q].

Количество степеней свободы дисперсии воспроизводимости f _{έ в}= n (m- 1).

Особо подчеркнём, что СК_q= (y_k_j)²= (y_i_j)², а корректирующий член КЧ_q _“собирает ” со всей выборки средние квадраты откликов, вычисленные в каждом столбце. В связи с этим (в столбце фактор А остаётся неизменным) и КЧ_q можно обозначить КЧ_q_А≡ _. КЧ_А – корректирующий член, обусловленный фактором А.

Действительно, КЧ_q= ( y_k_j)² ≡ ( y_i_j)²] = КЧ_q_А≡ _. КЧ_А

Всё это означает, что мы можем переписать выражение для выборочной оценки дисперсии воспроизводимости (повторим, что именно так в теории эксперимента часто называют дисперсию, обусловленную множеством сопровождающих эксперимент случайных факторов, включая ошибки измерений):

s ²_вэ ≡ s ²_έ_q = [СК_q – КЧ_q_А] = (Σ _вэ): f _вэ, где - f _вэ= n (m-1),

- (Σ _έ)_q = [СК_q – КЧ_А]

- СК_q = (y_i_j)²и

- КЧ_А = ( y_k_j)².

В этих условиях, в условиях одной большой выборки, где σ ² = σ _А²+ σ _έ²,

а σ _έ² ≡ σ _έ_q, полученные выборочные оценки уже можно комбинировать, то есть выразить: s ² – s ²_вэ ~ σ _qА², то есть s ² – s ²_вэ ~ σ _А², где s ² ~ σ ², s ²_вэ ~ σ _έ²и

s ²= [СК_q – КЧ_q], а s ²_вэ ≡ s ²_έ_q = [СК_q – КЧ_А].

- s ²= s _q²= (Σ _q): f _q = (Σ): f при (Σ _q)≡ (Σ) = [СК – КЧ] и f _q ≡ f = nm– 1;

- s ²_вэ≡ s ²_έ_q= (Σ _έ_q): f _έ_q = (Σ _έ): f _έ при (Σ _вэ) =[СК_q – КЧ_q] = [СК – КЧ_А] и f _вэ = n (m– 1).

Таким образом, составляющие смешанной оценки для σ ²разделены, а

[СК_q – КЧ_q] – [СК_q – КЧ_А] ~ σ _А²

Но это ещё не вся информация, которую можно извлечь из результатов только что представленного здесь теоретически (мысленного) однофакторного эксперимента, в котором использовалась выборка объёмом q = m х n.

На базе каждой из n введённых в рассмотрение выше малых выборок, кроме представленной выше собственной групповой дисперсии s ²_έ _m, можно вычислить групповое среднее значение отклика Y_k_m = y_k_j. Таких средних будет n штук, все они будут разными и отличающимися от всеобщего среднего – среднего большой выборки Y _q= y_i_j . Это означает, что будут существовать ещё и n штук разностей типа (Y_m _q –Y _q), на базе которых можно вычислить некую (ещё одну) выборочную дисперсию

s ²_нвыб = (Y_m_k–Y _q)² = [ (Y_m_k)²– ( Y _q)²], которая является оценкой (s ²_нвыб≡ s ²_мг) межгрупповой дисперсии σ _мг²= σ _А²+ σ _ип², обусловленной и ожидаемым влиянием фактора А и неизбежным в ходе эксперимента влиянием случайных факторов. В составе этой дисперсии составляющая от случайных ошибок σ _ип= σ _έ²– уменьшенная в m раз дисперсия σ _ип ≡ σ _έ²(σ _мг²= σ _А²+ σ _έ²) потому, что она входит в левую часть этого соотношения через вычисления группового среднего, при которых

( при вычислениях по формуле Y_m_k = y_k_j) такие ошибки усредняются.

При справедливости соотношений:

[ (Y_m_k)²– ( Y _q)²] ~ σ _мг²и σ _мг²= σ _А²+ σ _έ², очевидно, что

S _мг ~ σ _А²+ σ _έ²или [ (Y_m_k)²– ( Y _q)²] ~ σ _А² + σ _έ²

Переписав последнее соотношение в несколько ином виде, получаем:

s ²_мг = [ (Y_m_k)²– ( Y _q)²] ~ mσ _А²+ σ _έ² или s ²_мг ~ mσ _А²+ σ _έ²,

откуда следует более точная по сравнению с полученной на предыдущем листе выборочная оценка s ²_А дисперсии σ _А², обусловленной возможным влиянием исследуемого фактора А:

(s _мг² – s _έ²) ~ σ _А²

Приглядимся более внимательно к выборочной оценке s ²_мг для σ _мг²

s ²_мг= [ (Y_m_k) ²– ( Y _q)²]

Во-первых, как обычно, s ²_мг= (Σ _мг): f _мг) Здесь f _мг = n– 1, следовательно,

(Σ _мг) = m [(Y_m_k)²– ( Y _q)²].

Во-вторых, (Y_m_k) ²= ( y_k_j)²= [ ( y_k_j)²]= КЧ_А _.

В-третьих, [(Y _q)²= (Y _q)²( 1)²= n ² (Y _q)²= n ( y_i_j)²=

=[ ( y_i_j)²] = КЧ_q ≡ КЧ_q≡ КЧ.

В итоге имеем:

(Σ _мг) = m [ [(Y_m_k)²– ( Y _q)²] = m { КЧ_А – КЧ } = [КЧ_А– КЧ]

Вспомним теперь ранее полученные соотношения:

(Σ _q) ≡ (Σ) = [СК – КЧ] и (Σ _έ) = [СК – КЧ_А].

Сопоставив их с только что полученным (Σ _мг) = [КЧ_А – КЧ], обнаруживаем:

(Σ _q) – (Σ _έ) = [СК – КЧ – СК + КЧ_А] = [КЧ_А – КЧ] = (Σ _мг).

Мы, следовательно, выяснили, что после вычисления выборочных оценок дисперсий mσ _А²+ σ _έ² и σ ²можно непосредственно вычислить остаточную сумму (Σ _мг), которая потребуется для последующего нахождения выборочной оценки s²_вэ дисперсии воспроизводимости σ _вэ²и уточнить оценку для σ _А².

Всё это означает, что представленный выше теоретически однофакторный эксперимент позволяет найти две (одна из которых уточняет другую) выборочные оценки для дисперсии σ _А², обусловленной влиянием фактора А. Следовательно, такой эксперимент способен решить основную задачу дисперсионного анализа – задачу разделения составляющих общей дисперсии, а только что рассмотренные соотношения позволяют выполнить все необходимые вычисления, используя измеренные в ходе опытов значения { y_l_j } отклика.

Проблему решают три промежуточных интегральных параметра одной и той же выборки СК, КЧ, КЧ_А.

Планирование эксперимента при однофакторном дисперсионном анализе.

Представленные в предыдущем параграфе теоретические соображения, казалось бы, полностью определяют план эксперимента при однофакторном дисперсионном анализе. Этот план должен выглядеть в форме прямоугольной таблицы (см. таблицы ниже), в

План-матрица однофакторного эксперимента при дисперсионном анализе

Уровни фактора А

Номер опыта	a₁	a₂	a₃	A _i	a_n
	y₁₁	y₂₁	y₃₁	….y _i ₁….	y_n₁
	y₁₂	y₂₂	y₃₂	….y _i ₂….	y_n₂
	y₁₃	y₂₃	y₃₃	….y _i ₃….	y_n₃
…. j ….	…. y₁ _j ….	…. y₂….	…. y_{3 j}….	…. ….y _ij …. ….	…. y_n _j ….
m	y₁_m	y₂_m	y₃_m	….y _i _m….	y_n_m

соответствующие клеточки которой по ходу эксперимента будут вписываться измеренные значения отклика – элементы множества { y_i_j }.

Подготовка план-матрицы представляет собой очень малую (только формализованную в рамках приведённых в предыдущем параграфе теоретических рассуждений) часть планирования эксперимента.

Большую часть планирования составляют операции, связанные с подготовкой объекта эксперимента, средств измерения, с обеспечением необходимых условий проведения опытов и сохранения их неизменными в ходе всего эксперимента, а также с правильным оформлением сопровождающей эксперимент документации (соответствующим образом оформленная методика, журнал регистрации хода и данных опытов, передача смен и т. п.).

Эти аспекты планирования (традиционные и рутинные) здесь не рассматриваются. Более существенными для нас выглядят вопросы технологии обработки данных, которые получают в ходе опытов, и оформления итогов эксперимента в целом. Такие итоги

оформляются в таблицу, макет которой приведён на следующем листе.

Вначале представлены форма и содержание Итоговой таблицы, но не её окончательный вид и не тот вид, в котором она предстанет перед экспериментом.

План эксперимента и Итоговую таблицу (см. следующий лист) целесообразно подготовить заблаговременно в форме единой электронной (например, в Exzele) рабочей таблицы.

Первые слева колонки таблицы (в объёме представленной выше план-матрицы) следует оставить («зарезервировать») для последующего внесения в них (перенос из рабочего журнала после окончания эксперимента) измеренных в опытах значений { y_i_j } отклика. До окончания эксперимента все m строк в n столбцах исходной таблицы будут оставаться незаполненными.

Незаполненными до конца эксперимента будут оставаться третий и пятый столбцы Итоговой таблицы, (её макет представлен ниже), предназначенные для внесения

Макет итоговой таблицы однофакторного эксперимента

Источники дисперсии	Матема-тическое ожидание дисперсии	Итоговая сумма квадратов дисперсии (Σ) = СК – КЧ	Кол-во степеней свободы f дисперсии	Выборочная оценка дисперсии
Эксперимент в целом	σ ²	(Σ _l_j) = СК _l_j – КЧ _l_j	f_l_j = nm-1	(Σ _l_j): (nm-1)
Случайные факторы	σ _έ²	(Σ _έ) = СК _l_j– КЧ_А	f _έ= n (m-1)	(Σ _έ): n (m-1)
Исследуемый фактор А	mσ _А²+ σ _έ²	(Σ _нвыб) =КЧ_А–КЧ _l_j	f _нвыб= n-1	(Σ _нвыб): (n -1)

Примечаие: f _έ= f_l_j - f _А _j = nm-1- n+1 = n (m-1)

в нихпромежуточных и окончательных результатов обработки экспериментальных данных. Поэтому заготовленная в рамках единой электронной таблицы Итоговая таблица будет выглядеть иначе (См. ниже). В ней заполнены только те колонки, данные для которых уже известны на момент составления плана, – известны из представленного в параграфе 7.1 теоретического анализа, который, конечно же, всегда предшествует эксперименту. Что касается “ пустых» клеток таблицы, то они пусты только внешне. На самом деле в них в ходе программирования эксперимента и вносятся (в режиме записи «невидимых» формул) представленные выше на макете соотношения. По этим соотношениям электронная таблица подсчитает и автоматически внесёт в соответствующую клетку таблицы получившийся там результат обработки данных.

Итоговая таблица однофакторного эксперимента

Источник дисперсии	Матема-тическое ожидание дисперсии	Итоговая сумма квадратов дисперсии (Σ) = [СК – КЧ]	Кол-во степеней свободы f дисперсии	Выборочная оценкаs² дисперсии
Эксперимент целиком	σ ²		f_l_j = nm-1
Случайные факторы	σ _έ²		f _έ= n (m-1)
Исследуемый фактор А	mσ _А² + σ _έ²		f _А= n-1
s _А²выборочная оценка дисперсии

В нижней правой клетке должна «сработать» формула: s _А² = (s _мг² – s _έ_q²)

Однако, такой автоматизм следует программно подготовить.

Рассмотрим, что для этого следует предусмотреть в этой же электронной таблице.

В первой сроке третьего столбца Итоговой таблицы, как это показано на её макете, должна находиться итоговая сумм всеобщей дисперсии (Σ _uj), которая вычисляется по формуле: (Σ _lj) = [СК _lj– КЧ _lj ]. Именно эта формула и должна быть записана в этой, якобы “ пустой ” ячейке электронной таблицы. Тогда сумма появится в Итоговой таблице автоматически. Но для записи этой формулы в электронную таблицу нужно знать номера двух ячеек этой же электронной таблицы, в которых предварительно заготовлены СК _lj и КЧ _lj. Следовательно, в ходе подготовки плана следует предусмотреть ещё две рабочие ячейки, и в одну из них записать формулу

СК_i _j = y_uj ², а в другую – КЧ _lj = ( y_uj)².

Такие же рассуждения справедливы и относительно формул, которые где-то надо записать, чтобы нужные во второй и третьей строках этого же столбца итоговые формулы

((Σ _έ) = [СК _lj– КЧ_А] и (Σ _мг) = [КЧ_А – КЧ _lj ]) «сработали ” соответствующим образом.

Все подобные формулы сложны и громоздки для использования в электронных таблицах. Поэтому на практике следует действовать иначе: вначале “ запасаться ” промежуточными величинами, которые считаются по относительно простым формулам.

В данном случае поступают следующим образом. В строке электронной таблицы, следующей сразу после план-матрицы (на приведённой ниже таблице план-матрица обведена «жирной» линией, а строка помечена символом А_l) в каждой из n ячеек размещается одна та же формула А _l = y_lj, по которой считается сумма всех откликов соответствующего столбца (заметим, что в ячейках одного столбца исследуемый фактор А не изменяется, но вычисляемая сумма будет изменятся вместе с номером столбца и эти изменения будут обусловлены только изменением уровня фактора А, чем и объясняется использование здесь символа А _l). В следующей строке аналогичным образом можно разместить (А _l)² и далее суммирование всех (А _l)², а в самой правой ячейке этой же строки можно разместить формулу для вычисления корректирующего члена.

Ниже в рабочей таблице следует продублировать ячейки основной план-матрицы, разместив в каждой из них алгоритм возведения в квадрат значений отклика, измеренного в каждом опыте. Эти квадраты ({ y_i_j ²}) потребуются в формуле, по которой электронная таблица в (n +2)^ойячейке этой последней строки вычислит и здесь же “ запасёт ” СК _i_j. Присмотревшись внимательно к дополненной таким образом исходной план-матрице, легко обнаружить, что в ней уже присутствуют не только все промежуточные величины, но и необходимые для вычисления представленных выше трёх итоговых сумм

((Σ _ij), (Σ _έ) и (Σ _мг)) их основные слагаемые КЧ _ij, СК _ij и КЧ_А.

Номера именно этих трёх ячеек должны фигурировать в алгоритмах вычислений, которые будут вписываться в якобы «пустые» ячейки третьей колонки Итоговой таблицы эксперимента, подготавливаемой в ходе его планирования.

Подготовка электронной таблицы

для учёта и автоматизированной обработки опытных данных

в ходе эксперимента при однофакторном дисперсионном анализе

n– количество уровней фактора А, m – количество опытов на каждом уровне.

Уровни фактора А

Номер опыта	a₁	a₂	a₃	a _l	а_n	n	nm
	y₁₁	y₂₁	y₃₁	….y _l ₁	y_n₁		-
	y₁₂	y₂₂	y₃₂	….y _l ₂	y_n₂	-	-
	y₁₃	y₂₃	y₃₃	….y_i3	y_n₃	-	-
j	y₁_j	y_2j	y_3j	.y _l _j…	y_nj	-	-
m	y₁_m	y_2m	y_3m	….y _l _m.	y_nm	-	-
А _l	y_1j	y_2j	y₃	.. y_l_j.	y _n _j	y_l_j	КЧ _lj
(А _l)²	(А₁ )²	(А₂ )²	(А₂ )²	. (А _l)²	(А _n)²	(А _l)²	КЧ_A
	y²₁₁	y²₂₁	y²₃₁	….y² _l ₁	y²_n1	-	-
	y²₁₂	y²₂₂	y²₃₂	….y² _l ₂	y² _{n 2}	-	-
	y²₁₃	y²₂₃	y²₃₃	….y² _l ₃	y²_n3	-	-
… ..j ….	…. y²₁ _j ….	… y²₂_j ….	…. y²₃_j ….	….. ….y² _l …….	….. y²_n_j ….	-	-
m	y²₁_m	y²₂_m	y²₃_m	….y² _l _m	y²_nm	-	-
y ² _lj	y ² ₁_j	y ² ₂_j	y ² ₃_j	y ² _lj_.	y ²_n _j	-	СК _lj

Рабочие оценки дисперсии (s ² – s ²_вэ) ~ σ _А²– грубая оценкаи

(s _мг² – s _έ²) ~ σ _А² – уточнённая оценка) должны быть программно проверены на значимость по известным в математической статистике табличным критериям проверки гипотез за пределами Итоговой таблицы.

⇐ Предыдущая 123 4 5 Следующая ⇒

© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.