Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Ошибочная оценка условий применимости линейного уравнения регрессии






 

Широкое распространение электронных таблиц и программного обеспечения для статистических расчетов ликвидировало вычислительные проблемы, препятствовав­шие применению регрессионного анализа. Однако это привело к тому, что регрессион­ный анализ стали применять пользователи, не обладающие достаточной квалификаци­ей и знаниями. Многие из них вообще не имеют ни малейшего понятия об условиях применимости метода наименьших квадратов и не умеют проверять их выполнение. Используют регрессионный анализ без глубоких знаний о предмете исследования. Зачастую пытаются экстраполировать полученную регрессионную модель за пределы диапазона изменения объясняющей пере­менной.

Исследователь не должен увлекаться перемалыванием чисел — вычислением коэффициентов регрессии и коэффициента смешанной корреляции. Ему нужны более глубокие зна­ния. Проиллюстрируем это рядом примеров, представленных ниже в виде 4-х наборов статистических данных.

 

 

Набор I Набор II Набор III Набор IV
X Y X Y X Y X Y
  8, 04   9, 14   7, 46   6, 58
  9, 96   8, 10   8, 84   5, 76
  5, 68   4, 74   5, 73   7, 71
  6, 95   8, 14   6, 77   8, 84
  8, 81   8, 77   7, 11   8, 47
  10, 84   9, 13   8, 15   7, 04
  4, 26   3, 10   5, 39   5, 25
  4, 82   7, 26   6, 42   12, 50
  8, 33   9, 26   7, 81   5, 56
  7, 58   8, 74   12, 74   7, 91
  7, 24   6, 13   6, 08   6, 89

 

Все представленные виды экспериментальных данных, если к ним применить модель линейной регрессии, имеют одни и те же статистические параметры:

Далее для каждого набора (I - IV) приведены диаграммы разброса и графики остатков, свидетельствующие о существенном их различии.

 

 

 

 

 

 

 

 

 

Итак, с точки зрения регрессионного анализа все эти наборы данных совершенно идентичны. Если бы анализ был на этом закончен, мы потеряли бы много полезной ин­формации. Диаграммы разброса и графики остатков свидетельствуют о том, что эти данные от­личаются друг от друга. Единственный набор, распределенный вдоль прямой линии, — набор I. График остатков, вычисленных по набору I, не имеет никакой закономерно­сти. Этого нельзя сказать о наборах II, III и IV. График разброса, построенный по набо­ру II, демонстрирует ярко выраженную квадратичную модель. Этот вывод подтверждается графиком остатков, имеющим параболическую форму. Диа­грамма разброса и график остатков показывают, что набор данных III содержит выброс. В этой ситуации необходимо исключить выброс из набора данных и повторить анализ. После исключения выброса результат повторной оценки модели может оказаться совершенно иным. Диаграмма разброса, построенная по данным из набора IV, иллюстрирует необычную ситуацию, в которой эмпирическая модель значи­тельно зависит от отдельного отклика (Х 8 = 19, Y 8 = 12, 5). Такие регрессионные модели необходимо вычислять особенно тщательно.

Итак, графики остатков и диаграммы разброса являются крайне необходимыми инструментами регрессион­ного анализа и должны быть его неотъемлемой частью. Без них регрессионный анализ не заслуживает доверия.

 

 






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.