![]() Главная страница Случайная страница Разделы сайта АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Краткие теоретические сведения. Условное среднее – среднее арифметическое наблюдавшихся значений величины Y, соответствующих X=x
Условное среднее Предсказанные значения зависимой переменной – значения Остатки – разности между наблюдаемыми и предсказанными значениями зависимой переменной: Сумма квадратов остатков - сумма вида: Сумма квадратов зависимой переменной, скорректированная на среднее Сумма квадратов предсказанной зависимой переменной, скорректированная на среднее Известно, что для суммы квадратов указанных величин, выполняется равенство:
Коэффициент детерминации и скорректированный коэффициент детерминации
где: Наибольшее применение получили уравнения регрессии, отражающие взаимосвязь одной зависимой переменной с одной (парная регрессия) или несколькими (множественная регрессия) независимыми переменными. Чаще всего используют следующие парные и множественные зависимости: 1) Парная и множественная линейная регрессия:
2) Парная и множественная параболическая регрессия:
3) Парная и множественная гиперболическая регрессия:
4) Парная и множественная степенная регрессия:
5) Парная и множественная показательная регрессия:
Обычно стараются использовать линейные зависимости или зависимости, которые приводят к линейным путям преобразования переменных. Параметры уравнения регрессии подбираются методом наименьших квадратов. Он обеспечивает минимальную сумму квадратов отклонений фактических величин Y от вычисленных по уравнению регрессии для заданных значений независимых переменных. Для линейной регрессии парного типа
где: Данная система получается путем минимизации функционала Из решения системы (6) получаем:
Таким образом, функция множественной регрессии имеет вид:
где: Регрессионный анализ данных предполагает, что выбирается наиболее оптимальный вид функции регрессии Обычно подбор уравнения регрессии осуществляют по шагам. На первом этапе выбирают зависимую переменную и одну наиболее весомую независимую переменную, полученную по результатам корреляционного анализа. Далее строят парную зависимость, определяют коэффициент корреляции и его значимость. На втором шаге добавляют следующую весомую переменную и строят регрессионное уравнение зависимой переменной Y от двух выбранных независимых переменных. Определяют коэффициент множественной корреляции и оценивают регрессию. Далее при необходимости добавляют следующую переменную и т.д. Возможен обратный путь, связанный с поэтапным исключением малозначащих переменных. На каждом шаге проводят графический анализ данных, исключают некоторые аномальные наблюдения и оценивают значимость регрессии. Оценка степени адекватности модели осуществляется путем применения различных процедур анализа распределения остатков. Увеличение размерности уравнений регрессии увеличивает значение коэффициента детерминации. Однако увеличивать размерность (более 2 – 3-х переменных в модели) путем добавления новых независимых переменных имеет смысл, когда наблюдается явное улучшение показателей регрессии: увеличение коэффициента детерминации RI и уменьшение суммы квадратов остатков Для оценки значимости уравнения регрессии в целом применяют F -критерий:
F- критерий используется для проверки гипотезы о значимости регрессии. Она утверждает, что между зависимой переменной и независимыми переменными нет линейной связи, то есть что коэффициенты регрессии равны нулю, против альтернативы, что они не равны нулю. Для проверки гипотезы расчетное значение F -критерия сравнивается с табличным значением F -критерия при уровне значимости Оценка значимости независимых переменных осуществляется на основе t- критерия
где:
Расчетное значение t- критерия сравнивают по абсолютной величине с табличным значением t- критерия при заданном уровне значимости В случае если данные подчинены нелинейной связи, то используют преобразованные переменные:
|