Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






  • Сервис онлайн-записи на собственном Telegram-боте
    Тот, кто работает в сфере услуг, знает — без ведения записи клиентов никуда. Мало того, что нужно видеть свое расписание, но и напоминать клиентам о визитах тоже. Нашли самый бюджетный и оптимальный вариант: сервис VisitTime.
    Для новых пользователей первый месяц бесплатно.
    Чат-бот для мастеров и специалистов, который упрощает ведение записей:
    Сам записывает клиентов и напоминает им о визите;
    Персонализирует скидки, чаевые, кэшбэк и предоплаты;
    Увеличивает доходимость и помогает больше зарабатывать;
    Начать пользоваться сервисом
  • Краткие теоретические сведения. Условное среднее – среднее арифметическое наблюдавшихся значений величины Y, соответствующих X=x






    Условное среднее – среднее арифметическое наблюдавшихся значений величины Y, соответствующих X=x. Функция изменения условного среднего от независимой переменной X называется уравнением регрессии. Уравнения регрессии строятся для зависимых переменных. Эти переменные входят в левую часть уравнения. Независимые переменные входят в правую часть уравнения и позволяют предсказывать зависимую переменную.

    Предсказанные значения зависимой переменной – значения , вычисленные по уравнению регрессии с оцененными коэффициентами регрессии.

    Остатки – разности между наблюдаемыми и предсказанными значениями зависимой переменной:

    Сумма квадратов остатков - сумма вида:

    Сумма квадратов зависимой переменной, скорректированная на среднее

    Сумма квадратов предсказанной зависимой переменной, скорректированная на среднее

    Известно, что для суммы квадратов указанных величин, выполняется равенство:

    .

    Коэффициент детерминации и скорректированный коэффициент детерминации

    , ,

    где: – число наблюдений, – число параметров модели (число независимых переменных плюс 1, так как обычно в модель включается свободный член).

    Наибольшее применение получили уравнения регрессии, отражающие взаимосвязь одной зависимой переменной с одной (парная регрессия) или несколькими (множественная регрессия) независимыми переменными.

    Чаще всего используют следующие парные и множественные зависимости:

    1) Парная и множественная линейная регрессия:

    , (4.1)

    2) Парная и множественная параболическая регрессия:

    , (4.2)

    3) Парная и множественная гиперболическая регрессия:

    , (4.3)

    4) Парная и множественная степенная регрессия:

    , (4.4)

    5) Парная и множественная показательная регрессия:

    , , (4.5)

    Обычно стараются использовать линейные зависимости или зависимости, которые приводят к линейным путям преобразования переменных. Параметры уравнения регрессии подбираются методом наименьших квадратов. Он обеспечивает минимальную сумму квадратов отклонений фактических величин Y от вычисленных по уравнению регрессии для заданных значений независимых переменных.

    Для линейной регрессии парного типа коэффициенты и находятся из решения системы уравнений:

    , (4.6)

    где: , , , .

    Данная система получается путем минимизации функционала .

    Из решения системы (6) получаем:

    , (4.7)

    . (4.8)

    Таким образом, функция множественной регрессии имеет вид:

    , (4.9)

    где: – функция остатков с нулевым средним и неизвестной дисперсией, определяющая случайное отклонение зависимой переменной от уравнения регрессии. Предполагается, что величины не коррелированны в разных опытах. Часто считают, что остатки нормально распределены.

    Регрессионный анализ данных предполагает, что выбирается наиболее оптимальный вид функции регрессии из набора (4.1) – (4.5), оцениваются коэффициенты функции регрессии и строятся для них доверительные интервалы, проверяется гипотеза о значимости регрессии, оценивается степень адекватности модели и т.д.

    Обычно подбор уравнения регрессии осуществляют по шагам. На первом этапе выбирают зависимую переменную и одну наиболее весомую независимую переменную, полученную по результатам корреляционного анализа. Далее строят парную зависимость, определяют коэффициент корреляции и его значимость. На втором шаге добавляют следующую весомую переменную и строят регрессионное уравнение зависимой переменной Y от двух выбранных независимых переменных. Определяют коэффициент множественной корреляции и оценивают регрессию. Далее при необходимости добавляют следующую переменную и т.д. Возможен обратный путь, связанный с поэтапным исключением малозначащих переменных. На каждом шаге проводят графический анализ данных, исключают некоторые аномальные наблюдения и оценивают значимость регрессии. Оценка степени адекватности модели осуществляется путем применения различных процедур анализа распределения остатков.

    Увеличение размерности уравнений регрессии увеличивает значение коэффициента детерминации. Однако увеличивать размерность (более 2 – 3-х переменных в модели) путем добавления новых независимых переменных имеет смысл, когда наблюдается явное улучшение показателей регрессии: увеличение коэффициента детерминации RI и уменьшение суммы квадратов остатков . Следует придерживаться общего правила, что не следует гнаться за чрезмерной сложностью модели.

    Для оценки значимости уравнения регрессии в целом применяют F -критерий:

    .

    F- критерий используется для проверки гипотезы о значимости регрессии. Она утверждает, что между зависимой переменной и независимыми переменными нет линейной связи, то есть что коэффициенты регрессии равны нулю, против альтернативы, что они не равны нулю. Для проверки гипотезы расчетное значение F -критерия сравнивается с табличным значением F -критерия при уровне значимости и степенях свободы. Если , то уравнение регрессии можно признать статистически значимым, т.е. гипотеза о значимости регрессии подтверждается. Табличные значения F-критерия (критерия Фишера) приводятся в приложении 1.

    Оценка значимости независимых переменных осуществляется на основе t- критерия

    ,

    где: – численное значение i- того коэффициента уравнения множественной регрессии;

    – среднеквадратичное отклонение параметра как случайной величины относительно среднего уровня.

    Расчетное значение t- критерия сравнивают по абсолютной величине с табличным значением t- критерия при заданном уровне значимости и степенях свободы. Если , то параметр считается значимым и соответствующая независимая переменная отбирается в уравнение множественной регрессии. Табличные значения t -критерия (критерия Стъюдента) приводятся в приложении 2.

    В случае если данные подчинены нелинейной связи, то используют преобразованные переменные: и для уравнений вида (4), и для уравнений вида (3), и для уравнений вида (5), и для уравнений вида (2) и т.д. При таком преобразовании переменных задача сводится к определению линейного уравнения регрессии вида (1). Исходные нелинейные связи можно установить на основе визуализации данных при анализе парных связей.

     






    © 2023 :: MyLektsii.ru :: Мои Лекции
    Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
    Копирование текстов разрешено только с указанием индексируемой ссылки на источник.