![]() Главная страница Случайная страница Разделы сайта АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Лекция №12. Статистические методы апроксимации зависимостей
Различают четыре типа зависимостей между двумя переменными: 1) между неслучайными переменными, не требующую для своего изучения применения статистических методов, 2) между случайной переменной у от неслучайной переменной х, исследуемую методами регрессионного анализа, 3) между случайными переменными у и х, изучаемую методами корреляционного анализа, 4) между неслучайными переменными, когда они обе содержат ошибки измерения, требующую для своего изучения применения конфлюэнтного анализа. Конфлюэнтный анализ следует применять также, когда вместо результатов индивидуальных наблюдений значений у и х используются их средние значения по группам наблюдений. В связи со сложностью разработки общей теории конфлюэнтного анализа он не получил достаточного развития. Необходимо отметить, что в ряде случаев представляется возможным решать задачу конфлюэнтного анализа методами корреляционного и регрессионного анализов [74]. Применение регрессионного анализа для обработки результатов наблюдений связано с меньшим числом ограничений, чем корреляционного анализа, и позволяет получить оценку влияния переменной (аргумента), на переменную, которая считается зависимой от первой. В регрессионном анализе предполагается, что случайная величина у распределена нормально при каждом значении переменной х. Дисперсия у во всем интервале изменения х постоянна или пропорциональна известной функции от х. Вид функции предполагается известным:
Задача заключается в нахождении оценок неизвестных параметров Забиваем Сайты В ТОП КУВАЛДОЙ - Уникальные возможности от SeoHammer
Каждая ссылка анализируется по трем пакетам оценки: SEO, Трафик и SMM.
SeoHammer делает продвижение сайта прозрачным и простым занятием.
Ссылки, вечные ссылки, статьи, упоминания, пресс-релизы - используйте по максимуму потенциал SeoHammer для продвижения вашего сайта.
Что умеет делать SeoHammer
— Продвижение в один клик, интеллектуальный подбор запросов, покупка самых лучших ссылок с высокой степенью качества у лучших бирж ссылок. — Регулярная проверка качества ссылок по более чем 100 показателям и ежедневный пересчет показателей качества проекта. — Все известные форматы ссылок: арендные ссылки, вечные ссылки, публикации (упоминания, мнения, отзывы, статьи, пресс-релизы). — SeoHammer покажет, где рост или падение, а также запросы, на которые нужно обратить внимание. SeoHammer еще предоставляет технологию Буст, она ускоряет продвижение в десятки раз, а первые результаты появляются уже в течение первых 7 дней. Зарегистрироваться и Начать продвижение Оценку параметров
где j - номер испытания при i -том значении х, n- число испытаний при xi, k - число различных значений х. Получаемые оценки параметров являются несмещенными, состоятельными, подчиняются нормальному распределению со средними, равными искомым параметрам, и минимальной дисперсией. Предполагается, что между переменными у и x существует линейная зависимость. Во многих случаях нелинейная связь может быть преобразована в линейную и к анализу результатов наблюдений могут быть применены излагаемые приемы вычислений. Кроме того, принимается, что дисперсия у постоянна во всем интервале изменения х. 12.1 Линейный регрессионный анализ когда Y является функцией одной переменной х:
В результате обработки экспериментальных данных мы должны получить оценку для теоретической линии регрессии:
Для этого минимизируем сумму квадратов отклонений наблюденных значений у от эмпирической линии регрессии:
Дифференцируя с этой целью правую часть выражения по b0 и b1 и приравнивая обе производные нулю, получим после преобразований два уравнения:
Так как сумма отклонений от среднего то получим: Дисперсия значений у, относительно эмпирической линии регрессии оценивается выражением
Проверку гипотезы о линейности связи осуществляют, сопоставляя дисперсию средних
Используя значения s2 и F = s2 / и, если оно меньше значения F, найденного по таблицам для данного уровня значимости а при числе степеней свободы числителя f = k - 2 и знаменателя f = N - k, то гипотеза о линейности не противоречит экспериментальным данным. Когда F незначимо, s2 и
Если каждому значению х соответствует одно значение у, то не представляется возможным оценить ошибку эксперимента. Проверку гипотезы о линейности связи между у и x осуществляют, сопоставляя дисперсию, обусловленную регрессией у на х, расчитываемую по формуле: Сервис онлайн-записи на собственном Telegram-боте
Попробуйте сервис онлайн-записи VisitTime на основе вашего собственного Telegram-бота:— Разгрузит мастера, специалиста или компанию; — Позволит гибко управлять расписанием и загрузкой; — Разошлет оповещения о новых услугах или акциях; — Позволит принять оплату на карту/кошелек/счет; — Позволит записываться на групповые и персональные посещения; — Поможет получить от клиента отзывы о визите к вам; — Включает в себя сервис чаевых. Для новых пользователей первый месяц бесплатно. Зарегистрироваться в сервисе и имеющую число степеней свободы, равное числу независимых переменных (в данном случае - единице), с остаточной дисперсией опытных данных вокруг эмпирической линии регрессии:
При преобразованиях учитывали, что
Число степеней свободы остаточной дисперсии равно f = N - 2. При этом рассчитывают отношение: F = s2p / которое в случае справедливости гипотезы о линейности функции f(х) должно быть равно или больше значения F, найденного из таблиц для данного уровня значимости а при числе степеней свободы: f1 = 1 и f2 = N-2 (12.18) Оценка b0 распределена нормально со средним Оценка b1 распределена нормально со средним
Для повышения точности определения параметров линейной регрессии необходимо иметь по возможности большее число наблюдений и максимально возможную ширину варьирования независимой переменной x. Так как оценка Y является линейной функцией b0 и b1 то она распределена нормально со средним: и дисперсией, оценка которой равна
Дисперсия Y минимальна при х = Проверяют, значимо ли отличаются от нуля свободный член b0 и коэффициент регрессии b1 . Проверку значимости осуществляют, по отношению:
которое сравнивают с табличным значением t для заданного уровня значимости a при числе степеней свободы f = N - 2. Оценку значимости b1 производят по отношению: сопоставляемому с табличным значением t при том же числе степеней свободы f = N - 2. доверительные границы для Y определяют по выражению
где Часто исследователя интересуют доверительные границы для индивидуальных значений зависимой величины y. В этом случае определяют так называемые толерантные пределы представляющие собой две функции Y1(х) и Y2(х), в пространстве между которыми должна находиться величина y(х) с доверительной вероятностью p = 1- a. p{ Y1(х) < y(x) < Y2(х)}> = p = 1- a; (12.26) При этом вероятность получения выборок, у которых доля y(x), попадающих в эти пределы, по величине не меньше р, должна быть равна y. Функции Y1(х) и Y2(х) представляют собой прямые, параллельные Для оценки доли общей дисперсии переменной у, обусловленной влиянием изменения аргумента х, применяют коэффициент детерминации
Остаточное рассеивание переменной у относительно эмпирической линии регрессии можно выразить в долях от общего рассеивания этой величины
|