Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






  • Как продвинуть сайт на первые места?
    Вы создали или только планируете создать свой сайт, но не знаете, как продвигать? Продвижение сайта – это не просто процесс, а целый комплекс мероприятий, направленных на увеличение его посещаемости и повышение его позиций в поисковых системах.
    Ускорение продвижения
    Если вам трудно попасть на первые места в поиске самостоятельно, попробуйте технологию Буст, она ускоряет продвижение в десятки раз, а первые результаты появляются уже в течение первых 7 дней. Если ни один запрос у вас не продвинется в Топ10 за месяц, то в SeoHammer за бустер вернут деньги.
    Начать продвижение сайта
  • График эмпирической функции распределения






    5) Мода - значение признака с наибольшей частотой;

    Медиана значение признака, расположенного в середине ряда распределения. Мода и медиана являются структурными (распределительными) средними.

    Для определения моды сначала находят интервал с наибольшей частотой = 8. В этом интервале число правильных ответов 32-36. Точное значение моды находят путем интерполяции по формуле

    Где h - шаг интервала, - частота предмодального интервала, - частота постмодального интервала.

    = 4=34

     

    Значение медианы также определяем путем интерполяции по формуле

    .

    - накопленные частоты интервалов, предшествующих меданному.

    - локальная частота интервала, в котором находятся единицы совокупности, делящие ряд пополам, медианного интервала.

    , следовательно медианным является интервал с накопленной частотой 20, его частота составляет =10, =17.

    4=33, 5

    xi                  
    ni                  

     

    Найдем методом произведений выборочные: среднюю, дисперсию, среднее квадратическое отклонение, начальные и центральные моменты до четвертого порядка включительно.

    Составляем таблицу:

    Таблица 1.

        -4 -4   -64    
        -3 -12   -108    
        -2 -12   -48    
        -1 -6   -6    
                   
                   
                   
                   
                   
                   
    n=40   = -2 =170  
     
                       

     

    В качестве ложного нуля принимаем С= 34– варианта с наибольшей частотой 10 и находящаяся в середине вариационного ряда. Шаг выборки h=4. Тогда условные варианты определяются по формуле

    .

    Подсчитываем все варианты и заполняем все столбцы.

    Последний столбец служит для контроля вычислений по тождеству:

    = + 4 + 6 n= +4 +6 170 +4 +40= .

    Вычисления произведены верно. Найдем условные начальные моменты.

    . = 4, 25.

    - условные начальные моменты к- го порядка

    Вычисляем выборочную среднюю:

    = 3, 8.

    Находим выборочную дисперсию:

    = = 4, 2475 = 67, 96.

    Определяем выборочное среднее квадратическое отклонение:

    = = =8, 2437.

    = . = центральные эмпирические моменты третьего и четвертого порядков.

    Эти моменты в случае равноотстоящих вариант с шагом вычисляются по формулам:

    Ассиметрия и эксцесс определяются равенствами: ,

    ,

    ,

    . = 4, 25.

    = =2, 08725 = 133, 584

    = =42, 4 = 10855, 3552

    Коэффициент вариации находим по формуле:

    · 100%. · 100% =24, 39 %.

    6. Строим нормальную кривую.

    Для облегчения вычислений все расчеты сводим в таблицу 2

     

    Таблица 2.

    = = 19, 4
        -15, 8 -1, 91654 0, 0644 1, 24936
        -11, 8 -1, 43134 0, 1435 2, 7839
        -7, 8 -0, 94614 0, 2565 4, 9761
        -3, 8 -0, 46094 0, 3589 6, 96266
        0, 2 0, 02426 0, 3989 7, 73866
        4, 2 0, 50946 0, 3521 6, 83074
        8, 2 0, 99466 0, 2444 4, 74136 5
        12, 2 1, 47986 0, 1334 2, 58796
        16, 2 1, 96506 0, 058 1, 1252
      n=40       n=40

     

    Заполняем первые три столбца.

    В четвертом столбце записываем условные варианты по формуле, указанной в «шапке» таблицы. В пятом столбце находим значения функции
    = .

    Функция четная, т.е. .Значения функции в зависимости от аргумента (берутся положительные , т.к. четная) находим из таблицы.

    Теоретические частоты теоретической кривой находим по формуле

    =n ,

    где - вероятность попадания Х в i-частичный интервал с концами
    и .

    Приближенно вероятности могут быть найдены по формуле .

    Тогда теоретические частоты равны равны

    =n = = 19, 4 .

    Заполняем последний столбец. В последнем столбце частоты округляются до целого числа и = =40.

    В системе координат () строим нормальную (теоретическую кривую)кривую по выравнивающим частотам и полигон наблюдаемых частот . Полигон наблюдаемых частот построен в системе координат ().

     

     

    7. Проверяем гипотезу о нормальности Х при уровне значимости =0, 05.

    В качестве статистики выбирают СВ :

    = .

    Она подчиняется распределению с числом степеней свободы , где s - число различных значений ; - число параметров, откоторых зависит распределение. Для нормального закона таких параметров два: a= и , т.е. , и . По данному уровню значимости и числу степеней свободы в таблице распределения находят критическое значение и находят критическую область: , = . Затем вычисляем наблюдаемое значение , т.е. по формуле

    .

    Если окажется, что , то нулевую гипотезу о том, что Х имеет нормальное распределение, принимают. В этом случае опытные данные хорошо согласуются с гипотезой о нормальном распределении генеральной совокупности.

    Вычислим , для чего составим расчетную таблицу 3.

    Таблица 3

     

                 
                 
            0, 333333   5, 333333
            0, 2   7, 2
        -1   0, 142857   5, 142857
                 
        -1   0, 142857   5, 142857
        -1   0, 2   3, 2
        -1   0, 333333   1, 333333
                 
      n=40     = 5, 352381     45, 35238

     

    Суммируя числа пятого столбца, получаем = 5, 352381

    Суммируя числа последнего столбца, получаем 45, 35238

    Контроль: =5, 352381

    - = 45, 35238-40=5, 352381

    Совпадение результатов подтверждает правильность вычислений.

    Найдем число степеней свободы, учитывая, что число групп выборки (число различных вариантов) 9, =9-3=6.

    По таблице критических точек распределения , по уровню значимости и числу степеней свободы 6 находим .

    Так как , то нет оснований отвергнуть нулевую гипотезу. Расхождение эмпирических и теоретических частот незначимое. Следовательно, данные наблюдений согласуются с гипотезой о нормальном распределении генеральной совокупности.

    8. Найдем доверительный интервал для оценки неизвестного математического ожидания, полагая, что Х имеет нормальное распределение, среднее квадратическое отклонение = 8, 2437и доверительную вероятность .

    Известен объем выборки: n=40, выборочная средняя 3, 8.

    Из соотношения 2 получим 0, 475. По таблице находим параметр t=1, 96.

    Найдем точность оценки

    = 2, 55

    Доверительный интервал таков:

    < или < или < .

    Надежность указывает, что если произведено достаточно большое число выборок, то 95 % из них определяет такие доверительные интервалы, в которых параметр действительно заключен.

    Интервальная оценка для среднего квадратического отклонения:

    . находим по таблице по заданным n и .

    = 0, 24

     

    Тема 2

     

    Статистическое исследование зависимостей (корреляционно- регрессионный анализ)

    Рассмотрим выборку двумерной случайной величины (Х, Y). Примем в качестве оценок условных математических ожиданий компонент их условные средние значения, а именно: условным средним назовем среднее арифметическое наблюдавшихся значений Y, соответствующих Х = х. Аналогично условное среднее - среднее арифметическое наблюдавшихся значений Х, соответствующих Y = y. Уравнения регрессии Y на Х и Х на Y

    имеют вид:

    = f* (x) -

    - выборочное уравнение регрессии Y на Х,

    = φ * (у) -

    - выборочное уравнение регрессии Х на Y.

    Соответственно функции f* (x) и φ * (у) называются выборочной регрессией Y на Х и Х на Y, а их графики – выборочными линиями регрессии. Выясним, как определять параметры выборочных уравнений регрессии, если сам вид этих уравнений известен.

    Пусть изучается двумерная случайная величина (Х, Y), и получена выборка из п пар чисел (х 1, у 1), (х 2, у 2), …, (хп, уп). Будем искать параметры прямой линии регрессии Y на Х вида

    Y = ρ yxx + b,

    подбирая параметры ρ ух и b так, чтобы точки на плоскости с координатами (х 1, у 1), (х 2, у 2), …, (хп, уп) лежали как можно ближе к прямой. Используем для этого метод наименьших квадратов и найдем минимум функции

    .

    Приравняем нулю соответствующие частные производные:

    .

    В результате получим систему двух линейных уравнений относительно ρ и b:

    Ее решение позволяет найти искомые параметры в виде:

    .

    При этом предполагалось, что все значения Х и Y наблюдались по одному разу.

    Теперь рассмотрим случай, когда имеется достаточно большая выборка (не менее 50 значений), и данные сгруппированы в виде корреляционной таблицы:

     

    Y X
    x 1 x 2 xk ny
    y1 y 2ym n 11     n 12n 1 m n 21     n 22n 2 m … … … … nk 1     nk 2nkm n 11+ n 21+…+ nk 1     n 12+ n 22+…+ nk 2   n 1 m +n 2 m +…+ nkm
    nx n 11+ n 12+…+ n 1 m n 21+ n 22+…+ n 2 m nk 1+ nk 2+…+ nkm n=nx =ny

     

    Здесь nij – число появлений в выборке пары чисел (xi, yj).

    Поскольку , заменим в системе (10.3)

    , где пху – число появлений пары чисел (х, у). Тогда система примет вид:

    Можно решить эту систему и найти параметры ρ ух и b, определяющие выборочное уравнение прямой линии регрессии:

    .

    Но чаще уравнение регрессии записывают в ином виде, вводя выборочный коэффициент корреляции. Выразим b из второго уравнения системы:

    .

    Подставим это выражение в уравнение регрессии:

    .

    ,

    где

    Введем понятие выборочного коэффициента корреляции

    и умножим равенство на : , откуда .

    Используя это соотношение, получим выборочное уравнение прямой линии регрессии Y на Х вида

    .

     






    © 2023 :: MyLektsii.ru :: Мои Лекции
    Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
    Копирование текстов разрешено только с указанием индексируемой ссылки на источник.