Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Розділ 1 Теоретичні відомості






2.1 Генеральна та вибіркова сукупності

 

Нехай необхідно вивчити деяку сукупність однорідних об’єктів відносно деякої якісної чи кількісної ознаки, котра характеризує ці об’єкти. Наприклад, ми маємо партію деталей. Тоді якісною ознакою може бути стандартність дета–лі, а кількісною – контрольований її розмір.

Вся сукупність елементів, яку треба дослідити, називається генеральною сукупністю. Поняття генеральної сукупності, в певному сенсі, є аналогічним поняттю випадкової величини (закону розподілу ймовірностей), бо повністю обумовлене певним комплексом умов [1, с.188–189].

Отже, вибірковою сукупністю (вибіркою) називають сукупність випад-ково відібраних об’єктів.

Генеральною сукупністю називають сукупність об’єктів, з підмножини яких виконується вибірка.

Об’ємом сукупності називають число об’єктів цієї сукупності. Зазвичай позначають так: n=< розмір>.

Генеральна сукупність може мати, як скінченний, так і нескінченний об’єм. Саме причина неможливості дослідження генеральної сукупності з нескінченною кількістю елементів може слугувати поштовхом для створення вибірок. Також проблема дослідження вибіркової сукупності може бути пов’язана з певними економічними або часовими обмеженнями.

Вибіркову сукупність можна розглядати, як деякий емпіричний аналог генеральної сукупності. Згідно вибірки можна робити висновки про властивості генеральної сукупністі.

Властивості вибірки:

- об’ємність – чим більший об’єм вибірки у відсотковому відношенні, тим точніший результат;

- представницькість та репрезентативність – вибірка повинна містити представників усіх типових груп генеральної сукупності із збереженням співвідношень.

Мала вибірка – це вибірка, яка містить менше 30 елементів. Для соціальних процесів – 60 елементів.

Велика вибірка – це вибірка, яка містить більше 30 елементів. Для соціальних процесів – більше 60 елементів.

Способи відбору:

В математичній статистиці використовуються різноманітні методи відбору [1, с.190–191]. Їх можна розділити на два типи:

Розділ 1 Відбір, не потребуючий розділу генеральної сукупності на частини:

- простий випадковий безповторний відбір;

- простий випадковий повторний відбір.

Розділ 2 Відбір, при якому генеральна сукупність розбивається на частини:

- типовий відбір;

- механічний відбір;

- серійний відбір.

Випадковий спосіб відбору (випадковий відбір) – це такий спосіб формування вибіркової сукупності, коли відбір одиниць з генеральної сукупності здійснюється у випадковому порядку. Випадковість відбору полягає у дотриманні принципу однакової можливості для всіх одиниць генеральної сукупності потрапити у вибірку.

Випадкова вибірка може бути організована або за схемою повторного відбору, або за схемою безповторного відбору. Зазначені схеми відбору дають однакові результати лише у разі нескінченної генеральної сукупності. За умо-вою скінченності генеральної сукупності, результати вибірок будуть різні. Особливість названих схем відбору полягає у наступному:

при повторному відборі кожна одиниця бере участь у вибірці стільки разів, скільки відбирається одиниць, тобто після реєстрації вона повертається у генеральну сукупність і в подальшому може знов потрапити у вибіркову сукупність. За таких умов генеральна сукупність залишається незмінною, і тому для всіх одиниць сукупності забезпечується рівна ймовірність потрапити у вибірку.

При безповторному відборі кожна відібрана одиниця у подальшому відборі не бере участі, тобто не повертається у генеральну сукупність. Але це означає, що чисельність генеральної сукупності буде змінною після кожної операції відбору. У зв'язку з цим, ймовірність потрапити у вибірку решти одиниць підвищується, а тому середня помилка вибірки тут буде менша, ніж при повторному способі відбору.

Механічним називається відбір, при якому генеральна сукупність поділяється на рівні частини відповідно до природного розташування її одиниць (географічного, просторового, алфавітного тощо) і з кожної частини обстежується одна одиниця. Тобто одиниці відбирають через рівні проміжки у порядку розташування їх сукупності.

Механічний спосіб забезпечує рівномірність відбору одиниць з усіх частин сукупності, тобто їх пропорційне представництво, а отже, і найбільш високу репрезентативність обстеження.

Слід зазначити, що при механічному способі відбору відібрані одиниці не мають імовірнісного характеру. Випадкові помилки тут зумовлюються не способом відбору, а наявністю випадковості у розташуванні матеріалу дослід-жуваної сукупності.

Груповий відбір – це такий спосіб формування вибіркової сукупності, коли відбір одиниць з генеральної сукупності здійснюється у послідовному порядку від зазначеного елемента, і вибирається n–на кількість елементів.

 

2.2 Впорядкування даних

 

Статистичні ряди розподілу є одним з найважливіших елементів статистики. Однак першочергово необхідно провести зведення та групування матеріалів статистичного спостереження. Результати подаються у вигляді статистичних рядів розподілу.

Варіаційний (статистичний) ряд – таблиця, перша стрічка якої містить елементи в порядку зростання, а друга – частоту їх появи.

Ранжований ряд розподілу – це ряд, в якому значення розташовуються в зростаючому або спадаючому порядку.

Відносна частота – це відношення частоти інтервалу до об’єму вибірки.

Інтервальний ряд – це ряд, в якому значення варіанти задається у вигляді інтервалу. Він використовується для полегшення обробки статистичної інфор-мації на великих вибірках та у випадках, коли частоти варіант мало відріз-няються між собою, а варіанти розташовані близько одна до одної.

Кількість інтервалів для інтервального ряду обраховується за формулою Стреджерса:

 

(2.2.1)

 

Частота – це числа, які показують, скільки разів повторюються окремі значення варіант.

Накопичена частота – сума частот чергового інтервалу, починаючи з першого і закінчуючи останнім.

2.3 Емпірична функція розподілу

 

Емпіричною функцією розподілу F*(x) називається відносна частота того, що ознака (випадкова величина) Х прийме значення, менше заданого аргументу х [3, с.8–13].

 

, (2.3.1)

 

Властивості F*(x):

2.1

2.2

2.3

2.4 неспадною функцією аргументу х, тобто

 

2.4 Графічне зображення статистичних розподілів

 

Полігоном частот називають ламану, відрізки якої сполучають точки (x 1, n 1), (x 2, n 2), ..., (x k, n k). Для побудови полігону частот на осі абсцис відкладають варіанти х i, а на осі ординат – відповідні їм частоти n i.. Точки (x i, n i) з'єднують відрізками прямих і отримують полігон частот.

Гістограмою частот називають ступінчасту фігуру, яка складається з прямокутників, основами яких є інтервали довжиною h, а висоти дорівнюють (щільність частоти). Площа гістограми частот дорівнює об’єму вибірки [4, с.12].

Зауваження 1 Гістограму можна побудувати тільки для інтервального статистичного розподілу.

Зауваження 2 Очевидно, що при збільшенні n можна вибрати все більш малі інтервали (h), при цьому гістограма буде наближатися до деякої кривої, яка обмежує площу близьку до 1. Ця крива є графіком щільності розподілу випадкової величини X.

Зауваження 3 Полігон і гістограма – аналогічні криві розподілу ознаки X, а емпірична функція розподілу F * (x) – функція розподілу випадкової вели–чини X.

2.5 Числові характеристики вибіркової сукупності

 

Числові характеристики варіаційних рядів – набір значень, які зображають деякі сталі величини, що подають варіаційний ряд в цілому і відображають властивості, сукупності закономірностей, що вивчаються. До таких числових характеристик відносяться середня величина ряду розподілу, величини, які відображають варіацію змін – розмах, дисперсія, середнє квад-ратичне відхилення та інші [4, c.34–42].

Математичне сподівання – це середнє арифметичне значень випадкової величини. Його знайдемо за формулою:

 

(2.5.1)

 

Дисперсія – це числова характеристика випадкової величини, яка вказує ступінь розсіювання цієї величини навколо її математичного сподівання. Дисперсія обчислюється за формулою:

 

(2.5.2)

 

Середнє квадратичне відхилення – індикатор мінливості об’єкта, що показує на скільки в середньому відхиляються індивідуальні значення ознаки від їх середньої величини.

Середнє квадратичне обчислимо за формулою:

 

, (2.5.3)

 

Мода – найбільш ймовірне значення випадкової величини.

Випадкова величина, яка має лише одну моду, називається унімодальною.

Випадкова величина, яка має дві і більше моди, називається полі –модальною.

Моду обчислюємо за формулою [3, c.14]:

 

, (2.5.4)

 

де початок модального інтервалу;

– довжина модального інтервалу;

– частота модального інтервалу

– частота інтервалу, що передує модальному;

– частота інтервалу, що після модального.

Медіана – варіанта, що поділяє варіаційний ряд на дві рівні частини за кількістю варіант.

Медіана обчислюється за наступною формулою:

 

, (2.5.5)

 

де – довжина інтервалу.

Коефіцієнт варіації – це характеристика однорідності вибірки. Визначається за формулою:

 

, (2.5.6)

 

Асиметрія – це числова характеристика, яка визначає ступінь скошеності розподілу і обчислюється за формулою:

 

(2.5.7)

 

Якщо =0 – розподіл симетричний.

Якщо – правостороння асиметрія (.

Якщо – лівостороння асиметрія (.

Ексцес – числова характеристика, яка характеризує «крутість» розподілу та обчислюється за формулою:

 

, (2.5.8)

Ексцес, як правило, використовується при дослідженні неперервних ознак генеральних сукупностей, оскільки він оцінює крутизну закону розподілу випадкової величини порівняно з нормальним. Для нормального закону .

 

2.1 Абсолютна та відносна похибки

 

Абсолютна похибка – це абсолютна різниця (модуль різниці) між результатом вимірювання та умовно істинним значенням вимірювальної величини. Абсолютна похибка обчислюється за формулою:

 

(2.6.1)

 

де а – істинне значення генеральної сукупності;

– значення числової характеристики вибірки.

Відносна похибка – це відношення абсолютної похибки до істинного значення випадкової величини. Відносну похибку можна знайти за формулою:

 

(2.6.2)

 

 

2.6 Закони розподілу

З вище зазначених законів розподілу найбільш відповідним до генеральної сукупності є нормальний розподіл.

Нормальний розподіл

Нормальний закон розподілу відіграє виключно важливу роль в теорії ймовірностей і займає серед інших законів розподілу особливий стан.

Це закон, який найчастіше зустрічається на практиці. Головна особливість, яка виділяє нормальний закон серед інших законів, полягає в тому, що він є граничним законом, до якого наближаються інші закони розподілу.

Нормальний розподіл – розподіл ймовірностей випадкової величини, що характеризуються де — математичне сподівання, — дисперсія випадкової величини. Параметр також відомий, як стандартний відхил. Розподіл із μ = 0 та σ   2 = 1 називають стандартним нормальним розподілом.

2.7 Статистичні гіпотези

 

Для практичного використання методів теорії вірогідності та математи-чної статистики знання закона розподілу є дуже важливим. Знаючи закон розподілу, можливо вирішувати безліч практичних завдань. Саме тому будь яка обробка результатів досліджень повинна починатись з відповіді на питання: котрий закон розподілу відповідає наявній вибірці.

Ця проблема, зазвичай, вирішується за допомогою створення гіпотез.

Статистична гіпотеза – це припущення, що висувається щодо особливостей розподілу ймовірностей випадкової величини, яке перевіряється за результатами спостережень над нею.

Перевірка будь–якої статистичної гіпотези виконується наступним чином:

по наявній вибірці підраховується статистичний критерій;

на основі принципу значущості встановлюється рівень значущості – най-більше значення вірогідності, котре несумісне з визнанням випадковості експериментально обчисленого значення статистики критерію [5, 202-203].

Перевіряєма гіпотеза називається нульовою та позначається як .

Конкуруючу (альтернативну) гіпотезу називають

Існують як прості, так і складні гіпотези. Простою називають гіпотезу, яка містить всього одне припущення. Складною – яка складається зі скінчен-ного або нескінченного числа простих гіпотез.

Статистичним критерієм називають випадкову величину k, яка слугує для перевірки гіпотези.

Емпіричним критерієм називають те значення критерію, яке обчислено по вибірках.

Критичною областю називають сукупність значень критерію, при яких нульову гіпотезу приймають.

Областю прийняття гіпотези називають сукупність значень критерію, при яких нульову гіпотезу приймають.

Правосторонньою називають критичну область, яка визначається нерів-ністю , де – додатнє число.

Лівосторонньою називають критичну область, яка визначається нерів-ністю , де – від’ємне число.

 

2.8 Критерії узгодження

Критерій узгодження Пірсона ()

Критерій ґрунтується на порівнянні емпіричної гістограми розподілу випадкової величини з її теоретичною густиною. Діапазон зміни експери-ментальних даних розбивається на k інтервалів, та розраховується статистика [5, c.204–209]:

 

 

де – кількість значень випадкової величини, що входять в i -тий інтервал;

– гіпотетичний теоретичний закон розподілу випадкової величини;

– теоретична вірогідність потрапляння випадкової величини в і- тий інтервал.

Для знаходження необхідно знайти ступінь свободи за формулою:

 

(2.9.2)

За [6] знаходимо значення при . За умови, якщо , то H 0відхиляється з достовірністю (.

Критерій Колмогорова – Смірнова

У статистиці критерій узгодження Колмогорова (також відомий, як критерій згоди Колмогорова - Смірнова) [5, c. 214-216] використовується для того, щоб визначити, чи підпорядковуються два емпіричних розподіли одному закону, або визначити, чи підпорядковується отриманий розподіл передбачу-ваній моделі.

Критерій Колмогорова - Смірнова про перевірку гіпотези на однорід-ність двох емпіричних законів розподілу є одним з основних і найбільш широко використовуваних непараметричних методів тому, що досить чутливий до від-мінностей у досліджуваних вибірках.

Цей критерій також дозволяє оцінити суттєвість відмінностей між двома вибірками, у тому числі можливе його застосування для порівняння емпіричного розподілу з теоретичним.

Алгоритм критерію

1) записуємо інтервальний ряд 5;

2) знаходимо середини інтервалів за формулою (2.9.2);

3) записуємо щільність розподілу f (x, c);

4) знаходимо параметри c;

5) записуємо F (x), f (x);

6) знаходимо

, (2.9.3)

7) Шукаємо .

8) Шукаємо різницю між накопиченими частотами відповідного порядку

 

, (2.9.4)

 

9) Знаходимо ;

10) За таблицями критерію знаходимо ;

11) Якщо < H 0приймається.


 






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.