Главная страница Случайная страница Разделы сайта АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Види помилок спостереження. ⇐ ПредыдущаяСтр 4 из 4
План
8.1. Основні поняття 8.2. Поняття про помилку вибірки Питання для самоконтролю Література 8.1. Основні поняття
Вибірковий метод – це система наукових принципів випадкового відбору певної частини сукупності, яка представляла б всю сукупність і характеристики якої служили б надійною основою статистичного виводу.
Генеральна сукупність (N) – це сукупність (люди, об'єкти і тому подібне), що вивчається, з якої відбираються елементи для обстеження.
Вибірка (n) – це менший набір елементів, що витягуються з генеральної сукупності, який піддається безпосередньому обстеженню. В окремих одиниць генеральної сукупності має бути рівна можливість попасти в число одиниць, що підлягають обстеженню, і тому відбір виробляється випадковим чином. Вибірку використовують для вивчення системи, яка є настільки великою, що її повне дослідження коштує дуже дорого. Вибірка називається малою, якщо чисельність її одиниць не перевищує 30 ().
При вибірковому спостереженні мають справу з двома категоріями узагальнювальних показників: долею і середньою величиною.
Доля дає характеристику сукупності за альтернативно варіативна ознакою і обчислюється як відношення числа одиниць сукупності, що володіють ознакою, яка цікавить нас, до загального числа одиниць сукупності. Доля в генеральній сукупності позначається латинською буквою , а вибіркова доля – .
Середнє значення варіативної ознаки у всій сукупності називається генеральною середньою , а середнє значення ознаки у одиниць, які піддалися вибірковому спостереженню, – вибірковою середньою .
Вибірку називають репрезентативною, якщо кожна властивість (або комбінація властивостей) спостерігається у вибірці з тією ж частотою, що і в генеральній сукупності. Про вибірку, яка не є репрезентативною, говорять, що вона має зміщення. Оскільки вибіркова сукупність неточно відтворює структуру генеральної, то вибіркові оцінки також не збігаються з характеристиками генеральної сукупності. Тому поширення результатів вибірки на всю сукупність пов'язане з помилкою репрезентативності.
Систематичні помилки з'являються, якщо при формуванні вибіркової сукупності порушений принцип випадковості відбору (навмисний відбір елементів, недосконала основа вибірки і тому подібне). Випадкові помилки – це наслідок випадковості відбору елементів сукупності для обстеження. Помилки реєстрації виникають у зв'язку з неправильним встановленням факту в процесі спостереження.
Основа вибірки дозволяє по числу з інтервалу від 1 до N (розмір сукупності) дістати доступ до елементу генеральної сукупності.
Безповторна вибірка – якщо жоден елемент генеральної сукупності не може бути відібраний у вибірку більше одного разу, тобто одиниці сукупності, що попали у вибірку, надалі у вибірці вже не беруть участь і чисельність одиниць генеральної сукупності в процесі вибірки скорочується.
Повторна вибірка – якщо елемент генеральної сукупності може бути відібраний у вибірку більше одного разу, тобто одиницю генеральної сукупності, що попала у вибірку, після реєстрації знову повертають в генеральну сукупність, і вона зберігає рівну можливість з іншими одиницями при відборі знов попасти у вибірку. При цьому методі відбору чисельність одиниць генеральної сукупності залишається незмінною. Повторна вибірка на практиці застосовується досить рідко, оскільки помилка вибірки при безповторному відборі завжди менше.
Вибірку, яка включає всю сукупність (n = N), називають переписом.
Статистикою, або вибірковою статистикою, називають будь-яке число, обчислене з даних вибірки. Параметром або параметром генеральної сукупності, називають будь-яке число, розраховане для всієї генеральної сукупності.
Оцінна функція (оцінка) – це вибіркова статистика, яка використовується, як передбачуване значення параметра генеральної сукупності (наприклад, середнє значення вибірки). А її фактичне значення, обчислене з даних вибірки, називають оцінкою параметра сукупності.
У практиці вибіркових спостережень використовують двох типів вибіркових оцінок – точкові і інтервальні. Точкова оцінка – це значення параметра за даними вибірки: вибіркова середня або вибіркова доля. Інтервальна оцінка – це інтервал значень параметра, розрахований за даними вибірки для певної вірогідності, тобто довірчий інтервал.
Випадкову вибірку, або просту випадкову вибірку, витягують таким чином, що: (1) всі елементи генеральної сукупності мають однакову вірогідність бути відібраними і (2) елементи генеральної сукупності відбираються незалежно один від одного. Таблиця випадкових чисел – це, послідовність цифр, в якій всі цифри від 0 до 9 з'являються незалежно друг, від друга і з однаковою вірогідністю 1/10. Використання такої таблиці для послідовного відбору різних елементів генеральної сукупності служить одним із способів витягання випадкової безповторної вибірки.
Всяка статистика, обчислена на даних випадкової вибірки, характеризується імовірнісним розподілом, який називають вибірковим розподілом цієї статистики.
Стратифіковану випадкову вибірку отримують шляхом витягання випадкової вибірки окремо з кожної страти (шару, типової групи або сегменту) генеральної сукупності. Якщо генеральна сукупність однорідна усередині кожної страти, але страти помітно відрізняються один від одного, стратифікація може збільшити точність статистичного аналізу.
Систематичну вибірку отримують, вибираючи в основі вибірки випадкову початкову точку потім відбираючи елементи основи вибірки починаючи з цієї крапки через постійний інтервал (з постійним кроком відбору). Хоча середнє систематичної вибірки є незміщеною оцінкою середнього генеральній сукупності (тобто не є постійно завищеним або заниженим), вживання такого методу пов'язане з певними серйозними проблемами. Неможливо визначити, наскільки задовільною є оцінка, оскільки для неї немає надійної стандартної помилки. Особливо серйозні проблеми можуть виникнути, якщо елементи генеральної сукупності впорядковані в основі вибірки особливим чином або якщо в основі вибірки є групи елементів, що повторюються. У зв'язку з тим, що побудова випадкової вибірки обходиться, як правило, не набагато дорожче, ніж побудова систематичної вибірки, використання систематичної вибірки бажано уникати.
Процес узагальнення даних вибірки, який приводить до імовірнісних тверджень про всю генеральну сукупність, називають статистичними виводом.
8.2. Поняття про помилку вибірки.
Стандартна помилка статистики, тобто оцінка стандартного відхилення її вибіркового розподілу, приблизно показує, наскільки значення статистики може відрізнятися від свого середнього значення (параметра генеральної сукупності). Стандартна помилка середнього (або просто стандартна помилка) приблизно показує, наскільки її вибіркова середня (випадкова спостережувана величина) відрізняється від середнього генеральної сукупності μ (фіксована невідома величина):
(8.1)
Стандартна помилка зменшується із збільшенням розміру вибірки n (за інших рівних умов), відображаючи той факт, що велика за розміром вибірка містить більше інформації і таким чином досягається велика точність.
Коли об'єм генеральної сукупності настільки малий, що вибірка складає чималу частину генеральної сукупності, стандартну помилку можна зменшити, ввівши у формулу коефіцієнт, що коректує (поправочний) коефіцієнт для кінцевої сукупності, щоб отримати уточнену (відкоректовану) стандартну помилку:
(8.2)
Крім того, формулу (8.1) використовують повторній вибірці, а формулу (8.2) – для безповторної, проте, якщо об'єм вибіркової сукупності чималий, то поправочний коефіцієнт не грає великої ролі і стандартна помилка для безповторної вибірки визначається по формулі (8.1).
Для виміру стандартної помилки долі альтернативної ознаки застосовують інші формули. При повторній вибірці:
(8.3)
При вибірці, що не повторюється (безповторній):
(8.4)
Теоретичну (ідеальну) генеральну сукупність можна визначити; як дуже велику, інколи передбачувану (уявну) генеральну сукупність, яку представляє ваша вибірка. Якщо вас цікавить теоретична генеральна сукупність, не використовуйте поправку на кінцівку генеральної сукупності. З іншого боку, якщо необхідно зробити вивід про основу вибірки, не виходячи за її межі, то поправка може бути корисною, оскільки її використання зменшує варіацію системи. Якщо є сумніви, краще не використовувати поправку.
Стандартна помилка долі показує невизначеність, або мінливість, в спостережуваній долі , а стандартна помилка середнього – невизначеність в спостережуваній частоті х.
Довірчим інтервалом називають інтервал, розрахований з даних таким чином, що існує відома вірогідність включення параметра генеральної сукупності, що цікавить вас (невідомого), в інтервал, і ця вірогідність інтерпретується з точки зору випадкового експерименту що починається з витягання випадкової вибірки. Межі довірчого інтервалу визначаються на основі точкової оцінки і граничної помилки вибірки, яка дорівнює добутку стандартної помилки і t - критерію Стьюдента. Гранична помилка вибірки показує максимально можливу помилку для прийнятої вірогідності, а довірче число t – як співвідносяться гранична і стандартна помилки.
(8.3)
Вірогідність того, що параметр сукупності належатиме довірчому інтервалу називають рівнем довірчості, який зазвичай встановлюють рівним 95%, хоча часто використовують і інші рівні – 90; 99; 99, 9%. Чим вище рівень довірчості, тим ширше (а значить, і менш корисний) довірчий інтервал. Приблизне узагальнене формулювання твердження про довірчий інтервал має наступний вигляд: ми упевнені на 95%, що значення параметра генеральної сукупності знаходиться між значенням оцінки мінус дві стандартні помилки оцінки і значенням оцінки плюс дві стандартні помилки оцінки.
Це твердження засноване на тому факті, що при нормальному розподілі з вірогідністю 0, 95 слід чекати значення на відстані , тобто приблизно два стандартні відхилення від середнього.
Формулювання твердження про двосторонній 95% довірчому інтервалі для середньої генеральної сукупності має наступний вигляд:
ми упевнені, на 95%, що середнє генеральної сукупності m знаходиться між і , де значення t береться з t-таблиці.
(8.4)
Формулювання твердження про двосторонній 95% довірчому інтервалі для генеральної долі має наступний вигляд: ми упевнені на 95%, що доля властивості, що цікавить нас, в генеральній сукупності р знаходиться між и , де значення t береться з t -таблиці.
(8.5)
Щоб отримати довірчий рівень, відмінний від 95%, слід просто при побудові довірчого інтервалу використовувати відповідне значення. t-таблицю використовують для корекції додаткової невизначеності, обумовленої тим, що замість невідомого точного значення мінливості генеральної сукупності використовують оцінку (стандартну помилку). Коли ви працюєте з безповторною вибіркою розміру п, число ступенів свободи, рівне , є кількістю незалежних елементів інформації, використаних при обчисленні стандартної помилки (оскільки при обчисленні стандартного відхилення із спостережуваних значень віднімають середнє). Якщо відоме точне значення стандартної помилки, використовують t-значення для безконечного числа мір свободи.
Для того, щоб використання довірчого інтервалу було коректним, необхідне виконання двох наступних умов:
(1) дані мають бути випадковою вибіркою з даної генеральної сукупності;
(2) виміряні значення повинні підкорятися нормальному розподілу.
Перша умова гарантує, що дані правильно представляють невідомий параметр, а друге дає підставу використовувати t-таблицю для обчислення вірогідності.
Однобічний довірчий інтервал з відомою довірчістю вказує, що середнє генеральної сукупності або не менше, або не більше деякого обчисленого значення. Граничне значення для однобічного довірчого інтервалу обчислюється так само, як і для двостороннього інтервалу, лише t-значення для двостороннього інтервалу замінюється на t-значення для однобічного інтервалу і обирається гранична точка інтервалу так, щоб побудований однобічний інтервал включав вибіркове середнє.
При використанні однобічного інтервалу ви маєте бути упевнені, що незалежно від поведінки даних ви використовуватимете однобічний інтервал з того ж боку (тобто відкритий у бік великих значень або відкритий у бік менших значень). Інакше використання однобічного довірчого інтервалу некоректне. За наявності сумнівів краще використовувати двосторонній інтервал. Твердження про однобічний довірчий інтервал формулюється таким чином:
ми упевнені на 95%, що середнє генеральної сукупності не менше, ніж; або ми упевнені на 95%, що середнє генеральній сукупності не більше, ніж.
Інтервал передбачення дозволяє використовувати дані вибірки для передбачення з відомою вірогідністю значення нового спостереження за умови, що це нове спостереження отримане тим же способом, що і передуючі. Як міра невизначеності тут використовується стандартна помилка передбачення , міра мінливості відстані між середнім значенням вибірки і новим спостереженням. Інтервал передбачення будують тим же способом, що і довірчий інтервал; просто замінюють стандартну помилку середнього на, стандартну помилку передбачення. Формулювання твердження про інтервал передбачення (двосторонньому) для значення нового спостереження буде наступним:
Ми упевнені на 95%, що нове спостереження знаходитиметься між і .
Формулювання твердження про інтервал передбачення (однобічному) для значення нового спостереження буде таким:
Ми упевнені на 95%, що нове спостереження буде не менше, ніж ; або ми упевнені на 95%, що нове спостереження буде не більше, ніж .
Вибираючи відповідні t-значення з таблиці, інтервали передбачення для рівнів довірчості, відмінних від 95%, необхідно пам'ятати, що довірчий інтервал дає інформацію про середній генеральній сукупності, тоді як інтервал передбачення дає інформацію про єдине спостереження, випадково вибране з тієї ж генеральної сукупності.
Питання для самоконтролю 1. Що являє собою вибіркове спостереження? 2. Які існують види вибіркового спостереження? 3. Засоби відбору одиниць у вибіркову сукупність? 4. Дотримання якого принципу при формуванні вибіркової сукупності є обов’язковим? 5. Яка мета вибіркового спостереження? 6. Які існують види вибірки за ступеню охоплення одиниць сукупності? Види помилок спостереження. 8. Поняття довірчого інтервалу. 9. Види довірчих інтервалів. 10. Як визначити значення t за таблицею t-критерій Стьюдента? 11. Наведіть умовні позначення параметрів вибіркової сукупності. 12. Яким відносним показником характеризується доля у вибірковій сукупності? 13. Що таке вірогідність? 14. Що представляє собою висновок щодо довірчого інтервалу? Література 1. Сигел Эндрю. Практическая бизнес-статистика.: Пер. с англ. М.: Изд. Дом " Видьямс", 2002. - 1056 с. 2. Статистика: Підручник / А.В. Головач, А.М. Єріна, О.В. Козирєв та ін.; За ред. А.В. Головача, А.М. Єріної, О.В. Козирєва. – К.: Вища шк.., 1993. – 623 с. 3. Теория статистики: Учебник/ Под. ред. проф. Р.А. Шмойловой. – 3-е изд., перераб. – М.: Финансы и статистика, 2002. – 560 с.
|