Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Приклад нерепрезентативної вибірки






У США одним з найбільш відомих історичних прикладів нерепрезентативної вибірки вважається випадок, що відбувся під час президентських виборів в 1936 року[1]. Журнал «Літрері Дайджест», що успішно прогнозував події декількох попередніх виборів, помилився в своїх прогнозах, розіславши десять мільйонів пробних бюлетенів своїм підписчикам, людям, вибраним по телефонним книгах всієї країни, і людям з реєстраційних списків автомобілів. У 25 % бюлетенів (майже 2, 5 мільйона) голосів, що повернулися, були розподілені таким чином:

· 57 % віддавали перевагу кандидату-республіканцю Альфу Лендону

· 40 % вибрали діючого на той час президента-демократа Франкліна Рузвельта
На дійсних же виборах, як відомо, переміг Рузвельт, набравши більше 60 % голосів. Помилка «Літрері Дайджест» полягала в наступному: бажаючи збільшити репрезентативність вибірки, — оскільки їм було відомо, що більшість їхніх передплатників вважають себе республіканцями, — вони розширили вибірку за рахунок людей, вибраних з телефонних книг і реєстраційних списків. Проте вони не врахували сучасних їм реалій і насправді набрали ще більше республіканців: у часи Великої депресії володіти телефонами і автомобілями могли собі дозволити переважно представники середнього і верхнього класу (в більшості республіканці, а не демократи).

 

32. Похибки вибірки: випадкова та систематична.
Впливає на надійність даних. Випадкові помилки репрезентативності зумовлені тим, що вибіркова сукупність не відображає точно середні і відносні показники генеральної сукупності. випадкові помилки - ті, які при повторних вимірюваннях змінюються за законами ймовірності. Випадкова помилка буде присутньою завжди при будь-якому вибірковому опитуванні

Випадкові помилки вибіркового спостереження залежать від двох факторів:

- чисельність вибіркової сукупності (або частки чи процента відбору);

- варіації ознаки - випадкові помилки також неминучі через неоднорідність досліджуваного контингенту.

Доведено, що чим більшою є чисельність вибіркової сукупності (частка відбору), тим меншою є помилка вибіркового спостереження, і навпаки, чим більшою є варіація ознаки, Тим більша й помилка.

Отже, щоб уникнути випадкової помилки вибірки треба збільшити об’єм вибірки (екстенсивний метод), або не збільшуючи розмір вибіркової сукупності вдосконалити вибірку, щоб вона максимально відтворювала параметри генеральної сукупності (інтенсивний метод).

Впливає на валідність (обгрунтованість) даних. Систематичні помилки виникають внаслідок порушення принципів проведення вибіркового спостереження. Систематичну помилку часто називають помилкою, викликаною зсувом: виникає внаслідок порушення правил добору або через зсуви при доборі.

Необґрунтований вибір точок опитування найчастіше призводить саме до систематичної помилки. Як зазначає соціолог В. І. Паніотто, систематичні помилки представляють собою деяке постійне зміщення, яке не зменшується зі збільшенням числа опитаних і викликано недоліками і прорахунками в системі відбору респондентів.

(Якщо, наприклад, для вивчення громадської думки мешканців міста в архітектурному управлінні отримати відомості про житловий фонд та з усіх наявних у місті квартир відібрати випадковим чином 400 квартир, а потім запропонувати інтерв'юерам опитати всіх, кого вони застануть в момент відвідування в цих квартирах, то отримані дані не будуть репрезентативні. Допущена систематична помилка: більш рухома частина населення потрапляє у вибірку у меншій пропорції, а менш рухома - в більшій пропорції, ніж у генеральній сукупності. Пенсіонерів, наприклад, частіше можна застати вдома, ніж студентів-вечірників. При збільшенні вибірки ця помилка не усувається: якщо ми проведемо опитування в 800 квартирах або навіть у всіх квартирах міста (суцільне опитування), то отримані дані будуть репрезентативні для населення, що знаходиться будинку в момент приходу інтерв'юера, а не для всіх жителів міста)

Невипадкові помилки можуть виникнути через методи збору даних: запитань, дуже болючих для опитуваних (про ставлення до влади, якщо опитуються біженці або постраждали від стихійних лих і т.д.) або форми завдання питання (дуже важко, щоб усім було все зрозуміло), або часу опитування (наприклад, на запитання молодим батькам, не шкодують вони про те, що у них є діти, можна отримати різний розподіл відповідей в залежності від того, чи проводився опитування довгим зимовим вечором, коли всі стомлені готуванням уроків, застудами і т.д., або чудовим літнім днем, коли діти перебувають на дачі, в оздоровчому таборі).

систематичну помилку можна усунути, змінюючи процедуру формування вибірки, а саме – забезпечити однакові можливості потрапляння у вибірку кожної одиниці генеральної сукупності.

Вимога незсуненості оцінок параметрів (характеристик) генеральної сукупності за

вибірковими даними гарантує відсутність систематичних помилок.

щоб ліквідувати систематичну помилку, достатньо ввести поправку, помноживши s2 на n/n-1, отримаємо виправлену вибіркову дисперсію.

 

32. Похибки вибірки: випадкова та систематична.
Похибка вибірки
- частина розбіжності між істинним значенням статистичного показника та його значенням, розрахованим за вибіркою, яка зумовлена застосуванням саме несуцільним характером спостереження.

Вибіркове обстеження – це найбільш поширений вид несуцільного

обстеження. Його застосовують при вивченні різноманітних явищ і

процесів, наприклад, таких як попит населення і ступінь

його задоволення торгівлею, обстеження сімейних бюджетів населення,

вивчення громадської думки тощо.

Вибірковий метод - це система наукових принципів випадкового

відбору певної частини сукупності, яка представляла б усю сукупність і

характеристики якої слугували б надійною основою статистичного

висновку.

Сукупність, з якої відбираються елементи для обстеження,

називають генеральною, а сукупність, яку безпосередньо обстежують, -

вибірковою. Статистичні характеристики вибіркової сукупності

розглядаються як оцінки відповідних характеристик генеральної

сукупності. Оскільки вибіркова сукупність не точно відтворює структуру

генеральної, то вибіркові оцінки також не збігаються з характеристиками

генеральної сукупності. Розбіжності між ними називають похибками

репрезентативності. За причинами виникнення ці похибки поділяються

на систематичні (тенденційні) та випадкові. Систематичні похибки

виникають за умови, що під час формування вибіркової сукупності

порушується принцип випадковості відбору (упереджений відбір

елементів, недосконала основа вибірки тощо). Для всіх елементів

сукупності вони мають односторонній напрям і тому їх ще називають

похибками зміщення.

Випадкові похибки – це наслідок випадковості відбору елементів

сукупності для обстеження.

При організації вибіркового обстеження важливо запобігти

виникненню систематичних похибок. Що стосується випадкових

похибок, то уникнути їх неможливо, проте на основі теорії вибіркового

методу можна визначити їх розмір і по можливості регулювати.

Порівняно із суцільним обстеженням вибіркове має переваги,

оскільки обстеження за однією і тією самою програмою будь-якої

частини сукупності потребує менше коштів і часу, ніж обстеження

сукупності в цілому. Крім того, дешевше обходиться і статистична

обробка інформації вибіркового обстеження. Вибірка застосовується і у

випадках, коли суцільне обстеження взагалі неможливе: обстежувана

сукупність дуже велика, практично безмежна (наприклад, сукупність

ділянок морського дна, або сукупність колосків пшениці на полі);

обстеження пов’язане із знищенням або псуванням одиниць, які

досліджуються (наприклад, контроль якості хлібобулочних виробів,

консервів і т.д.). Поряд з тим при вивченні великих сукупностей

вибіркове обстеження може дати більш точні результати, ніж суцільне, за

рахунок зменшення кількості похибок реєстрації.

При достатньо великому обсязі вибіркової сукупності n

ймовірність того, що похибка вибірки Δ не перевищує свого граничного

значення Δ =t μ за теоремою Ляпунова дорівнює інтегралу Лапласа.

 

 

33. Обчислення обсягу вибірки за значенням припустимої похибки.

Формулы предельной ошибки позволяют решать задачи трех видов:

1. Определение пределов генеральных характеристик с за­данной степенью надежности (доверительной вероятностью) на основе показателей, полученных по данным выборки.

Доверительные интервалы для генеральной средней:

Доверительные интервалы для генеральной доли:

2. Определение доверительной вероятности того, что гене­ральная характеристика может отличаться от выборочной не бо­лее чем на определенную заданную величину.

Доверительная вероятность является функцией от t, определя­емой по формуле:

 

По величине t определяется доверительная вероятность по уд­военной нормированной функции Лапласа.

3. Определение необходимого объема выборки, который с практической вероятностью обеспечивает заданную точность вы­борки.

Для расчета объема выборки необходимо иметь следующие данные:

а) размер доверительной вероятности;

б) коэффициент t, зависящий от принятой вероятности;

в) величину ) в генеральной совокупности; они за­меняются величинами, полученными в предшествующих обследо­ваниях или при пробных выборках;

г) величину максимально допустимой ошибки;

д) объем генеральной совокупности

Необходимый объем выборки определяется на основе допусти­мой величины ошибки:

В табл. 22.2 приведены формулы для расчета численности простой случайной выборки.

Таблица 22.2. Формулы для определения численности простой случайной выборки

 

 






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.