Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Парний t-тест Стьюдента






Статистичні гіпотези, що перевіряють за цим критерієм формулюються так.

Н 0: Типовий зсув у значеннях досліджуваної нормально розподіленої ознаки в двох заданих умовах відсутній.

Н 1: Наявний зсув у значеннях досліджуваної нормально розподіленої ознаки в двох заданих умовах.

Статистикою критерію служить величина

,

де п — об’єм вибірки — середнє значення зсувів, а s — їх стандартне відхилення.

Якщо виконується нульова гіпотеза, то статистика t має розподіл Стьюдента з ступенями вільності. Тому на рівні значущості гіпотеза приймається, якщо , і відхиляється в іншому випадку.

У пакеті STATISTICA 6.0 критерій реалізований у модулі Basic Statistics/Tables / t-test dependent samples. Дані тестувань необхідно вносити в окремі змінні.

Критерій Краскела-Уоллеса

Критерій Краскела-Уоллеса призначений для порівняння рівня досліджуваної ознаки в трьох і більше вибірках. Критерій ранговий і є модифікацією критерію Манна-Уітні на випадок багатьох вибірок. Статистичні гіпотези формулюються так.

Н 0: Рівні досліджуваної ознаки у всіх вибірках статистично не відрізняються один від одного.

Н 1: Рівні досліджуваної ознаки у вибірках істотно відрізняються.

За даними спостережень проводиться ранжування об’єднаної вибірки та обчислюються суми рангів спостережень у кожній з вибірок.

Статистика Краскела-Уоллеса

,

де — об’єм кожної з k вибірок, — її рангова сума, N — сукупна кількість спостережень, для має близький до з ступенем вільності розподіл. Для розподіл статистики Н протабульовано (таблиця 10 додатка). Критерій має лівосторонню критичну область.

Для встановлення тенденцій рівня досліджуваної ознаки можна скористатись медіанним тестом, який порівнює емпіричні розподіли кожної з вибірок при розбитті на два класи медіаною об’єднаної вибірки.

У пакеті Statistica 6.0 критерій Краскела-Уоллеса разом з медіанним тестом реалізовано у субмодулі Comparing multiple independent Samples(groups) модуля Nonparametrics.

Критерій тенденцій Джонкхієра

Критерій призначений для перевірки наявності тенденції збільшення рівня досліджуваної ознаки при переході від вибірки до вибірки при монотонній зміні змушуючого фактора. Статистичні гіпотези формулюються так.

Н 0: Рівні досліджуваної ознаки у всіх вибірках статистично не відрізняються один від одного.

Н 1: Рівні досліджуваної ознаки у вибірках зростають при монотонній зміні змушуючого фактора.

Нехай результат і -го спостереження при и -му значенні змушуючого фактора. Статистика J Джонкхієра обчислюється за формулою

, де

Критерій має правосторонню критичну область. Для невеликих рівних вибірок і невеликого k критичні значення статистики Джонкхієра наведено в таблиці 11 додатка. Для великих вибірок статистика має розподіл, близький до нормального з математичним сподіванням і дисперсією , де .

Критерій Фрідмана

Критерій Фрідмана дозволяє перевірити гіпотезу про відсутність відмінності в ріні досліджуваної ознаки для трьох і більше зв’язаних вибірок (тестування однієї групи в різних умовах змушуючого фактора). Альтернативною виступає гіпотеза про наявність такої відмінності.

Статистика Фрідмана обчислюється за формулою

,

де п — кількість об’єктів у групі, k — кількість замірів, що відповідають різним значенням змушуючого фактора, — сума рангів для -го заміру, отриманих ранжуванням замірів окремо для кожного досліджуваного об’єкта.

Критерій має правосторонню критичну область. Для невеликих вибірок і невеликого k= 3 та k= 4 критичні значення статистики Фрідмана наведено в таблиці 12 додатка. Для великих вибірок статистика має розподіл, близький до з ступенем вільності.

Заміри i та j можна вважати попарно різними на спільному рівні значущості a, якщо

,

де і — квантиль нормального розподілу рівня .

У пакеті Statistica 6.0 критерій Фрідмана реалізовано у субмодулі Comparing multiple dep. samples (variables) модуля Nonparametrics.

Критерій тенденцій Пейджа

Критерій призначений для встановлення тенденції зміни рівня досліджуваної ознаки у зв’язаних вибірках при монотонній зміні вимушуючого фактора.

Нульова гіпотеза стверджує, що рівень досліджуваної ознаки не змінюється при зміні вимушуючого фактора; альтернативною виступає гіпотеза про наявність тенденції зміни досліджуваного рівня при монотонній зміні вимушуючого фактора.

Як і в критерії Фрідмана показники ранжуються для кожного досліджуваного об’єкта. Статистика Пейджа обчислюється за формулою

,

де — номер вибірки (вибірки нумеруються за монотонною зміною вимушуючого фактора), а — сума рангів її елементів.

Критична область — правостороння. Критичні значення критерію Пейджа для рів­­нів­ значущості 0, 05 та 0, 01 (кількість елементів у вибірці кількість значень фактора ) наведено в таблиці 13 додатка. Для визначення критичних точок для великих значень використовують статистику

,

яка має близький до стандартного нормального розподіл, якщо справджується нульова гіпотеза.

Однофакторний дисперсійний аналіз

Якщо результати спостережень можна подати у вигляді моделі

,

де і -те спостереження в j -ій групі (), — кількість спостережень в j -ій групі, , k — кількість груп, що відповідають різним значенням вимушуючого фактора, — значення в j -ій групі, яке характеризує вплив вимушуючого фактора, а — незалежні і мають близький до нормального розподіл з математичним сподіванням 0 і дисперсією , то для перевірки гіпотези про відсутність впливу вимушуючого фактора на рівень досліджуваної ознаки можна застосувати однофакторний дис­пер­сій­ний аналіз. Альтернативною виступає гіпотеза про наявність такого впливу.

Суть методу полягає в порівнянні двох оцінок цієї дисперсії, одна з яких отримана у припущенні, що всі статистично не відрізняються одне від одного (виконується нульова гіпотеза).

Оскільки , де випадкова величина має розподіл з ступенем вільності, а сума k таких незалежних величин має розподіл з ступенями вільності, то оцінкою дисперсії може служити величина

,

яку називають внутрішьогруповою дисперсією. Зауважимо, що ця оцінка отримана незалежно від виконання чи невиконання нульової гіпотези.

Якщо припустити, що всі дорівнюють одне одному (виконується нульова гіпотеза), то для оцінки можна скористатися величиною (тут , а випадкова величина має розподіл з ступенем вільності). Тоді оцінкою дисперсії може служити величина

,

яку називають міжгруповою дисперсією. Ця величина істотно залежить від виконання нульової гіпотези і буде тим більшою чим більше відрізняються між собою (зрозуміло, що оцінкою в наших припущеннях виступають ).

Оскільки обидві оцінки статистично незалежні, то при виконанні нульової гіпотези статистика

матиме розподіл Фішера-Снедекора з ступенями вільності. Таким чином нульова гіпотеза прийматиметься на рівні значущості при і відхилятиметься у протилежному випадку.

Якщо нульова гіпотеза відхиляється, то для порівняння середніх при різних значеннях вимушуючого фактора можна скористатись статистикою Шеффе

.

Її критичне значення на рівні значущості може бути обчислене за формулою

,

де — критичне значення статистики Фішера з ступенями вільності.

У пакеті Statistica 6.0 однофакторний дисперсійний аналіз реалізовано у субмодулі Breakdown & one-way ANOVA модуля Basic Statistics and Tables.

Перевірка наявності зв’язку між двома ознаками

У психолого-педагогічних експериментах досліджувані об’єкти, як правило, характеризуються багатьма ознаками виміряними в різних шкалах, і для дослідника важливо встановити, чи пов’язані між собою ці ознаки, тобто чи можна за рівнем вираженості одних ознак судити про рівень вираженості інших.

Методи виявлення та оцінки залежності між досліджуваними ознаками істотно залежать від властивостей шкал, у яких виміряні ці ознаки. Так для перевірки статистичної залежності величин, виміряних у номінативних шкалах, використовують таблиці спряженості та критерій Фішера-Пірсона . Для величин, виміряних у порядкових шкалах, обчислюють коефіцієнт рангової кореляції, а для величин, що виміряні в інтервальній шкалі або в шкалі рівних відношень, — коефіцієнт лінійної кореляції за Пірсоном.

Зауважимо, що статистична відмінність від нуля коефіцієнта кореляції між ознаками свідчить про залежність між ними. Однак у багатьох випадках рівність коефіцієнта кореляції нулю ще не означає статистичну незалежність відповідних ознак.

Зв'язок ознак, виміряних у номінативних шкалах

Нехай одна з ознак має градацій номінативної шкали, які позначимо відповідно, а ознака має градацій номінативної шкали, які позначимо .

Якщо досліджувані ознаки незалежні, то незалежними мають бути і події та , тобто

.

Введемо позначення

.

Оскільки при достатньо великих п за законом Бернуллі , , а , то незалежність ознак і , забезпечуватиме виконання рівностей

Величини називатимемо сподіваними (або теоретичними) частотами розподілу випадкового вектора .

Перевірку узгодженості емпіричного розподілу з теоретичним здійснимо на основі критерію . Якщо виконується нульова гіпотеза (ознаки і — незалежні), то величина

матиме розподіл з ступенями вільності. Великі значення у конкретному експерименті свідчитимуть про залежність між ознаками і .

Для оцінки тісноти зв’язку між ознаками Карл Пірсон запропонував величину

,

яку називають коефіцієнтом спряженості Пірсона. Очевидно, що , причому для незалежних ознак . Однак , коли таблиця спряженості діагональна (абсолютна залежність ознак і ). Позбавлений цього недоліку запропонований Кра­ме­ром коефіцієнт

.

Зв'язок ознак, виміряних у порядкових шкалах

Якщо ознаки Х та Y виміряні у порядкових шкалах, то для дослідника більш суттєвими є не значення , що характеризують і -ий об’єкт , а пари , де — ранг серед чисел , а — ранг серед чисел .

Якщо випадкові величини Х та Y статистично незалежні, то для будь-якої послідовності чисел всі перестановок чисел , які відіграватимуть роль рангів є рівноймовірними. У протилежному випадку послідовність буде визначати послідовність тим повніше, чим тісніший зв'язок між величинами Х та Y.

Статистика

відображає близькість рядів і . Вона набуває найменшого значення лише коли всі (абсолютний прямий зв’язок) і найбільшого — , коли (абсолютний зворотній зв'язок). Якщо досліджувані ознаки незалежні, то математичне сподівання статистики дорівнює .

Для зручності імовірнісної інтерпретації замість статистики розглядають статистику

,

яку називають ранговим коефіцієнтом кореляції Спірмена. Ця величина задовольняє нерівність , причому крайні значення досягаються лише у випадку абсолютного прямого чи зворотного зв’язку між рангами. Для незалежних ознак розподілена на відрізку , а її значення концентруються в околі нуля тим щільніше, чим більше п . Критичні значення статистики на рінях значущості та для малих п наведені в таблиці 14 додатка. Для великих п величина має розподіл Стьюдента з ступенями вільності. Емпіричні значення рангового коефіцієнта кореляції Спір­мена, що перевищують за модулем (а тим більше ) є підставою для відхилення гіпотези про незалежність ознак Х та Y і прийняття альтернативної гіпотези.

Якщо при ранжуванні ознак Х та Y зустрічаються однакові ранги, то ранговий коефіцієнт кореляції Спірмена обчислюють за відкоригованою формулою

.

Тут — поправки на однакові ранги для кожної з вибірок, які обчислюють за формулою

,

де т — кількість груп з однаковими рангами, а — кількість однакових рангів в і -й групі.

В пакеті Statistica 6.0 знаходження рангового коефіцієнта кореляції Спірмена реалізовано у субмодулі Correlations модуля Nonparametrics.

Зв'язок ознак, виміряних в інтервальних шкалах

Якщо ознаки Х та Y виміряні у інтервальних шкалах, то для перевірки залежності між ними потрібно оцінити коефіцієнт лінійної кореляції між цими ознаками. Відмінність від нуля коефіцієнта лінійної кореляції свідчитиме про наявність зв’язку між досліджуваними ознаками.

Оцінкою коефіцієнта лінійної кореляції за вибіркою служить вибірковий парний коефіцієнт кореляції Пірсона

,

де п — кількість спостережень, — вибіркові середні вибірок та відповідно.

Якщо ознаки Х та Y розподілені нормально, то величина r не тільки дає відповідь на питання про залежність досліджуваних ознак, але й вимірює тісноту їх зв’язку. Тому в цьому випадку доводиться поряд з гіпотезою часто доводиться перевіряти гіпотезу . Статистика

,

яку називають перетворенням Фішера від r, дозволяє робити ці перевірки незалежно від величини r, оскільки її розподіл апроксимується нормальним розподілом з дисперсією , залежною лише від об’єму вибірки.

Таким чином, якщо , де — квантиль рівня розподілу Стьюдента з ступенем вільності, то на рівні значущості гіпотезу про незалежність ознак відхиляємо і приймаємо альтернативну гіпотезу. Два коефіцієнти парних кореляцій і за вибіркою об’ємом вважатимемо статистично відмінними на рівні значущості , якщо їх перетворення Фішера задовольняють нерівність .

У пакеті Statistica 6.0 реалізовано у субмодулі Сorrelation matrices модуля Basic Statistics/Tables.






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.