Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Порядок выполнения работы. 1. Запустите программу STATISTICA V6.0 и загрузите файл c исходными данными, который использовался в лабораторной работе №1.






1. Запустите программу STATISTICA V6.0 и загрузите файл c исходными данными, который использовался в лабораторной работе №1.

 

Группировка данных

2. В основном меню выберите пункт Статистика (Statistics) и запустите модуль Основная статистика/Таблицы (Basic Statistics/Tables). Из стартовой панели модуля Основная статистика/Таблицы (Basic Statistics/Tables) выберите пункт Таблицы частот (Frequency Tables), как показано на рисунке 2.1:

 

Рисунок 2.1 – Экранная форма выбора пункта Таблицы частот

 

При этом появится окно вида, изображенного на рисунке 2.2:

 

Рисунок 2.2 – Экранная форма вкладки Таблицы частот

 

3. В окне Таблицы частот (Frequency Tables), щелкнув по кнопке Переменные (Variables), выберите переменную (или переменные) для анализа. Количество переменных задается преподавателем.

4. Изучите данные и выполните разбиение на группы для выбранной переменной. Разбиение на группы должно по возможности учитывать следующие принципы:

ü количество групп (N) – не менее 16;

ü количество наблюдений в группе не менее 5-7;

ü интервалы группирования могут быть одинаковыми или задаваться, исходя из оптимальной компоновки групп.

Перейдите на вкладку Дополнительно (Advanced). Здесь в меню Метод категоризации для таблиц и графиков (Categorization method for tables & graps) можно задать количество групп, на которые разбивается выборка. Это можно сделать одним из следующих способов:

 

1. Все различные значения x (All distinct values);

2. Число равных интервалов (No.of exact intervals);

3. Приближенное число интервалов(“Neat” of exact intervals);

4. Размер шага (Step size), h=(xmax-xmin)/N;

5. Целые категории (Integer categories);

6. Задание группирующих кодов (Specific grouping codes (values));

7. Определенные пользователем категории (User-specified categories).

 

Учитывая требования п. 4, выберите метод категоризации для своих данных и задайте свои характеристики группирования данных. Рекомендуется пользоваться п.4. Для этого вначале рассчитывается значение шага h (см. рис. 2.3), по формуле выше (п. 4.4). В этой формуле значения xmax и xmin представляют собой максимальное и минимальное значение выбранной для анализа переменной, а N – количество регистров этой переменной. Однако, если количество групп, на которые разбивается выборка, в дальнейшем превышает значение 60, разрешается искусственно увеличить значение шага. В этом случае можно также воспользоваться другим методом категоризации (см. п. 2 и 3). В пунктах 2, 3 – можно задать точное или приближенное количество интервалов, исходя из общего диапазона изменения значений данных.

Рисунок 2.3 – Экранная форма вкладки Таблицы частот

 

5. Перейдите на вкладку Опции (Options). В меню Опции отображения для таблиц частоты (Display Options for frequency tables) отметьте первые три опции – кумулятивные частоты (cumulative frequencies), процентыотносительные частоты (Percentages – relative frequencies), кумулятивные проценты (cumulative Percentages), как показано на рисунке 2.4.

 

Рисунок 2.4 – Экранная форма меню Опции отображения для таблиц частоты

 

6. В окне Таблицы частот (Frequency Tables) нажмите кнопку Расчет (Summary). В результате расчетов будет выведена таблица расчетных данных – диапазон группирования, частоты (Count), кумулятивные частоты (Cumul. Count), проценты – относительные частоты (Percent), кумулятивные проценты (Cumul. Percent). Сохраните таблицу для отчета.

 

Таблица 2.1. – Таблица расчетных данных

 

  Count Cumulative Percent Cumulative
-239, 304< =x< -237, 304     1, 000000 1, 0000
-237, 304< =x< -235, 304     0, 000000 1, 0000
*** *** *** *** ***
224, 6958< =x< 226, 6958     0, 000000 100, 0000
Missing     0, 000000 100, 0000

 

7. Визуализируйте таблицу, построив на ее базе гистограмму. Вернитесь в диалоговое окно Таблицы частот (Frequency Tables), перейдите на вкладку Дополнительно (Advanced) и нажмите кнопку Гистограммы (Histograms). Сохраните появившийся график для отчета (см. рис. 2.5).

Рисунок 2.5 – Пример графика, построенного с использованием кнопку Гистограммы в диалоговое окне Таблицы частот

 

Проверка нормальности распределения данных.

Метод 1. Проверка нормальности с помощью оценок коэффициентов ассиметрии и эксцесса.

(Предварительно необходимо ознакомиться с [6] §9 стр. 137 и §8 стр. 250)

 

8. Создайте новый файл данных STATISTICA 6.0 с двумя столбцами и числом строк равным количеству групп, на которые была разбита выборка (см. п.4). В первом столбце запишите средние значения по каждому интервалу группирования выбранной переменной для анализа. Для этого предварительно рассчитайте эти значения, воспользовавшись известными значениями начала и конца каждого диапазона (см. п.6, таблица, первый столбец). Во второй столбец запишите частоты (количество наблюдений, попадающее в группу). Используйте для этого полученную ранее таблицу частот (см. п.6, таблица, второй столбец – Count).

9. Запустите модуль Основная статистика/Таблицы (Basic Statistics/Tables) и выберите в появившемся окне опцию Описательные статистики (Descriptive Statistics).

 

Рисунок 2.6 – Экранная форма вкладки Описательные статистики

 

10. В окне Описательные статистики (Descriptive Statistics) нажмите кнопку Переменные (Variables) и выберите первую переменную. Далее нажмите на кнопку Вес . При этом появится окно следующего вида:

Рисунок 2.7 – Экранная форма выбора переменных

 

Кликните дважды по полю Weight variable. При этом откроется окно выбора переменных. Выберите в этом окне вторую переменную и нажмите кнопку ОК. Убедитесь, что поле Weight variable отражает имя второй переменной. Нажмите кнопку ОК.

11. Перейдите на вкладку Дополнительно (Advanced). Отметьте в появившемся окне ассиметрию и эксцесс, и их стандартные ошибки (4 последние строчки в поле Variation, moments). Все остальные отметки, которые устанавливаются автоматически, можно снять (см. рис. 2.8).

 

Рисунок 2.8 – Экранная форма вкладки Advanced

12. Нажмите кнопку Расчет (Summary) в окне Описательные статистики (Descriptive Statistics).

13. Система выполнит расчет и на экране появится таблица с результатами.

 

Таблица 2.2. – Таблица результатов расчета в окне Описательные статистики

 

  Skewness Std.Err. Kurtosis Std.Err.
Var1 -0, 118872 0, 687043 0, 099314 1, 334249

 

Если ассиметрия и эксцесс близки к нулю и по абсолютной величине их значения имеют тот же порядок, что и их ошибки, тогда ассиметрия и эксцесс не значимы. Поэтому можно говорить, что данные согласованы с гипотезой о нормальности, если порядок иной (ассиметрия или эксцесс сильно отличаются от нуля), то тогда данные не согласованы с гипотезой. Однако, оценка на нормальность по ассиметрии и эксцессу не является точным методом, т.к. в программе STATISTICA 6.0 не реализованы количественные вероятностные оценки в этом случае.

 

Метод 2. Использование критерия Хи-квадрат для проверки нормальности.

(Предварительно необходимо ознакомиться с [6] §23 стр. 329)

14. Для анализа используйте ту же переменную (или переменные), что и в предыдущем случае. Запустите модуль Настройка распределения (Distribution Fitting):

Рисунок 2.9 – Экранная форма запуска модуля Настройка распределения

При этом появится окно следующего вида:

 

Рисунок 2.10 – Экранная форма выбора вида распределения

 

15. Далее в списке Непрерывные распределения (Continuous Distribution) выберите Нормальное (Normal). Нажмите кнопку OK.

16. В появившемся окне Подгонка непрерывных распределений (Fitting Continuous Distribution) нажмите кнопку Переменные (Variable) и выберите название переменной из файла.

Рисунок 2.11 – Экранная форма подгонки нормального распределения

 

17. В диалоговом окне Подгонка непрерывных распределений (Fitting Continuous Distribution) нажмите кнопку Расчет (Summary). В результате расчетов будет выведена таблица расчетных данных – наблюдаемые частоты (observed frequency), кумулятивные наблюдаемые частоты (cumulative observed), проценты – относительные частоты (Percent observed), кумулятивные проценты (Cumul. % observed), ожидаемая частота (Cumultv expected) и т.д. Сохраните таблицу для отчета.

 

Таблица 2.3. – Таблица результатов расчета частот

  Variable: Var1, Distribution: Normal (Spreadsheet1) Chi-Square = 8, 80041, df = 7 (adjusted), p = 0, 26730
Observed Cumulative Percent Cumul. % Expected Cumulative Percent Cumul. % Observed
< =0, 0000     0, 00000 0, 0000 4, 62763 4, 6276 4, 62763 4, 6276 -4, 62763
10, 00000     12, 00000 12, 0000 4, 40668 9, 0343 4, 40668 9, 0343 7, 59332
20, 00000     10, 00000 22, 0000 6, 94748 15, 9818 6, 94748 15, 9818 3, 05252
30, 00000     10, 00000 32, 0000 9, 74575 25, 7275 9, 74575 25, 7275 0, 25425
40, 00000     9, 00000 41, 0000 12, 16404 37, 8916 12, 16404 37, 8916 -3, 16404
50, 00000     8, 00000 49, 0000 13, 50878 51, 4004 13, 50878 51, 4004 -5, 50878
60, 00000     12, 00000 61, 0000 13, 34844 64, 7488 13, 34844 64, 7488 -1, 34844
70, 00000     10, 00000 71, 0000 11, 73604 76, 4848 11, 73604 76, 4848 -1, 73604
80, 00000     12, 00000 83, 0000 9, 18096 85, 6658 9, 18096 85, 6658 2, 81904
90, 00000     10, 00000 93, 0000 6, 39041 92, 0562 6, 39041 92, 0562 3, 60959
100, 0000     7, 00000 100, 0000 3, 95769 96, 0139 3, 95769 96, 0139 3, 04231
< Infinity     0, 00000 100, 0000 3, 98610 100, 0000 3, 98610 100, 000 -3, 98610

 

18. В верхней части таблицы приведено значение статистики Хи -квадрат и уровень значимости (вероятность ошибиться при отклонении гипотезы нормальности). Чем ближе значение Хи -квадрата к нулю, тем более правомерной считается гипотеза (см. [6] §23 стр. 329). Исходя из этого, сделайте оценку правомерности гипотезы H0: генеральная совокупность распределена нормально.

19. Для визуализации результатов в диалоговом окне Подгонка непрерывных распределений (Fitting Continuous Distribution) на вкладке Быстрые (Quick) нажмите кнопку Графики наблюдаемого и ожидаемого распределения (Plot of observed and expected distribution). На экране появится гистограмма с наложенным нормальным распределением. Сохраните график для отчета.

 

Рисунок 2.12 – Пример графика наблюдаемого и ожидаемого распределения


Подгонка вероятностных распределений к реальным данным

20. На практике в случае, если переменная не подчиняется нормальному вероятностному распределению, изучают другие распределения, описанные в разделе Краткие теоретические сведения. В лабораторной работе следует в любом случае изучить соответствие нескольких вероятностных распределений реальным данным для приобретения навыков подгонки распределений к реальным данным.

Запустите модуль Настройка распределений (Distribution fitting) (см. п. 14). В окне Непрерывные распределения (Continuous Distribution) выберите анализируемое распределение, например, равномерное (Rectangular) и нажмите кнопку ОК. Выберите переменную для анализа, нажав кнопку Переменные(Variables). Для анализа следует выбирать ту же переменную, что и в п. 16. Запустите программу на расчет и постройте таблицы и графики по аналогии с п.п.17-19.

21. В лабораторной работе следует кроме оценки данных на соответствие нормальному и равномерному распределению сделать также оценку по показательному и логнормальному распределению.

Таблицы и графики используйте для написания отчета.

 






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.