Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Проверка данных






После создания таблицы на бумаге или компьютере необходимо прове­рить качество полученных данных. Для этого часто достаточно вниматель­но осмотреть массив данных. Начать проверку следует с выявления оши­бок (описок), которые заключаются в том, что неправильно написан поря­док числа. Например, 100 написано вместо 10, 9, 4 - вместо 94 и т. п. При внимательном просмотре по столбцам это легко обнаружить, поскольку сравнительно редко встречаются параметры, которые сильно варьируют. Чаще всего значения одного параметра имеют один порядок или ближай­шие порядки. При наборе данных на компьютере важно соблюдать требо­вания к формату данных в используемой статистической программе. Преж­де всего это относится к знаку, который должен отделять в десятичном чис­ле целую часть от дробной (точка или запятая).

 

Затем массив данных надо проверить на наличие «выскакивающих», вариант - выделяющихся значений, которые могли быть получены в резуль­тате неточных измерений, ошибок в записях, отвлечения внимания испыту­емого и т. д. Если обнаружены «подозрительные» значения, то принять обо­снованное решение об их выбраковке, используя достаточно мощный пара­метрический критерий t. Он рассчитывается по следующей формуле:

V – M

t = 0 > t st

 

где t - критерий выпада; V — выпадающее значение признака; М- средняя величина признака для всей группы, включающей артефакт; tst - стандарт­ные значения критерия выпадов, определяемые для трех уровней довери­тельной вероятности по таблице приложения 1. Смысл критерия в том, что­бы определить, находится ли данная варианта в интервале, характерном для большинства членов выборки, или же вне его.

 

Допустим, нами принят уровень значимости 0, 05 (доверительная веро­ятность 0, 95), а значение критерия составило 1.5. Поскольку 95 % вариант лежат в пределах М ± 1, 96 о (1, 5 меньше 1, 96), то, следовательно, и данная варианта лежит в указанном интервале. Если же значение критерия боль­ше, например, 2, 4, то это означает, что данное значение не относится к ана­лизируемой совокупности (выборке), включающей 95 % вариант, а есть про­явление иных закономерностей, ошибок и пр. и поэтому должно быть ис­ключено из рассмотрения.

 

Например, в эксперименте вы предлагаете решать мыслительные зада­чи и регистрируете в числе других параметров время решения. При про­смотре данных обнаруживаете, что у одного из испытуемых время решения заметно больше, чем у остальных. Это бывает связано с тем, что вместо решения очередной задачи испытуемый начинает «искать закономерность более широкого плана», «выводить общий принцип» или нечто подобное. Об этом он может сообщить, но может и не сообщить экспериментатору. Понятно, что время решения конкретной задачи при этом может сильно отличаться от средней величины. Если у вас есть предположение, что ре­зультаты какого-либо опыта, пробы обусловлены влиянием, которое вы не можете оценить или его оценка не входит в ваши планы, то вы окажетесь перед необходимостью принять обоснованное решение - включать полу­ченное численное значение в дальнейшую обработку или нет.

 

Предположим, в эксперименте были получены следующие значения не­которого параметра: 10, 20, 20, 30, 30, 40, 40, 50, 210. Следовательно, п = 9. Вычислили: М = 50, а = 61. Можно ли считать значение 210 выпадающим?

t = 210 – 50 = 2, 6; (по табл.) = 2, 4 (для Р = 0, 95;. 61

Следовательно, значение 210 может считаться выпадающим и должно быть исключено из дальнейшей обработки.

После исключения выпадающих значений первичные статистические параметры вычисляются заново.

Вопрос № 2






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.