Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Тема 1.3. Психометрические характеристики психодиагностических методик






План

1.Надежность теста, виды надежности, методы оценки надежности психодиагностической методики. 2.Валидность теста, виды валидности, методы оценки валидности.

3. Стандартизированность теста. Сырые и стандартные баллы. Стандартные психодиагностические шкалы, их параметры и сферы применения. Методики перевода сырых баллов в стандартные психодиагностические шкалы.

4.Репрезентативность психодиагностической методики. Достоверность теста, методы проверки достоверности.

 

 

1. Важнейшими показателями качества психодиагностических мето­дик являются надежность и валидиость. Надежность психодиагности­ческих методик свидетельствует о повторяемости, стабильности резуль­татов, об их постоянстве и устойчивости. Она показывает, насколько точно производятся психологические измерения, насколько можно до­верять получаемым результатам.

Известный специалист в области психодиагностики К. М, Гуре-вич предлагает выделять три типа надежности: надежность самого измерительного инструмента, стабильность изучаемого признака и константность, т. е. независимость результатов от личности экспери­ментатора.

Надежность теста показывает независимость его результатов от действия разных случайных факторов. Разнообразные внешние и внутренние факторы могут вызывать отклонения результатов теста. Следует определить среднее арифметическое значение измерений по формуле

где х — результаты отдельных измерений, К — количество измерений. Разброс величин измерений (стандартное отклонение) или дис­персию определяют как

где (х. — М) — отклонение каждого отдельного измерения х; средне­арифметического М,., К — количество измерений.

Для проверки стабильности изучаемого признака используется метод, получивший название «тест — ретест», который заключа­ется в проведении повторного психодиагностического испытания той же выборки испытуемых (не менее 30 человек) через определенный промежуток времени, в вычислении коэффициента корреляции меж­ду результатами первого (X) и второго (Y) тестирования. Этот коэф­фициент и представляет собой показатель стабильности исследуемого признака, т. е. надежность теста проявляется н том, что одни и те же люди при повторном обследовании дают те же результаты. Коэффи­циент корреляции вычисляется по формуле

где к, у. — величины измерений первого (X) и второго (Y) тестирования. Тест надежен, если R = 0, 8—0, 9. Если значение R низкое, это зна­чит, что случайные факторы сильно

влияют, искажают результаты теста, т. е. тест ненадежен. Тогда ошибка измерения

покажет, насколько истинный балл испытуемого по тесту мо, жет от­клоняться от измеренного балла и можно ли доверять данному тесту.

Как правило, повторное обследование проводится через несколь­ко месяцев (но не более чем через полгода). Нельзя проводить по­вторное испытание слитком скоро после первого, поскольку есть опасность, что испытуемые будут воспроизводить свои ответы по памяти. Однако такой срок не может быть слишком большим, по­скольку в этом случае возможно изменение, развитие самой исследу­емой функции. Коэффициент стабильности считается приемлемым в Том случае, когда его величина не ниже 0, 8.

Коэффициент константности определяется путем корреляции результатов двух психодиагностических испытаний, проведенных на одной и той же выборке испытуемых с соблюдением идентичности условий, но разными экспериментаторами. Он должен быть не ниже0, 8.

Качество методики определяется тем, насколько хорошо она со­ставлена, насколько однородна, что свидетельствует о ее направлен­ности на диагностику одного и того же свойства, признака.

Для проверки надежности инструмента по показателю однород­ности используют метод расщепления — для этого все задания психо­диагностического инструмента делятся на четные и нечетные (по нумерации), отдельно обрабатываются, а затем подсчитываются ко­эффициенты корреляции между этими рядами. Чем выше величина коэффициента корреляции, тем однороднее методика, тем выше ее надежность.

 

 

2.

Другим показателем качества методики является ее валидность. По определению видного американского тестолога А. Анастази, «ва­лидность теста — понятие, указывающее нам, что тест измеряет и на­сколько хорошо он это делает». Валидность свидетельствует о том. Пригодна ли методика для измерения определенных качеств, особен­ностей и насколько эффективно она это делает.

Наиболее распространенным способом нахождения теоретичес­кой валидности методики является конвергентная валидность, т. е. сопоставление данной методики с авторитетными родственными методиками и доказательство значимых связей с ними. Сопоставле­ние с методиками, имеющими другое теоретическое основание, и констатация отсутствия значимых связей с ними называется дискри-минантной валидностью.

Другой вид валидности — прагматическая валидность — провер­ка методики с точки зрения ее практической значимости, эффектив­ности, полезности. Для проведения такой проверки, как правило, используются так называемые независимые внешние критерии

используется независимый от теста внешний источник информации о проявлении в реальной жизни и деятельности людей измеряемо­го психического свойства. Среди таких внешних критериев могут быть успеваемость, профессиональные достижения, успехи в разных видах деятельности, субъективные оценки (или самооценки). Если, например, методика измеряет особенности развития профессиональ­но важных качеств, то для критерия необходимо найти такую деятель­ность или отдельные операции, где именно эти качества реализуются. Для проверки валидности теста можно использовать метод изве­стных групп, когда приглашаются люди, про которых известно, к ка­кой группе по критерию они относятся (например, группа «высоко­успешных, дисциплинированных студентов» — высокий критерий и группа «неуспевающих, недисциплинированных студентов» — низ­кий критерий, а студенты со средними значениями не участвуют в тестировании), проводят тестирование и находят корреляцию между результатами теста и критерием.

 

  Высокий критерий Низкий критерий
Высокий результат теста а Ь
Низкий результат теста с d

Здесь а — число испытуемых, попавших в высокую группу по те­сту и по критерию, с — число испытуемых, попавших в высокую груп­пу по критерию и имеющих низкие результаты теста. При полной валидности теста элементы Ь и с должны быть равны нулю. Меру со­впадения, корреляции между крайними группами по тесту и крите­рию оценивают с помощью фи-коэффициента Гилфорда

 

Если было 30 человек испытуемых, то статистически значимую связь теста с критерием можно констатировать, если Р больше 0, 36.

Что касается величины коэффициентов валидности, то она по раз­ным причинам всегда ниже, чем коэффициент надежности. По мне­нию ведущих психодиагностов, низким признается коэффициент валидности порядка 0, 20-0, 30; средним — 0, 30—0, 50; высоким — выше 0, 60.

1. Валидность «по одновременности», или текущая валидность.

Определяется с помощью внешнего критерия, информация wo кото­рому собирается в период проведения испытаний (например, успева­емость, производительность труда и др.).

2. Прогностическая, или «предсказывающая» валидность отличает­
ся тем, что информация по внешнему критерию собирается некото­
рое время спустя после проведения обследования. Такая валидность
свидетельствует о возможностях методики предсказывать успешность
испытуемого в каких-либо видах деятельности.

Для проверки прогностической валидности теста нужно обследо­вать более 300 человек, например абитуриентов, а через 2—3 года вы­делить среди этих людей критериальные группы «отличников» и «дво­ечников» и посчитать корреляцию с прежними показателями теста. Если корреляция выше 0, 4—0, 6, то тест можно использовать для профотбора абитуриентов и прогноза их учебной успешности.

3. Ретроспективная валидность определяется на основе крите­
рия, отражающего событие или состояние качества в прошлом.
Она также может свидетельствовать о предсказательных возможно­
стях методики.

 

 

3. Стандартизированность психодиагностической методики предпо­лагает, с одной стороны, единую стандартную процедуру ее проведе­ния и обработки результатов, а с другой стороны, включает перевод «сырых первоначальных результатов теста» в стандартную шкалу те­стовых баллов, в результате чего можно сопоставлять результаты у разных испытуемых в разных тестах. Выборка, на которой определя­ются статистические тестовые нормы, называется «выборкой стан­дартизации» (она должна быть не менее 200 человек). Процедура нор­мирования (перевода «сырых результатов теста» в стандартную шка­лу) включает ряд операций:

I) расчет стандартного балла

где х — сырой балл по тесту, Мя — средний балл по выборке стандар­тизации, Дк — дисперсия, или стандартное отклонение по выборке стандартизации;

♦ 2) перевод стандартного балла Z в любую стандартную тестовую
шкалу, применяемую в психодиагностике. Обычно применяют 3 вида
стандартных шкал: шкала IQ, используемая для измерения интеллекта (в шкале IQ центр М равен 100, а дисперсия Д = 15), тогда формула пере­вода в IQ шкалу = 15Z + 100;

♦ шкала «стенов», в которой центр М равен 5, 5, а отклонение Д в 2, тогда формула перевода в шкалу «стенов» = 2Z + 5, 5;

♦ Т-шкала, в которой центр М равен 50, а отклонение Д = 10.

Обобщенная формула перевода сырого балла в заданную стандар­тную шкалу имеет вид Y = flZ + М, где Y — стандартный балл по про­извольной стандартной шкале с центром М и отклонением Д.

Для многих тестов используют более сложную процедуру нели­нейной нормализации (переход к нормальному распределению), в результате чего создают «конверсионную таблицу» для перевода сы­рых баллов в стандартные баллы по заданной шкале, в которой каж­дому «сырому баллу» указан соответствующий стандартный балл по определенной шкале, например шкале «стенов», причем диагносту уже не надо делать самостоятельных вычислений по нормированию баллов.

 

4. Следует учитывать репрезентативность тестовых норм — пра­вомерность применения тестовых норм в большой группе людей. Если тестовые нормы были вычислены на выборке школьников, то эти нормы нельзя автоматически переносить на студентов — надо провести рестандартизацию теста, проверить его на студентах и вычислить тестовые нормы для студентов.

Кроме статистических тестовых норм часто используют критери­альные нормы, т. е. достигли человек критического требуемого уров­ня развития профессионально важного психологического качества. В критериальных тестах учитывают не степень отклонения баллов от центра шкалы, а достижение или недостижение какого-то критичес­кого уровня на шкале.

Следует учитывать и достоверность теста — способность теста защищать информацию от мотивационных (сознательных и бессоз­нательных) искажений и социальной желательности ответов {это до­стигается через введение в тест проверочной шкалы лжи).

В случае, если тестирование проводится в интересах и по просьбе самого человека (ситуация консультирования), то ответы человека более правдивы. Если тестирование проводят по инициативе админи­страции, например в целях профотбора (ситуация экспертизы), то ис­пытуемый склонен давать «социально желательные», нужные, выгод­ные «ответы», т. е. эти ответы являются сознательно или бессозна­тельно искаженными, и в таких случаях нельзя использовать тесты без шкалы достоверности

 

Тема 1.4. История развития психодиагностики.

План

1.Возникновение психодиагностики. Шкалы Бине.

2. Развитие психодиагностики за рубежом.

3. Развитие психодиагностики в России.

Достоинства и недостатки, ограничения психодиагностических обследований.

1. Еще в 1905 году Альфред Бине по поручению министерства обра­зования Франции разработал методики, с помощью которых можно измерять уровень умственного развития ребенка. Для каждого возра­ста подбирались свои задания, которые могли решить 80—90 % детей из выборки в 300 детей данного возраста. Детям до 6 лет предлагалось по 4 задания, а старше 6 лет — 6 заданий. Показателем интеллекта в шкалах Бине был умственный возраст, который определялся по ус­пешности выполнения тестовых заданий. Испытание начиналось с выполнения заданий, соответствующих хронологическому возрасту ребенка, если он справлялся со всеми заданиями, то ему предлагались задания более старшего возраста (если он решал не все, а некоторые из них, то испытание прекращалось). Максимальный возраст, все за­дания которого решались испытуемым, является его базовым ум­ственным возрастом. Например, если ребенок решил все задания для 7 лет и 2 задания для 8 лет, то его базовый возраст равен 7, а каждое дополнительно выполненное задание оценивается числом «умствен­ных месяцев» (каждое задание соответствует 2 месяцам, так как 6 за­даний = 12 месяцам), следовательно, умственный возраст (УВ) ребен­ка =" \7 лет 4 месяцам. Несовпадение умственного и хронологического возрастов возрастов считалось либо показателем умственной отсталости (если УВ меньше хронологического), либо одаренности (если УВ больше хронологического).

Американский ученый Термен (работал в Стенфордском универ­ситете) усовершенствовал тест Бине, возникла шкала Стенфорд — Бине, в которой стал использоваться показатель — коэффициент ин­теллектуальности, представляющий собой частное, получаемое при делении умственного возраста на хронологический и умноженный на 100. «Коэффициент интеллектуальности», сокращенно обозначаемый IQ, позволяет соотнести уровень интеллектуальных возможностей индивида со средними показателями своей возрастной и професси­ональной группы. Можно сравнивать умственное развитие ребенка с возможностями его ровесников. Например, календарный возраст 8 лет, а умственные способности ближе к шестилетней группе, таков, следовательно, и его «умственный» возраст, следовательно, коэффи­циент интеллекта около 75 %. Среднее значение IQ (умственный воз­раст соответствует хронологическому) соответствует 100 баллам, а самые низкие могут приближаться к 0, самые высокие — к 200. Стан­дартное (т. е. среднее для всех групп) отклонение — 16 баллов в каж­дую сторону. У каждого третьего человека IQ находится между 84—100 баллами, и такова же доля лиц (34 %) с показателем от 100 до 116 бал­лов. Таким образом, эта основная масса (68 %) и считается людьми со средним интеллектом. Две другие группы (по 16 % в каждой), резуль­таты которых соответствуют крайним показателям шкалы, рассмат­риваются или как умственно отсталые (люди со сниженным интел­лектом IQ от 10 до 84), или как обладающие высокими (выше сред­него) интеллектуальными способностями (1Q от 116 до 180). Если результат ребенка выше тестовой нормы, более 116, то ребенок счита­ется интеллектуально одаренным. Шкала Стенфорд-Бине применяет­ся во всем мире, имела несколько редакций (1937, I960, 1972, 1986).






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.