Теория Б. Скиннера

⇐ ПредыдущаяСтр 17 из 56Следующая ⇒

	Позитивное	Негативное
Подкрепление	Предъявление положительного подкрепления (удовольствие)	Удаление аверсивного (болевого) стимула
Наказание	Предъявление аверсивного стимула (ругают, бьют, исключают из школы, сажают в тюрьму и т. п.)	Удаление положительного стимула (запрещают смотреть телевизор, гулять и т. п.)

Скиннер боролся против того, чтобы использовать наказание для контроля над поведением, потому что это вызывает отрицательные эмоциональные и социальные побочные эффекты (страх, тревогу, антисоциальные действия, ложь, потерю самоуважения и уверенности). Кроме того, оно всего лишь на время подавляет нежелательное поведение, которое вновь проявится, если уменьшится вероятность наказания. Вместо аверсивного контроля Скиннер рекомендует позитивное подкрепление как наиболее эффективный метод для устранения нежелательных и поощрения желательных реакций. «Метод успешного приближения или формирования поведения» заключается в положительном подкреплении тех действий, которые наиболее близки к ожидаемому оперантному поведению. К этому приближаются шаг за шагом: одна реакция закрепляется, а затем заменяется другой, более близкой к предпочтительной (так формируют речь, трудовые навыки и т. п.). Данные, полученные при изучении поведения животных, Скиннер перенес на поведение людей, что привело к биологизаторской трактовке. Так, возник скиннеровский вариант программированного обучения. Его принципиальная ограниченность состоит в сведении обучения к набору внешних актов поведения и подкреплению правильных из них. При этом игнорируется внутренняя познавательная деятельность человека, следовательно, нет обучения как сознательного процесса. Вслед за установкой уотсоновского бихевиоризма Скиннер исключает внутренний мир человека, его сознание из поведения и производит бихевиоризацию психики. Мышление, память, мотивы и тому подобные психические процессы он описывает в терминах реакции и подкрепления, а человека — как реактивное существо, подвергающееся воздействиям внешних обстоятельств. Биологизация мира людей, характерная для бихевиоризма в целом, принципиально не проводящего различий между человеком и животным, достигает у Скиннера своих пределов. Культурные явления оказываются в его трактовке «хитроумно придуманными подкреплениями». Для разрешения социальных проблем современного общества Б. Скиннер выдвинул задачу создания технологии поведения, которая призвана осуществлять контроль одних людей над другими. Поскольку намерения, желания, самосознание человека не принимаются во внимание, управление поведением не связано с сознанием. Таким средством выступает контроль за режимом подкреплений, позволяющий манипулировать людьми. Для наибольшей эффективности необходимо учитывать, какое подкрепление наиболее важно, значимо, ценно в данный момент (закон субъективной ценности подкрепления), а затем предоставлять такое субъективно ценное подкрепление в случае правильного поведения человека или угрожать его лишением в случае неправильного поведения. Подобный механизм и позволит управлять поведением. Скиннер сформулировал закон оперантного обусловливания: «поведение живых существ полностью определяется последствиями, к которым оно приводит. В зависимости от того, будут ли эти последствия приятными, безразличными или неприятными, живой организм проявит тенденцию повторять данный поведенческий акт, не придавать ему никакого значения или же избегать его повторения в дальнейшем». Человек способен предвидеть возможные последствия своего поведения и избегать тех действий и ситуаций, которые приведут к негативным для него последствиям. Он субъективно оценивает вероятность их наступления: чем больше возможность негативных последствий, тем сильнее это влияет на поведение человека (закон субъективной оценки вероятности последствий). Эта субъективная оценка может не совпадать с объективной вероятностью последствий, но на поведение влияет именно она. Поэтому один из способов воздействовать на поведение человека — «нагнетание обстановки», «запугивание», «преувеличение вероятности негативных последствий». Если человеку кажется, что последняя, вытекающая из какой-либо его реакции, незначительна, он готов «рискнуть» и прибегнуть к данному действию.

Или

Б. Скиннер (1904-1990) является представителем необихевиоризма.

Основные положения теории ≪ оперантного бихевиоризма≫:

1. Предметом исследования является поведение организма в его двигательной составляющей.

2. Поведение - это то, что делает организм и что можно наблюдать, и поэтому сознание и его феномены -воля, творчество, интеллект, эмоции, личность - не могут быть предметом изучения, так как они не наблюдаемы объективно.

3. Человек не свободен, так как сам никогда не управляет своим поведением, которое детерминировано внешней средой.

4. Личность понимается как набор поведенческих шаблонов ≪ ситуация - реакция≫, причем последняя зависит от предыдущего опыта и генетической истории.

5. Поведение можно разделить на три вида: безусловно-рефлекторное и условно-рефлекторное, которые являются простым ответом на стимул, и оперантное, возникающее спонтанно и определяемое как обусловливание; этот тип поведения играет решающую роль в адаптации организма к внешним условиям.

6. Главной характеристикой оперантного поведения является его зависимость от прошлого опыта, или последнего стимула, получившего название подкрепления. Поведение усиливается или ослабляется в зависимости от подкрепления, которое может быть отрицательным или положительным.__

7. Процесс положительного или отрицательного подкрепления за совершенное действие называется обусловливанием.

8. На основе подкрепления можно построить всю систему обучения ребенка, так называемое программированное обучение, когда весь материал расчленяется на мелкие части и в случае успешного прохождения и усвоения каждой части учащийся получает положительное подкрепление, а в случае неудачи - отрицательное.

9. На этой же основе строится и система воспитания и управления человеком - социализация происходит путем положительного подкрепления необходимых для общества норм, ценностей и правил поведения, в то время как асоциальное поведение должно иметь негативное подкрепление со стороны общества.

Стремясь переработать классический бихевиоризм, Скиннер исходил прежде всего из необходимости систематического подхода к пониманию человеческого поведения. При этом он считал необходимым исключить из исследования все фикции, к которым прибегают психологи для объяснения того, чего они не понимают. К таким фикциям Скиннер относит многие понятия психологии личности, например самость, автономию, свободу, творчество. С его точки зрения, нельзя говорить о реальной свободе человека, так как он никогда реально сам не управляет своим поведением, которое детерминировано внешней средой При оперантном обучении подкрепляется не стимул, а поведение, операции, которые совершает субъект в данный момент и которые приводят к нужному результату. Большое значение имеет и тот факт, что сложная реакция при этом разбивается на ряд простых, следующих друг за другом и приводящих к нужной цели. Так, при обучении голубя сложной реакции -выходу из клетки при помощи нажатия клювом на рычаг Скиннер подкреплял каждое движение голубя в нужном направлении, добиваясь безошибочного выполнения этой сложной операции. Такой подход к формированию нужной реакции имел большие преимущества по сравнению с традиционным. Прежде всего это поведение было намного устойчивей, оно очень медленно угасало даже при отсутствии подкрепления. Не меньшее значение имеет и тот факт, что обучение при оперантном обусловливании идет быстрее и проще. Это связано с тем, что экспериментатор имеет возможность наблюдать не только за конечным результатом (продуктом), но и за процессом выполнения действия (ведь оно разложено на составляющие, реализуемые в заданной последовательности). Фактически происходит экстериоризация (переход во внешний план) не только исполнения, но и ориентировки и контроля за действием. Ведь подкрепляя правильное действие нужным стимулом, учитель демонстрирует ребенку, на какие элементы ситуации ему надо обращать внимание, а также что и в каком порядке с ними делать. Особенно важно, что такой подход возможен при обучении не только определенным навыкам, но и знаниям. Разработанный Скиннером метод программного обучения позволял оптимизировать учебный процесс, разработать корректирующие программы для неуспевающих и умственно отсталых детей. Эти программы имели огромные преимущества перед традиционными программами обучения, так как давали возможность учителю контролировать и в случае необходимости исправлять процесс решения задачи, мгновенно замечать ошибку учащегося. Кроме того, эффективность и безошибочность выполнения повышали мотивацию учения, активность учащихся. Наблюдение за процессом решения также позволяло индивидуализировать процесс обучения в зависимости от темпа усвоения знания. Однако у этих программ был и существенный недостаток, так как экстериоризация, играющая положительную роль в начале обучения, тормозит развитие свернутых, умственных действий. Постоянная необходимость повторять промежуточные, давно усвоенные учеником этапы решения мешает интериоризации и свертыванию развернутой педагогом схемы решения задачи. Это может на определенном этапе снизить мотивацию учащихся.

Или

Классические условные рефлексы Зорина

Условнорефлекторное слюноотделение, которому уделялось основное внимание в лаборатории Павлова, относится к классическим УР. При выработке классического УР последовательность событий в опыте никак не зависит от поведения животного. Она устанавливается либо экспериментатором, либо специальной программой, в соответствии с которой включаются те или иные стимулы, в ответ на них можно наблюдать образование условных реакций. В настоящее время в связи с использованием разнообразных экспериментальных животных (не только традиционных собак), а также благодаря разнообразным методам регистрации изучаемых реакций на смену павловской методике классических слюнных УР пришли другие, более удобные лабораторные модели, которые продолжают быть предметом многочисленных исследований (см. также Мак-Фарленд, 1987; Реагсе, 1998).

Разнообразные классические условнорефлекторные реакции можно наблюдать в экспериментах на животных, если проводить полиграфическую регистрацию ряда физиологических процессов организма (ЭКГ, ЭЭГ, плетизмог-рамму и др.). Как и в случае слюнного рефлекса, сочетание положительного (например, пищевого) безусловного раздражения с нейтральным приведет к тому, что последний начнет вызывать изменения в вегетативных функциях организма, которые до этого провоцировались только непосредственно самим безусловным воздействием. Полиграфическая регистрация обычно используется при изучении отрицательных (аверсивных) классических УР. Много работ такого рода проводится также для оценки реактивности нервной системы к действию стрессорных агентов и ее устойчивости к стрессу. В настоящее время классические УР наиболее часто исследуют на моделях, использующих вкусовое отвращение и реакцию третьего века (мигательной перепонки). Было, например, обнаружено, что классические УР образуются с разной скоростью в зависимости от того, какие физиологические системы вовлечены в их формирование. Так, УР избегания пищевого яда у крыс (как правило, используют хлорид лития) формируется легко, если введение его в организм сочетается с предложением животному пищи определенного вкуса. Однако УР избегания яда формируется с трудом или не образуется совсем, если его введение сочетается, например, со звуковым раздражением. На схеме (рис. 3.3) показано, как авторы (Garcia et al., 1970) представляют себе гипотетический механизм формирования такого УР вкусового отвращения. Вкусовой стимул, сочетающийся с пищевым отравлением, ведет к образованию УР вкусового отвращения. При сочетании звука с ударом тока образуется УР на боль. В то же время иное сочетание, например вкусового и болевого стимулов, не ведет к образованию УР.

Классический УР — сокращение мигательной перепонки при действии тактильного или звукового УС — обычно изучают на кроликах. При действии на роговицу глаза безусловного раздражителя — воздушной струи (или слабого удара тока) — мигательная перепонка сокращается. Это сокращение можно регистрировать специальным прибором и оценивать его интенсивность. Если безусловное раздражение сочетать с каким-либо нейтральным стимулом, например звуком, то после нескольких сочетаний мигательная перепонка будет сокращаться уже при изолированном действии этого звука, который становится условным сигналом (см. рис. 3.2).

Рис. 3.3. Схема, показывающая избирательность ассоциаций между УС и подкреплением при формировании классических УР.

Стимулы	Последствия
	рвота	боль
Сладкий вкус	формирование УР вкусового отвращения	УР не формируется
Щелчок	УР не формируется	Формирование оборонительного УР

3.2.2.3. Инструментальные условные рефлексы (или обучение методом проб и ошибок)

Начало исследований инструментальных УР связано с именем Э. Торндайка (см. 2.4.1), хотя их анализ проводился и в лаборатории И. П. Павлова. В лаборатории И. П. Павлова “классические” УР носили название условных рефлексов 1-го рода, а инструментальные — условных рефлексов 2-го рода. В монографии Ю. Конорски (1969) на большом экспериментальном материале дается анализ сходства и различия между ними.

В опытах с “проблемными ящиками” Торндайк наблюдал, как посаженная в ящик кошка ищет выход, пытаясь открыть дверцу разными способами (рис. 3.4А) (для этого нужно было нажать на задвижку или потянуть за пружину). Кошка сначала совершает много разных действий (проб), которые в своем большинстве бывают неверными (ошибки), пока случайно не откроет яшик. При повторении опытов она выходит из ящика все быстрее и быстрее. Идея эксперимента была подсказана Торндайку К. Ллойдом-Морганом, наблюдавшим, как его собака манипулирует с задвижкой калитки, чтобы “улизнуть” из дома (рис. 3.5). Такое обучение Торндайк и назвал “методом проб и ошибок”. В дальнейшем обучение животного подобным действиям получило название инструментальных (или оперантных) УР.

Торндайк первым предложил количественную оценку динамики обучения животного инструментальному навыку. Для этого он ввел так называемые “кривые научения”, примеры которых приведены на рис. 3.4Б.

Между классическими и инструментальными УР существуют определенные различия.

Рис. 3.4. Инструментальные УР.

А — один из вариантов “проблемного ящика”, предложенный Э. Торндайком для исследования способности животного к решению.задачи методом “проб и ошибок”; Б — примеры кривых научения при использовании этого метода. По оси ординат — время, затраченное на решение задачи, по оси абсцисс — последовательные предъявления теста.

При классических УР временная связь между условным сигналом и безусловной реакцией возникает непроизвольно при действии безусловного раздражителя (подкрепления). При инструментальных УР подкрепление, например пища, дается только после того, как животное совершает определенное действие, которое не имеет прямой связи с безусловным раздражителем. В классическом УР выделение слюны происходит в ответ на контакт пищи с рецепторами полости рта, и эта реакция может стать услов-норефлекторной. В отличие от этого при выработке инструментального УР пищевое подкрепление изначально никак не связано ни с протягиванием лапы, ни с побежкой в лабиринте. Однако мы можем давать животному пищу сразу после того, как оно сделало такое движение, и вскоре животное будет его совершать, чтобы получить подкрепление. К категории инструментальных УР относится формирование навыка нажатия на рычаг (или клевания кнопки, как на рис. 3.6) для получения порции пищи. После работ Б.Скиннера этот УР стал основным в исследованиях бихевиористов (анализ связей “стимул-реакция”). К инструментальным УР относится также обучение подопытного животного находить путь к пище или избегать неприятных стимулов в лабиринте. Инструментальным УР является и реакция избегания — навык переходить в тот отсек экспериментальной камеры, где отсутствует болевое подкрепление (рис. 3.7).

Рис. 3.5. Рисунок, сделанный по фотографии “исторического” эпизода. Собака К. Л. Моргана научилась открывать задвижку калитки, получая тем самым возможность “обрести свободу”. Эта ситуация считается прототипом торндайковского “проблемного ящика”.

Рис. 3.7. Челночные камеры для исследования у лабораторных крыс и мышей реакции активного избегания.

А — современная установка для изучения условной реакции активного избегания, которая обычно состоит из 4 челночных камер с автоматизированным управлением и выводом результатов на экран монитора; Б — отдельная челночная камера.

Включению тока предшествует включение УС — звука или света. Чтобы избежать болевого воздействия, животное перебегает в другую половину камеры. По прошествии небольшого периода времени (как правило, его длину варьируют, чтобы не вырабатывать у животного УР на время) ток включают в той половине камеры, куда оно перед этим перебежало. УР считается выполненным, если животное перебегает в безопасную половину камеры во время действия УС и до включения тока. Обширные исследования, выполненные сторонниками идей бихевиоризма, привели к появлению целого ряда новых терминов и понятий и созданию специфического языка для описания закономерностей процесса обучения, обнаруженных только благодаря примененным ими подходам. Многие термины сначала использовались как чисто технические — для объективного описания данных (знакомство с ними может помочь при чтении научных статей бихевиористов). К таким терминам, в частности, относятся:

оперантное поведение — спонтанные действия, не вызванные каким-либо очевидным стимулом;
реактивное поведение — всякое поведение, которое совершается в ответ на определенный стимул;
режим подкрепления (reinforcement schedule): соотношение числа реакций (например, нажатий на рычаг) и вознаграждений (например, кусочков пищи; подробнее см. ниже);
постоянный (или переменный) интервал (fixed or variable interval) —
вознаграждение дается через определенные интервалы времени, в период которых животное может осуществлять двигательные реакции (эти интервалы могут быть постоянными или варьировать по длительности), но по истечении этого интервата подкрепляется только первая реакция;
фиксированное (или переменное) соотношение (fixed ratio or variable ratio) — подкрепление дается животному только после того, как онопроизведет какое-то количество реакций (нажатий или клеваний. Можно давать подкрепление только после определенного числа реакций (фиксированное соотношение) или это число может каким-то образом варьировать (переменное соотношение);
смежность (contiguity) — этим термином обозначают постулируемое возникновение связей между стимулами и возникающими на их основе реакциями, а также совпадение УС с реакцией животного или УС с подкреплением, которое необходимо для возникновения УР;
ключ (сие) — обычно это либо рычаг, на который нажимает крыса, либо освещенный кружок, по которому наносит удар клювом голубь (этот термин, обычный для работ бихевиористов, не следует путать с термином “ключевой стимул”, принятым в этологии для обозначения видоспецифических стимулов, вызывающих инстинктивные реакции (см. 2.11).

На рис. 3.6 схематически изображена камера для выработки инструментальных УР у голубей. Скиннер считал, что любое поведение, относящееся к категории “оперантное”, можно модифицировать, если при его выполнении давать животному подкрепление. Именно такой подход он предложил как эффективный способ анализа поведения. Если для выработки классических УР необходимы сочетания условных сигналов и подкрепления, то при методике свободного оперантно-го поведения, предложенной Скиннером, экспериментатор сопровождает подкреплением выполнение животным только определенного, намеченного им действия. Например, крысу можно обучить нажимать на рычаг, если сначала сопровождать подкреплением любые ее действия в той части камеры, где он находится. Постепенно крыса обучается держаться вблизи рычага, и тогда подкрепление дают только, если она касается рычага мордой или лапой (для этого иногда на рычаг даже кладут пишу). Через некоторое время подкрепление дается только после выполнения четких движений — нажатий (одного или нескольких) лапой на рычаг. Такое постепенное видоизменение поведения животного в результате вмешательства экспериментатора называется методом последовательного приближения или формированием (shaping) поведения. Деление условных рефлексов на классические и инструментальные, удобное методически, не означает, что они имеют совершенно разную природу. В их основе лежат сходные нейрофизиологические механизмы, а любое “чисто” инструментальное действие животного всегда сопровождается реакцией, которая относится к классическим УР. И наоборот, в любом “чисто” классическом УР можно обнаружить двигательный компонент, который по своим свойствам относится к инструментальным (Борукаев, 1982). О связи классических и инструментальных УР свидетельствует также “самоформирование” условной реакции {autoshaping). Например, если голодного голубя поместить в камеру Скиннера и в течение 5 с освещать ключ для клевания с интервалом в 1 мин, а после прекращения освещения давать порцию пиши, то голубь сначала не обращает внимания на ключ. Однако после нескольких таких сеансов формируется инструментальная реакция, и он быстро начинает клевать ключ независимо от освещения. Постепенно голубь научается клевать ключ только при его освещении, т.е. реакция становится более точной — она самоформируется. В данном случае она очень близка к классическому УР, поскольку голубь клюет ключ как бы вместо зерна, даже в отсутствие подкрепления.

С помощью метода “последовательного приближения” у животных удается сформировать не только клевание ключа при его освещении, но и самые разнообразные, сложные и иногда неожиданные навыки. В опытах Скиннера голуби “играли” в пинг-понг, а крысы могли подтянуть к себе с помощью бечевки бильярдный шар, взять его в передние лапы и засунуть в трубку, расположенную на 5 см выше пола клетки (описание экспериментов П. Эпштейна, посвященных формированию сложных навыков у голубей, будет дано в гл. 4.8.2). Метод последовательного приближения составляет основу дрессировки цирковых и служебных животных. Примером продуктивного использования принципов бихевиоризма, и в частности роли метода последовательного приближения в формировании поведения, является работа знаменитой американской дрессировщицы дельфинов и психолога К. Прайор(1995). Тезис Скиннера о том, что любые движения, на которые способно животное данного вида, равновероятно можно использовать для инструментального научения, был достаточно обоснованно подвергнут сомнению в работе его коллег - К. и М. Бреландов (Breland, Breland, 1961). Некоторые виды животных при обучении манипуляциям с предметами производят “заданные” экспериментатором действия только после выполнения некоторых врожденных (инстинктивных) действий либо совсем не могут им научиться. Так, например, обучая енота нажимать на рычаг, Бреланды заметили, что нажатию предшествует видоспецифи-ческое движение лап — “полоскание”, характерное для этого вида при добыче пищи из ручья (за что енота и называют “полоскун”). На основании таких наблюдений возникло представление о предрасположенности к определенным видам обучения (подробнее см.: Зорина и др., 1999). Образование инструментальных УР по механизму “последовательного приближения” играет важную роль в организации поведения животных не только в эксперименте, но и в естественных условиях. Обучение по методу последовательного приближения может происходить самым неожиданным образом. Об этом, в частности, свидетельствует получившая широкую известность в начале XX века история “умного Ганса”. Это был конь, который демонстрировал способность “считать”, “складывать”, “извлекать корни”, отвечать на вопросы и т.п. (рис. 3.8). Столь “разумное” поведение объяснялось тем, что конь научился замечать малоуловимые движения дрессировщика, которые тот непроизвольно совершал, видя, что конь вот-вот даст правильный ответ. Ориентируясь на эти условные сигналы, конь в нужный момент прекращал стучать копытом.

Рис. 3.8. Инструментальные условные рефлексы у дрессированной лошади “умного Ганса”. На фотографии видно, как ударами копыта по специальной доске Ганс сигнализировал “правильный” ответ (по Н. Н. Ладыгиной-Котс, 1914). В начале XX века (1900—1904) барон В. фон Остен, убежденный в огромных умственных способностях лошадей, обучал нескольких из них различению цветов, азбуке и “счету”. Узнавание каждой буквы или цифры лошадь обозначала соответствующим числом ударов копыта. Друг фон Остена художник Редлих обучил таким же образом свою собаку. Наиболее способным учеником оказался орловский рысак Ганс, который производил достаточно сложные арифметические подсчеты, отвечал на разнообразные вопросы, а иногда высказывался по собственной инициативе. Так, супруги Н. Н. и А. Ф. Котс, специально приехавшие для знакомства с ним в 1913 году, рассказывали, что после нескольких относительно коротких ответов на вопросы Ганс заявил: “В поле я встретил милую госпожу Краль, которая меня кормила”. Поведение его было столь впечатляющим, что вводило в заблуждение не только публику, но даже членов специальных комиссий, включая Н. Н. Лады-гину-Котс. Предполагали, что хозяин подает коню некие скрытые сигналы (как дрессировщик — цирковым животным), однако его обследовали 13 экспертов (комиссия психолога К. Штумпфа) и не обнаружили никакого обмана. Они засвидетельствовали, что Ганс действительно “считает” и никаких скрытых сигналов ему не подают. И лишь много позднее наблюдатели постепенно заметили, что Ганс отвечает только на те вопросы, ответ на которые знает сам экспериментатор. Специальный анализ, проведенный психологом О. Пфунгстом, показал, что животное реагирует на мельчайшие непроизвольные (идеомоторные) движения экспериментатора, например на отклонения корпуса на 2 мм, микродвижения бровей, мимику и т.п. Эта невольная подача сигналов происходила, по-видимому, из-за эмоционального напряжения человека, по мере того как число ударов копытом приближалось к искомому, Даже картонный щит, которым пробовал отгородиться от Ганса экспериментатор, не помогал: животное все равно улавливало какие-то только ему понятные знаки для определения правильного ответа. Для проверки своего предположения Пфунгст специально научил Ганса реагировать на микродвижения, которые он совершал уже сознательно, и продемонстрировал комиссии механизм и природу “математических способностей” этой лошади.

История “умного Ганса” оставила заметный след в развитии науки о поведении животных:

она показала, сколь сложное поведение могло быть результатом обучения методом проб и ошибок;
продемонстрировала справедливость “канона Ллойда Моргана” (см. 2.3) и актуальность его применения, поскольку в основе поведения этой “мыслящей лошади” лежали чисто условнореф-лекторные, а не связанные с мышлением механизмы;
впервые привлекла внимание к проблеме чистоты эксперимента с точки зрения возможности неосознанного влияния экспериментатора на его результаты;
заставила по-новому взглянуть на возможности восприятия животных: способность уловить едва заметные движения человека свидетельствовала об их большой наблюдательности и способности концентрировать внимание.

Необихевиоризм Б.Ф. Скиннера. Беррес Фредерик Скиннер (1904 - 1990) – один из крупнейших представителей бихевиорального направления, по мнению многих американских исследователей науки – один из самых уважаемых психологов XX века. Его работы заложили основы американской науки о поведении. Вслед за Уотсоном, Скиннер считал, что наука о поведении человека не отличается принципиально от других естественных наук, построенных на фактах. У таких наук общая цель – предсказать и проконтролировать изучаемое явление (в данном случае – поведение человека). Вторым принципиальным положением, легшим в основу скиннеровского подхода, стало утверждение о том, принципы поведения организмов, стоящих на более низких ступенях развития, аналогичны таковым принципам поведения организмов, стоящих на более высоких ступенях развития. Собственно, здесь также имело место развитие традиций Торндайка и Уотсона – данные, полученные в экспериментах на цыплятах и кроликах, экстраполировались на поведение человека. Поскольку поведение всех организмов подчиняется одним и тем же законам, особое значение придается анализу поведения единичных организмов. Скиннер считал, что вместо того, чтобы делать предположения о поведении несуществующего усредненного человека, психологи должны научиться предсказывать влияние отдельных переменных на компоненты поведения отдельного организма. Такой подход не требует применения традиционных статистических методик; он требует знания законов поведения реального индивида. Основным законом, лежащим в основе бихевиоральной теории поведения, считал Скиннер, является закон причинно-следственных отношений между условиями окружающей среды (стимулами) и открытым поведением (реакцией) организма. Практической целью этой науки является возможность манипулирования переменными окружающей среды с целью изменения поведенческой реакции организма. Одним из главных научных достижений Скиннера стала его концепция оперантного поведения. Рассмотрим ее основные положения.

Люди (да и животные) в реальной жизни редко действуют согласно классической схеме S – R. Подобное поведение Скиннер называет респондентным (от англ. respond – отвечать, реагировать), или обусловливанием типа С (стимульным). Скиннер считал, что гораздо чаще организм активно воздействует на свое окружение, с целью добиться желаемого положения вещей. Такой тип поведения Скиннер называл оперантным. Оперантное поведение определяется событиями, которые следуют за реакцией организма (обусловливание типа Р). То есть, последствия поведения изменяют тенденцию организма повторять данное поведение в будущем. Если последствия благоприятны для организма, то вероятность повторения данного поведения в будущем увеличивается. В этом случае говорят, что произошло подкрепление реакции. Напротив, если последствия реакции неблагоприятны для организма, тогда вероятность появления данного поведения в будущем уменьшается. Как видно, поведение определяется подкреплением. Этот термин пришел в бихевиоризм из работ И.П. Павлова и обозначает объекты или условия, которые удовлетворяют те или иные потребности организма и способствуют закреплению предшествующего поведения. Скорость, с которой оперантное поведение приобретается и сохраняется, зависит от режима подкрепления. Режим подкрепления – это правило, устанавливающее вероятность, с которой будет происходить подкрепление. Скиннер выделял несколько режимов подкрепления.

1.
непрерывное подкрепление предполагает появление подкрепления каждый раз, когда организм демонстрирует желаемую реакцию. Такой режим способствует быстрому закреплению желаемой реакции в поведении; однако, он часто неосуществим или неэкономичен.

2.
режим прерывистого подкрепления может представлять более реальную альтернативу режиму непрерывного подкрепления. Выделяют несколько видов прерывистого подкрепления.

Режим подкрепления с постоянным соотношением. Организм подкрепляется после совершения заранее определенного числа желаемых реакций. Данный режим позволяет также быстро закрепить в поведении желаемую реакцию, а также добиться высокой частоты ее проявления.
Режим подкрепления с постоянным интервалом. Организм подкрепляется через заранее установленные временные интервалы. В реальной жизни примерами использования такого режима подкрепления является регулярная выплата зарплаты в учреждениях, регулярные проверки академической успеваемости студентов (сессии). Для данного режима характерна низкая частота появления желаемой реакции срезу после подкрепления.
Режим подкрепления с вариативным соотношением. Организм подкрепляется после совершения варьирующего вокруг определенного среднего числа реакций. Режим обеспечивает медленное закрепление в поведении желаемой реакции, но также и медленное его угасание в случае отсутствия подкрепления.
Режим подкрепления с вариативным интервалом. Организм подкрепляется через неопределенный временной интервал. Частота появления желаемой реакции в этом случае зависит от длины интервала: частое подкрепление порождает частое реагирование, а редкое подкрепление – редкое реагирование. Как и в предыдущем случае, сформированная в таком режиме подкрепления реакция угасает медленно в случае отсутствия подкрепления.

Изучая возможности научения и контроля за поведением человека, Скиннер обращал особое внимание на различные типы подкрепления и их сравнительную эффективность. С точки зрения способности удовлетворять биологические потребности организма, он выделял два вида подкрепления – первичное и вторичное. Первичное подкрепление – это любое событие или объект, само по себе способное удовлетворять потребности организма. Его ценностное значение абсолютно и не зависит от научения. Вторичное (условное) подкрепление – это событие или объект, которые приобрели способность подкреплять поведение организма в результате тесной ассоциации с первичным подкреплением.
В жизни современного человека условное подкрепление является основным видом подкрепления при научении социальному поведению и контроле за ним. Наиболее яркий пример такого условного подкрепления – это деньги. Сами по себе деньги не могут удовлетворить ни одну биологическую потребность; но, ассоциируясь с тем, что на них можно приобрести (еда, питье, физический комфорт), они становятся значительной подкрепляющей поведение силой. Обратите внимание на тот факт, что деньги ассоциируются более чем с одним первичным подкреплением. Это явление называется генерализацией условного подкрепления. Другие виды генерализованных условных подкреплений – это внимание, похвала, подчинение себе других и социальное одобрение.
Изучая возможности контролировать поведение людей в социуме, Скиннер попытался определить сравнительную эффективность подкрепления и наказания. Изначально наказание рассматривалось как противоположность подкреплению, как предъявление аверсивного (неприятного или болевого) стимула в ответ на определенную оперантную реакцию. Цель наказания – побудить организм не повторять данную реакцию. Позднее Скиннер расширил свою концепцию наказания, включив в нее позитивное и негативное наказание. Позитивное наказание происходит тогда, когда поведение приводит к появлению аверсивного стимула. Негативное наказание имеет место тогда, когда поведение приводит к устранению (возможного) позитивного стимула. По аналогии с наказанием, подкрепление также может быть позитивным (предъявление положительно стимула) и негативным (удаление аверсивного стимула).
Скиннер считал, что все формы контроля за поведением, использующие аверсивные стимулы, неэффективны и поэтому нежелательны в обществе. Особенно неэффективным средством контроля он считал наказание. Причина в том, что из-за своей угрожающей природы наказание может вызывать нежелательные эмоциональные и социальные побочные эффекты. Более того, наказанный человек предположительно знает, что делать нельзя, но может не знать, какое поведение является желательным. Неэффективность современной пеницитарной системы Скиннер связывал именно с тем, что в ней используются неэффективные методы контроля за поведением осужденных.

6. Предмет, задачи и основные понятия и парадигмы когнитивного необихевиоризма Э. Толмена

Основы необихевиоризма заложил Э.Толмен (1886-1959): поведение – это целостный акт, который характеризуется собственными свойствами: направленностью на цель, понятливостью, пластичностью, селективностью, выражающейся в готовности выбирать средства, ведущие к цели более короткими путями. Он признавал совместимость бихевиоризма с гештальтпсихологией и глубинной психологией. Толмен выделял 3 разновидности детерминант поведения: независимые переменные (первоначальные причины поведения) стимулы и исходное физиологическое состояние организма; способности – видовые свойства организма; вмешивающиеся внутренние переменные – намерения и познавательные процессы. Когнитивная карта – структура, которая складывается в мозгу животного в результате переработки поступающих извне воздействий.

Классическое обуславливание – выработка условного рефлекса. С помощью сопровождения В оперантном научении, в отличие от классического обуславливания, мы выращиваем активное животное, активность которого мы лишь направляем в нужное русло подкреплениями. Допустим, нам нужно научить животное проходить по тонкой жердочке. Мы подкрепляем его «успехи» - когда он подходит к жердочке, забирается на нее, начинает идти. За повторные успехи уже не так награждаем, то есть повышаем критерий задания. То есть прошло наше жердочку до конца, мы его подкормили, больше не подкрепляем, когда оно успешно забирается на жердочку, только когда доходит до конца. Мы можем подкреплять не всегда – животное все равно будет выполнять действие (вариативный режим подкрепления). Вариативный режим подкрепления действует, когда поведение уже сформировано, надобность в постоянно стимулировании отпадает, достаточно периодически подкреплять животное. Возможность вариативного режима подкрепления - одна из причин появления суеверий и предрассудков у людей.

⇐ Предыдущая 12 13 14 15 161718 19 20 21 Следующая ⇒

© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.