Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Д. Райсберг






[ПОНИМАНИЕ РЕЧИ]1

Каким образом нам вообще удается понимать речь, которую мы слышим, или предложения, которые мы читаем? Как мы проникаем за поверхностные рамки, чтобы воссоздать скрытую структуру каждого предложения? Трудность здесь в некоторых отношениях напоминает про­блему константности зрительного восприятия, с которой мы столкнулись при обсуждении зрительного восприятия <...>: наблюдатель должен оп­ределить подлинный размер объекта, если ему дан его образ на сетчат­ке. Последний образ изменяется всякий раз, когда меняется расстояние или угол между наблюдателем и целевым объектом. Тем не менее, на­блюдатель может воспринимать фактические размеры и форму объекта, так как у него есть ряд подсказок, информирующих его о периферичес­ком стимуле. Учитывая эти подсказки, наблюдатель может реконструи­ровать фактический размер и форму объекта.

Нечто подобное происходит и с языком (рис. 1). Здесь слушатель дол­жен определить скрытую структуру предложения, если ему дан лингвис­тический «проксимальный стимул», т.е. поверхностная структура; здесь тоже существуют подсказки, помогающие слушателю восстановить скры­тую форму. Так, функциональные слова (например, кто, или) — хороший ключ к тому, что в предложении, которое мы слышим, содержится боль­ше чем одно утверждение2.

1 Глейтман Г., Фридлунд А.., Райсберг Д. Основы психологии. СПб.: Речь, 2001. С. 417-418, 422-425.

г См.: Kimball J. Seven principles of surface structure parsing in natural language // Cognition. 1973. 2. P. 15-47.



Тема 18. Экспериментальные исследования мышления


Рис. 1. Аналогия между лингвистическим парафразом и константностью восприятия Лингвистический парафраз в некоторых отношениях напоминает константность восприятия <...>, поскольку в обоих случаях мы интерпретируем внешне раз­личные паттерны стимуляции как приблизительно эквивалентные: А — постоян­ство формы. Когда мы смотрим на крышку стола, форма изображения, которое на самом деле попадает на сетчатку, зависит от нашего положения по отношению к столу. Однако постоянство формы позволяет нам воспринимать неизменную пря­моугольную форму, которая является источником этих изображений; Б — пара­фраз. Ухо слышит множество поверхностных предложений, но лингвистическая система интерпретирует их все как содержащие одно и то же утверждение <...>

Аппарат для анализа предложений

Как именно мы используем эти подсказки, чтобы извлечь скрытую структуру из поверхностной? Согласно работам многих психолингвистов, наш аппарат для анализа предложений (ААП) полагается на несколько довольно общих стратегий, две из которых обсуждаются ниже1.

1 Общее описание обработки и понимания предложений см. в: Frazier L., Fodor J J). The sausage machine: A new two-stage parsing model // Cognition. 1978. 6. P. 291-325; Cairns RB. Research in language comprehension // R.C. Naremore (Ed.). Language science. San Diego: College-Hill Press, 1984; Joski A.K. Natural language processing // Science. 1991. 253. P. 1242-1249; Trueswell J.C., Tanenhaus M.K. Toward a lexicalist framework of constraint-based syntactic ambiguity resolution // C.J. Clifton, L. Frazier (Eds.). Perspectives on sentence processing. Hillsdale, N. J.: Eribaum, 1994. P. 155-179.


Глейтман Г., Фридлунд А., Райсберг Д. [Понимание речи] 593

Простейший порядок предложения: действующее лицо, действие, объект действия

Несколько исследований показали, что ААП начинает работу с силь­ного предубеждения по поводу того, какого рода предложение он сейчас услышит: обычно он начинает с допущения, что предложение сначала на­зовет действующее лицо, затем — действие, а затем — объект действия. По грамматической терминологии, ААП начинает с допущения, что предло­жение будет иметь следующий порядок: субъект, глагол, объект.

Эта стратегия абсолютно разумна, так как в обычной речи актив­ная форма предложений (например, Джон побил Фреда) встречается го­раздо чаще, чем пассивная (Фред был побит Джоном). Однако пассивные предложения все же встречаются, и с ними первоначальная стратегия ААП терпит неудачу. ААП осознает свою ошибку, как только он стал­кивается с глаголом в пассиве. Обнаружив эту подсказку, он пересмат­ривает свою первоначальную догадку и определяет первое именное слово как объект действия, а не как действующее лицо.

Эти шаги — начать с одной гипотезы, а затем заменить ее другой — требуют некоторого усилия, что можно обнаружить, исследуя время ре­акции. Один исследователь просил участников слушать предложения типа «Собака преследует кошку» и «Кошка преследуется собакой». Сра­зу после этого участникам показывали одну из двух картинок: собаку, преследующую кошку (рис. 2, Б), или кошку, преследующую собаку (рис. 2, А). Их задача состояла в том, чтобы решить, соответствует ли прослу­шанное ими предложение предъявленной картинке или нет. Участники быстрее приходили к решению, когда предложение имело активную, а не пассивную форму1.



Рис. 2. Принятие решения о том, кто является действующим лицом, а кто — объектом дейст­вия. Время реакции испытуемых было значительно меньшим, если глагол в предложении, прочи­танном до предъявления кар­тинок, стоял в активной форме


1 См.: Slobin D. I. Grammatical transformations and sentence comprehension in childhood and adulthood // Journal of Verbal Learning and Verbal Behavior. 1966. 5. P. 219-227.


594 Тема 18. Экспериментальные исследования мышления

Функциональные слова, сигнализирующие о границе суждений

Учитывая множество форм предложений, с которыми мы сталки­ваемся, попытка с ходу угадать структуру предложения может показать­ся рискованной. Лучше подождать, пока не появится информация, кото­рая послужит руководством для толкования предложения. Необдуманная гипотеза о структуре предложения может легко пустить ААП по ложно­му следу. Например, поспешный грамматический разбор часто заставля­ет читателей думать, что Сев в соседней деревне — это рассказ о посев­ной; на самом деле речь идет совсем о другом, но это становится ясно лишь тогда, когда мы прочитаем все предложение {Сев в соседней дерев­не, вертолет простоял там два часа).

В действительности, однако, многие факторы помогают удерживать ААП на правильном пути. И если анализ все-таки сходит с этого пути, подсказки обычно гарантируют, что это будет быстро обнаружено и ис­правлено. Например, в предложении «Девочка, которая съела гамбургер, ударила по мячу» о границе между двумя суждениями сигнализирует функциональное слово которая. Функциональные слова играют важную роль в раскрытии структуры предложения и, следовательно, в управ­лении процессом анализа предложения.

Конечно, язык часто позволяет нам опускать эти функциональные слова в быстрой речи. В таком случае предложение можно произнести быстрее (хотя оно, в конце концов, не намного короче), но если слуша­тель полагается на эти функциональные слова, тогда их исключение сде­лает предложение немного более сложным для понимания. Так и проис­ходит: анализ предложения занимает больше времени, когда удаляется подсказка в виде функционального слова1.

Семантика и другие подсказки

ААП делает разбор предложения, обращая внимание на выявляю­щийся смысл и уделяя внимание не только функциональным словам, но и семантике, используя конкретные слова по мере их появления в каче­стве информации для раскрытия содержания предложения2.

Мы уже говорили о том, что активные формы предложения обыч­но понимаются быстрее, чем пассивные. Так, нужно больше времени, чтобы понять второе (пассивное) предложение в следующей паре, чем для того, чтобы понять первое (активное).

1 См.: Bever Т.О. The cognitive basis for linguistic structures // J.R. Hayes (Ed.). Cognition and the development of language. N. J.: Wiley, 1970. P. 279-362.

1 См.: Trueswell J., Tanenhaus M„ Garnsey S. Semantic influences on parsing // Journal of Memory and Language. 1994. 33. (3). P. 285-318.


Глейтман Г., Фридлунд А., Райсберг Д. [Понимание речи]



Рис. 3. Семантическая подсказка Для понимания пассивного предложения «Цветы поливаются де­вочкой» нужно не больше времени, чем для понимания активного предложения «Девочка поливает цветы», так как его значение, не­сомненно, будет понято так, как это изображено на рис. А, а, не Б

Спаниель укусил сенбернара. Сенбернар был укушен спаниелем.

Однако в некоторых случаях семантические подсказки берут верх над этим правилом. Так, участники исследования понимают следующие два предложения одинаково быстро:

Собака съела мясо. Мясо съедено собакой.

В этом случае нет опасности перепутать, кто что с кем сделал: со­бака может съесть мясо, но мясо не может съесть собаку. Таким обра­зом, здесь нет никакой неопределенности и слушатель понимает пассив­ное предложение так же быстро, как и активное1 (рис. 3).

Внелингвистический контекст. Мы крайне редко встречаем отдель­ное, изолированное предложение. Как правило, предложения произносят­ся и понимаются в некотором контексте. Возможно, контекст обеспечи­вается остальной частью романа или учебника по психологии, в котором появляется предложение. Чаще контекст — это происходящий разговор, в котором говорящий и слушающий беседуют в духе сотрудничества. Говорящий пытается передать ровно столько подробностей, сколько не­обходимо слушающему для понимания. Слишком большое количество подробностей сделало бы разговор безнадежно медленным и невыносимо скучным, а недостаток подробностей запутал бы слушателя. Чтобы балансировать между этими двумя проблемами краткости и ясности, го­ворящий должен согласовывать каждое высказывание с тем, что слуша­тель знает и чего он не знает2. Таким же образом слушатель знает, что

1 См.: Slobln D. I. Grammatical transformations and sentence comprehension in childhood
and adulthood // Journal of Verbal Learning and Verbal Behavior. 1966. 5. P. 219-227.

2 См.: Clark H.H. Using language. Cambridge: Cambridge University Press, 1996.



Тема 18. Экспериментальные исследования мышления


говорящий не будет проговаривать каждую посылку или каждое допуще­ние, и он понимает, что ему придется заполнять пробелы, делая обосно­ванные выводы о тех деталях, которые остались невысказанными.

Как мы относимся к этой модели разговорного сотрудничества? Одно описание было дано философом Х.П.Грайсом, который утверждал, что разговором управляет небольшое количество правил, или максим1, Одна из этих негласных максим — максима уместности — требует, что­бы партнеры по разговору говорили вещи, которые относятся к делу. Такое правило помогает нам понять следующий диалог.

Брайан: А где же ростбиф?

Фернанда: Не знаю, но у собаки весьма довольный вид.

Ответ Фернанды кажется совершенно не относящимся к заданному вопросу, но если мы принимаем максиму уместности Грайса, мы вынуж­дены искать связь между ее ответом и вопросом Брайана. Этот поиск уместности приводит к заключению, что собака могла украсть ростбиф. Другой пример касается максимы количества: партнеры в разговоре по­нимают, что они не должны говорить ни больше, ни меньше, чем это необходимо. Эта максима действует в следующем фрагменте диалога;

Т они: Как тебе понравились танцоры? Мария: Некоторые из них были очень хороши.

Здесь Мария подразумевает, что некоторые из танцоров были не хороши; мы понимаем, что «некоторые» означает «не все». Конечно, это толкование не следует логически из реплики Марии (если она думает, что все были хороши, то она могла с полным правом сказать, что некоторые были очень хороши). Тем не менее, мы делаем именно это заключение об оценке Марии, поскольку мы негласно предполагаем, что если бы она думала, что все танцоры были хороши, она бы так и сказала. В против­ном случае она нарушила бы максиму количества.

Эти максимы и общая динамика разговора позволяют говорящим оставлять многое невысказанным. Рассмотрим следующий отрывок из разговора2:

Женщина: Я ухожу от тебя. Мужчина (в гневе): Кто он?!

Мы можем легко сопроводить этот диалог мелодраматическим сце­нарием, придав большое значение богатству интерпретации, часто тре­буемому для понимания повседневного разговора3.

1 См.: Grice H.P. Logic and conversation. // P.Cole, J.L.Morgan (Eds.). Syntax and
semantics 3: Speech acts. N. Y.: Academic Press, 1975.

2 См.: Pinker S. The language instinct. N. Y.: William Morrow, 1994.

3 Дополнительное обсуждение роли слушателя или читателя в понимании связной
речи см.: Sperber D., Wilson D. Relevance: Communication and cognition. Oxford: Blackwell,
1986; Graesser A.C, Millie K.K., Zwaan RA. Discourse comprehension // Annual Review of
Psychology. 1997. 48. P. 163-189.


Дж.Р. Андерсон [РАСПОЗНАВАНИЕ РЕЧИ И ПОНИМАНИЕ ЯЗЫКА]1

Распознавание речи

Главная проблема при распознавании речи — сегментация распоз­наваемых объектов. Речь не разбита на дискретные единицы, как печат­ный текст. Хотя кажется, что между словами в речи имеются четкие промежутки, часто это лишь иллюзия. При исследовании фактического физического речевого сигнала мы часто находим не уменьшающуюся интенсивность звука в границах слова. Действительно, снижение интен­сивности речи так же вероятно в пределах слова, как и между словами, Эта особенность речи особенно заметна, когда мы слушаем, как кто-то говорит на неизвестном иностранном языке. Речь кажется непрерывным потоком звуков без очевидных границ слов. Именно знание нашего соб­ственного языка ведет к иллюзии границ слова.

В пределах отдельного слова существуют еще большие проблемы с сегментацией. Эти проблемы включают в себя идентификацию фонем. Фонемы — это основной набор звуков речи; именно с их помощью мы распознаем слова2. Фонема определяется как минимальная единица речи, которая может обусловливать различия в произнесенных сообщениях. В качестве иллюстрации рассмотрим слово bat. В этом слове есть три фо­немы: [b], [а] и [t]. При замене [b] на фонему [р], мы получим pat; заме­нив [а] на [i], мы получим bit; заменив [t] на [n], мы получим ban. Оче­видно, не всегда существует однозначное соответствие между буквами и фонемами. Например, слово one состоит из фонем [w], [а] и [n]; school

1 Андерсон Д.Р. Когнитивная психология. СПб.: Питер, 2002. С. 63-71, 371-380.

2Массаро (см.: Massaro D.W. Modeling multiple influences in speech perception // A.Dijkst, K. de Smedt (Eds.). Computational psycholingvistics: A and connectionist models of human language processing. London: Taylor and Francis, 1996. P. 85-113) предполагает, что основными перцептивными единицами являются комбинации гласных-согласных и согласных-гласных.


598 Тема 18. Экспериментальные исследования мышления

состоит из фонем [s], [k], [u] и [1]; knight состоит из [n], [i] и [t]. Именно отсутствие точного соответствия между буквами и звуками делает труд­ной английскую орфографию.

Проблема сегментации возникает, когда фонемы, образующие про­износимые слова, должны быть идентифицированы. Трудность состоит в том, что речь непрерывна и фонемы не дискретны, в отличие от букв на напечатанной странице. Сегментация на этом уровне подобна распозна­ванию написанного от руки сообщения, где одна буква переходит в дру­гую. Кроме того, разные люди по-разному произносят одни и те же фо­немы, подобно тому, как обладают разным почерком. Разница между говорящими особенно очевидна, когда человек впервые пытается пони­мать говорящего с сильным и незнакомым акцентом, например когда американец пытается понять австралийца. Но анализ речевого сигнала показывает, что даже среди говорящих с тем же самым акцентом суще­ствуют значительные вариации. Например, голоса женщин и детей обыч­но намного выше, чем голоса мужчин.

Еще одна трудность в восприятии речи включает в себя феномен, известный как коартикуляция1. Когда артикуляционный аппарат производит один звук, скажем [b] в bag, он начинает принимать форму, требующуюся для [а]. Когда он производит звук [а], он начинает прини­мать форму, требующуюся для [g]. В действительности различные фоне­мы накладываются друг на друга. Это создает дополнительные трудно­сти при сегментации фонем, и это также означает, что фактический звук, произведенный для одной фонемы, будет определен контекстом, который образуют другие фонемы.

Считается, что восприятие речи включает в себя специализирован­ные механизмы, которые выходят за рамки общих механизмов слухово­го восприятия. <...> Кроме того, есть пациенты, которые в результате поражения левой височной доли утратили способность лишь слышать речь2. Их способность обнаруживать и распознавать другие звуки не на­рушена, как и их способность говорить. Таким образом, их нарушение касается только восприятия речи. Иногда этим пациентам в некоторой степени удается распознать речь, если она очень медленная3, и это на­водит на мысль, что отчасти их проблема может заключаться в сегмен­тации речевого потока.

Распознавание речи включает в себя сегментацию фонем в непре­рывном потоке речи.

1 См.: Liberman A.M. The grammars of speech and language /7 Cognitive Psychology.
1970. 1. P. 301-323.

2 См.: Goldstein M.N. Auditory agnosia for speech («pure word deafness»): A historical
review with current implications // Brain and Language. 1974. 1. P. 195-204.

3 См.: Okada S.. Hanada M., Hattori H., Shoyama T. A case of pure word-deafness // Studio Phonologica. 1963. 3. P. 58-65.


Андерсон Д.Р. [Распознавание речи и понимание языка]



Анализ особенностей речи

В основе восприятия речи, по-видимому, лежат почти такие же процессы, как подетальный анализ и комбинация деталей при зритель­ном распознавании. Как и отдельные буквы, отдельные фонемы можно рассматривать как характеризующиеся некоторым числом особенностей. Эти особенности связаны с тем, как порождена фонема. Фонемы могут различаться по таким признакам, как «согласные—гласные», «звонкие— глухие» и по месту артикуляции1. Согласные фонемы по звучанию отли­чаются от гласных. Звонкие фонемы получаются в результате вибрации голосовых связок. Например, сравните, как вы произносите пот и дот, трупы и трубы, фон и вон. Вы можете обнаружить это различие, поме­стив пальцы на вашей гортани, когда вы произносите эти звуки. Гортань будет вибрировать при звонком согласном.

Местом артикуляции называется место, в котором речевой канал закрыт или сжат при произнесении фонемы. (Он закрыт в определенной точке при произнесении большинства согласных.) Например, звуки [п] и [м] относятся к билабиальным, так как при их произнесении губы зак­рыты. Фонемы [ф] и [в] считаются лабио-дентальными, так как при их произнесении нижняя губа прижата к передним зубам. Фонемы [т], [д], [н], [л] и [р] — альвеолярными, потому что язык прижат к альвеолам. Фонемы [к] и [г] — задненёбные, потому что язык прижат к мягкому нёбу, или нёбной занавеске в задней части нёба.

Рассмотрим фонемы [п], [б], [т] и [д]. Все четыре — согласные, од­нако различаются по звучанию и месту артикуляции. В табл. 1 эти че­тыре согласных звука классифицированы в соответствии с этими двумя особенностями.

Классификация звуков [б], [п], [д] и [т] по звонкости—глухости и месту артикуляции

 

Таблица 1

 

Существует немало доказательств роли таких особенностей в воспри­ятии речи. Например, Миллер и Найсли2 предлагали испытуемым по­пытаться на фоне шума опознать такие согласные, как [б], [д], [п] и [т]. На самом деле испытуемым предъявлялись звуки [ба], [да], [па] и [та]. Ис­пытуемые оказывались сбитыми с толку, полагая, что они слышали один

1 См.: Chomsky N.. Halle M. The sound pattern of English. N. Y.: Harper, 1968.

2 См.: Miller GA„ Nicely P. An analysis of perceptual confusions among some English
consonants // Journal of the Acoustical Society of America. 1956. 27. P. 338-352.



Тема 18. Экспериментальные исследования мышления


звук, когда в действительности предъявлялся другой. Экспериментаторов интересовало, какие звуки будут путать между собой испытуемые. Каза­лось вероятным, что испытуемые будут наиболее часто путать согласные, которые различались между собой только единственной особенностью, и это предположение подтвердилось. Например, когда предъявлялся звук [п], испытуемые чаще полагали, что они слышат [т], чем что они слышат [д]. Фонема [т] отличается от [п] только местом артикуляции, тогда как [д] отличается и местом артикуляции, и звучанием. Точно так же испы­туемые, которым предъявлялся звук [б], чаще полагали, что они слышат [п], чем что они слышат [т].

Этот эксперимент — ранняя демонстрация типа логики, которую мы наблюдали в исследовании распознавания буквы, проведенном Кин-ни, Марсеттой и Шоуменом1. Когда испытуемый может идентифициро­вать только набор особенностей, лежащих в основе паттерна (в этом слу­чае паттерном является фонема), ответы испытуемого будут отражать смешение фонем, имеющих один и тот же набор особенностей.

Фонемы распознаются в терминах особенностей, характеризующих их произнесение, таких как место артикуляции и звучание.

Категорическое восприятие

Особенности фонем связаны с тем, как они произносятся. Каковы свойства акустического стимула, который кодирует эти особенности про­изношения? Эта проблема была особенно хорошо изучена относительно звучания. При произнесении таких согласных, как [б] и [п], происходят две вещи: сомкнутые губы открываются, выпуская воздух, и голосовые связки начинают вибрировать (звучать). В случае звонкого согласного звука [б] выпуск воздуха и вибрация голосовых связок происходят по­чти одновременно. В случае глухого согласного звука [п] выпуск возду­ха происходит на 60 мс раньше, чем начинается вибрация. При воспри­ятии звонкого согласного по сравнению с глухим мы воспринимаем при­сутствие или отсутствие 60-миллисекундного интервала между выпуском воздуха и звучанием. Этот период времени называется временем начала звучания. Различия между звуками [п] и [б] показаны на рис. 1. Подоб­ные различия существуют и в других парах звонких—глухих согласных, таких как [д] и [т]. Итак, на восприятие фонем влияет задержка между моментом выпуска воздуха и началом вибрации голосовых связок.

Лискер и Абрамсон2 провели эксперименты с искусственными (ге­нерируемыми компьютером) стимулами, в которых задержка между вы-

1 См.: Kinney G.C, Marsetta M„ Showman D.J. Studies in display symbol legibility, part
XXI. The legibility of alphanumeric symbols for digitized television (BSD-TK-66-117). Bedford,
MA: The Mitre Corporation, 1966.

2 См.: Llsker L., Abramson A. The voicing dimension: Some experiments in comparative
phonetics // Proceedings of Sixth International Congress of Phonetic Sciences, Prague, 1967.
Prague: Academia, 1970.


Андерсон Д.Р. [Распознавание речи и понимание языка] 601

Рис. 2. Процент идентификации звука [б] по сравнению со звуком [п]

как функция времени начала звучания голоса. Резкое изменение этих

функций происходит приблизительно за 25 мс2

пуском воздуха и звучанием варьировала от -150 мс (звучание за 150 мс до выпуска воздуха) до +150 мс (звучание через 150 мс после выпуска воздуха). Задача состояла в том, чтобы выделить, какие звуки были зву­ком [б], а какие — звуком [и]. На рис. 2 представлен график, на кото­ром в процентах указано количество случаев идентификации звуков [б] и [п]. На большей части континуума испытуемые в 100% случаев сходи­лись во взглядах на то, что они слышали, но имеется резкое изменение ответов от [б] к [п] приблизительно за 25 мс. При времени начала звуча-

1 См.: Clark ИМ., Clark E.V. Psychology and language. N. У.: Harcourt Brace Jovanovich,
1977.

2 См.: Llsker L, Abramson A. The voicing dimension: Some experiments in comparative
phonetics // Proceedings of Sixth International Congress of Phonetic Sciences, Prague, 1967.
Prague: Academia, 1970.


602 Тема 18. Экспериментальные исследования мышления

ния в 10 мс испытуемые почти единодушно соглашаются с тем, что предъявляется звук [б]; при времени начала звучания в 40 мс испытуе­мые почти единодушно соглашаются с тем, что предъявляется звук [п]. Из-за этой четкой границы между звонкой и глухой фонемами восприя­тие этой особенности называется категорическим. Категорическое вос­приятие — это восприятие стимулов как принадлежащих к разным ка­тегориям и неспособность воспринимать градации между стимулами в пределах одной категории.

Другое доказательство категорического восприятия речи получено в исследованиях установления различий1. Испытуемые очень плохо ус­танавливают различия между парой звуков [б] или парой звуков [п], которые отличаются по времени начала звучания. Но они хорошо разли­чают пары, имеющие то же самое различие во времени начала звучания, но где один звук идентифицирован как [б], а другой — как [п]. По-види­мому, испытуемые могут идентифицировать только фонематическую ка­тегорию звука и не способны делать акустическое различение в пределах этой фонематической категории. Таким образом, испытуемые способны различать между собой два звука, только если они находятся по разные стороны фонематической границы.

Существуют по крайней мере две точки зрения по вопросу о том, что именно имеется в виду под категорическим восприятием. Более сла­бая точка зрения состоит в том, что мы оцениваем стимулы как относя­щиеся к различным категориям. Кажется, нет сомнений в том, что вос­приятие фонем в этом смысле категорическое. Более сильная точка зре­ния состоит в том, что мы не можем устанавливать различие между стимулами в пределах одной категории. Массаро2 выступил против этой точки зрения и доказал, что имеется некоторая резидуальная способность устанавливать различия в пределах категорий. Он также доказал, что плохое установление различий в пределах категории может отражать склонность испытуемых говорить, что стимулы в пределах категории одинаковы, даже когда имеются заметные различия.

Другое направление исследований, представляющих доказательства использования особенностей звучания в распознавании речи, включает в себя парадигму адаптации. Эймас и Корбит3 предлагали испытуемым слу­шать повторные предъявления звука [да]. Этот звук включает в себя звон­кий согласный [д]. По мысли экспериментаторов, это постоянное повторе­ние звонкого согласного могло бы утомить, или адаптировать, детектор

1 См.: Studdert-Kennedy M. Speech perception // N.J. Lass (Ed..). Contemporary issues
in experimental phonetics. Springfield, IL: Charles C. Thomas, 1976.

2 См.: Maasaro D.W. Broadening the domain of the fuzzy logical mode! of perception //
H.L. Pick, Jr., P. Van den Broek, D.C. Knill (Eds.). Cognition: Conceptual and methodological
issues. Washington, DC: American Psychological Association, 1992. P. 51-84.

3 См.: Eimas P.D., Corbit J. Selective adaptation of linguistic feature detectors // Cognitive
Psychology. 1973. 4. P. 99-109.


Андерсон Д.Р. [Распознавание речи и понимание языка] 603

этой особенности, который отвечал на присутствие звучания. Затем они предъявили испытуемым последовательности искусственных звуков, кото­рые располагались вдоль акустического континуума, — типа находящих­ся между [ба] и [па] (как в упоминавшемся выше исследовании Ликерта и Абрамсона). Испытуемые должны были указать, звучит ли каждый из этих искусственных стимулов скорее как звук [ба] или как звук [па]. (Вспомните, что единственная особенность, по которой различаются меж­ду собой звуки [ба] и [па], — это звучание.) Эймас и Корбит обнаружили, что некоторые из искусственных стимулов, которые испытуемые обычно называли звонким [ба], они теперь назвали глухим [па]. Таким образом, повторное предъявление звука [да] утомило детектор особенности «звон­кий» и подняло порог для обнаружения звучания в [ба], приводя к тому, что для испытуемых многие прежние стимулы [ба] звучали как [па].

Люди склонны воспринимать фонемы как относящиеся к определен­ным категориям, даже когда они отличаются по одному непрерывному измерению.

Контекст и распознавание паттернов

До сих пор мы рассматривали распознавание паттерна так, как буд­то единственной информацией, доступной системе распознавания паттер­на, была информация, содержащаяся в распознаваемом физическом сти­муле. Но дело обстоит не так. Объекты существуют в контексте, и мы можем использовать эти контексты, чтобы облегчить распознавание объекта. Рассмотрим пример на рис. 3. Мы воспринимаем эти символы как THE и CAT даже при том, что символы, обозначающие А и Н, иден­тичны. Общий контекст, заданный словами, вынуждает давать соответ­ствующую интерпретацию. Когда контекст или общее знание о мире на­правляет восприятие, мы называем это обработкой по принципу сверхувниз, потому что общее знание высшего уровня влияет на интерпретацию перцептивных единиц низшего уровня. Общая проблема в восприятии касается того, как такие нисходящие влияния объединяются с информа­цией, идущей снизу—вверх от стимула.

Одно важное направление исследования нисходящих влияний берет начало от ряда экспериментов на идентификацию букв, проведенных Рейчером и Уилером2. Испытуемым на очень краткий промежуток вре­мени предъявляли букву (например, D) или слово (например, WORD).

1 См.: Reicher G. Perceptual recognition as a function of meaningfulness of stimulus
material // Journal of Experimental Psychology. 1969. 81. P. 275-280.

2 См.: Wheeler D.D. Processes in word recognition // Cognitive Psychology. 1970. 1.
P. 59-86.



Тема 18. Экспериментальные исследования мышления


 
 


Сразу после этого им давали пару вариантов ответа и инструкцию со­общить, который вариант они видели. (Первоначальное предъявление было достаточно кратковременным, чтобы испытуемые делали много ошибок в этой задаче на идентификацию.) Если им показывали букву D, то могли дать в качестве альтернатив буквы D и К. Если им показывали слово WORD, то могли дать в качестве альтернатив слова WORD и WORK. Обратите внимание, что эти два слова отличаются только на одну букву — D или К. Испытуемые были приблизительно на 10% более точ­ны при предъявлении слов. Таким образом, они более точно устанавли­вали различие между буквами D и К в контексте слова, чем когда это были одиночные буквы, даже при том, что в некотором смысле в контек­сте слова они должны были обрабатывать в четыре раза больше букв. Это явление известно как эффект схватывания слова.

Румельхарт и Сипл1 и Томпсон и Массаро2 объяснили, почему испы­туемые более точны, когда имеют дело со словом. Предположим, что ис­пытуемые способны идентифицировать первые три буквы как WOR. Те­перь рассмотрим, сколько слов с четырьмя буквами совместимы с началом WOR: WORD (слово), WORK (работа), WORM (червь), WORN (одеваться), WORT (трава). Предположим, что испытуемые обнаруживают только кри­вую линию в основании четвертой буквы. В контексте начала WOR они знают, что стимул должен быть словом WORD. Но когда буква предъяв­ляется одна и испытуемые обнаруживают кривую, они не будут знать, была ли это буква В, D, С, О или Q, так как в каждой из этих букв есть такая кривая. Таким образом, в контексте начала WOR испытуемые долж­ны только обнаружить кривую, чтобы идентифицировать четвертую букву как D, но когда буква предъявляется одна, они должны обнаружить боль­шее количество особенностей, чтобы быть способными однозначно иденти­фицировать букву. Обратите внимание, что этот анализ подразумевает, что восприятие — это процесс, в значительной степени основанный на выведе­нии заключения. При этом испытуемый не видит, что D лучше в контек­сте WOR; скорее, испытуемый приходит к выводу, что D — четвертая бук­ва. Но испытуемый не осознает этих выводов; скорее, испытуемого просят делать неосознанные выводы в процессе восприятия. Обратите внимание,

1 См.: Rumelhart D.E., Slple P. Process of recognizing taohistoscopically presented words
// Psychological Review. 1974. 81. P. 99-118.

2 См.: Thompson M.C., Massaro D.W. Visual information and redundancy in reading //
Journal of Experimental Psychology. 1973. 98. P. 49-54.


Андерсон Д.Р. [Распознавание речи и понимание языка]



что испытуемый в этом примере не осознает тот факт, что кривая в осно­вании буквы была обнаружена, иначе имелась бы возможность выбрать между D и К. Скорее, испытуемый осознает только слово или букву, кото­рую логически вывела перцептивная система,

Этот пример иллюстрирует избыточность многих сложных стимулов типа слов. Эти стимулы имеют намного больше особенностей, чем требует­ся, чтобы отличить один стимул от другого. Таким образом, восприятие может протекать успешно, когда распознаны лишь некоторые из особенно­стей, а информация об оставшихся особенностях получена из контекста. В языке эта избыточность существует на многих уровнях помимо уровня осо­бенностей. Например, существует избыточность на уровне букв. Мы не должны воспринимать каждую букву в последовательности слов, чтобы прочитать ее. Длх илхюсхрахии хтохо я хогх захенхть хажхую хрехью хукху пхедхожхних на «х», х вы хем хе мехее хмохетх егх прхчихатх — хохя и хспхтыхая хекхтохые хатхудхенхя1.

Контекст слова может быть использован для получения информа­ции о дополнительных особенностях при распознавании букв.

Контекст и речь

Существуют такие же хорошие доказательства роли контекста в восприятии речи. Хорошей иллюстрацией является эффект восстанов­ления фонемы, продемонстрированный в эксперименте, проведенном Уор­реном2. Он предлагал испытуемым прослушать предложение: The state governors met with their respective legislatures convening in the capital city («Губернаторы встретились с законодательными органами свои штатов, собравшимися в столице»), — заменив на 120 же среднюю s в слове legislatures на чистый тон. Но только один из двадцати испытуемых со­общил, что слышал чистый тон, и этот испытуемый не мог правильно оп­ределить его местонахождение.

Интересным продолжением этого первого исследования был экспе­римент Уоррена и Уоррена3. Они предъявляли испытуемым предложения, подобные следующим:

It was found that the *eel was on the axle.

It was found that the *eel was on the shoe. It was found that the *eel was on the orange.

It was found that the *eel was on the table.

1 См.: Lindsay P.H., Norman DA. Human information processing. N. Y.: Academic
Press, 1977. (Пример адаптирован.)

2 См.: Warren R.M. Perceptual restorations of missing speech sounds // Science. 1970.
767. P. 392^393.

3 См.: Warren R.M., Warren R.P. Auditory illusions and confusions // Scientific American.
1970. 223. P. 30-36.


606 Тема 18. Экспериментальные исследования мышления

В каждом случае * обозначает фонему, замененную неречевым зву­ком. Для этих четырех предложений испытуемые сообщали, что слыша­ли слова wheel, heel, peel и meal в зависимости от контекста1. Важно отметить, что эти предложения идентичны вплоть до критического сло­ва. Идентификация критического слова определена тем, что происходит после него. Таким образом, идентификация слов часто не происходит мгновенно, а может зависеть от восприятия последующих слов.

При распознавании речи контекстная информация может дополнять информацию об особенностях речи.

Контекст и распознавание лиц и картин

Пока наше обсуждение сосредоточивалось на роли контекста в вос­приятии напечатанного и выраженного словами материала. Когда мы об­рабатываем другие сложные паттерны, такие как лица, очевидно, имеет место то же самое взаимодействие между особенностями стимула и контек­стом, которое отмечается в случае с языковыми стимулами. Рассмотрим рис. 4, который взят из книги Палмера2. Он указывает, что в контексте лица требуется очень немного информации об особенностях стимула для распознавания отдельных частей, таких как нос, глаз, ухо или губы. На-

Рис. 4. Лицевые особенности в контексте лица и вне его. В контексте лица необ­ходима минимальная информация, но те же самые минимальные особенности нелегко распознать в ряду А. Нужно обеспечить более сложную внутреннюю струк­туру особенностей, чтобы сделать возможным распознавание, как в ряду Б

1 С этими словами предложения переводятся на русский язык следующим образом:
«Было обнаружено, что колесо на оси», «Было обнаружено, что каблук на туфле», «Было
обнаружено, что кожица на апельсине», «Было обнаружено, что еда на столе». {Примеча­
ние переводчика источника.)

2 См.: Palmer S.E. The effects of contextual scenes on the identification of objects /'/
Memory & Cognition. 1975. 3. P. 519-526.


Андерсон Д.Р. [Распознавание речи и понимание языка] 607

против, когда эти части представлены изолированно, требуется значитель­но больше деталей, чтобы сделать возможным их распознавание. <...>

Контекстная информация может использоваться, чтобы дополнять информацию об особенностях при распознавании лиц и картин. <...>

Понимание языка

Обсуждая вопрос понимания языка, мы рассмотрим понимание в процессе как слушания, так и чтения. Часто полагают, что процесс слу­шания является более фундаментальным. Но и при слушании, и при чтении задействованы многие общие факторы. Выбор материала иссле­дования — письменного или устного — определяется с учетом удобства манипулирования им в ходе эксперимента. Это означает, что в большин­стве случаев исследовался письменный материал.

Выделяют три стадии понимания. Первая стадия включает в себя процесс восприятия, с помощью которого первоначально кодируется аку­стическое или письменное сообщение. Вторая называется стадией синтак­сического анализа. Синтаксический анализ — это процесс, при котором слова в сообщении преобразуются в ментальную репрезентацию совмест­ного значения слов. Третья стадия — это стадия использования, в кото­рой адресат фактически использует ментальную репрезентацию значения предложения. Если предложение является утвердительным, то слушате­ли просто сохраняют значение в памяти; если это вопросительное пред­ложение, то они дают ответ; если это повеление, то они подчиняются. Но слушатели не всегда столь уступчивы. Они могут использовать утверж­дение о погоде, чтобы сделать вывод о личности собеседника, они также могут отвечать вопросом на вопрос или же делать диаметрально проти­воположное тому, о чем просит собеседник. Эти три стадии — восприя­тие, синтаксический анализ и использование — следуют друг за другом при необходимости; но они могут и частично накладываться друг на дру­га. В то время как слушатели воспринимают вторую часть предложения, они уже делают вывод о первой его части. <...>

Синтаксический анализ Компонентная структура

Структура языка определяется набором правил, которые позволяют перейти от отдельного ряда слов к интерпретации значения этого ряда. Например, в английском языке мы знаем, что, если мы слышим последо­вательность «существительное — действие — существительное», говоря-


608 Тема 18. Экспериментальные исследования мышления

щии имеет в виду, что инстанция первого существительного выполнила действие над инстанцией второго существительного. И наоборот, если предложение имеет последовательность «на существительное подействова­ло существительное», говорящий имеет в виду, что инстанция второго существительного выполнила действие над инстанцией первого суще­ствительного. Таким образом, знание синтаксической структуры английс­кого языка позволяет нам видеть различие между предложениями: «Врач застрелил адвоката» и «Врач был застрелен адвокатом».

Обучаясь понимать язык, человек усваивает множество правил, ко­торые кодируют различные лингвистические паттерны в языке и соотно­сят эти паттерны с интерпретацией значений. Но невозможно выучить правила для каждого паттерна предложения, так как предложения быва­ют длинными и сложными. Потребовалось бы значительное (вероятно, бес­конечное) число паттернов, чтобы закодировать все возможные формы предложения. Хотя мы еще не научились интерпретировать все возможные паттерны целого предложения, но мы уже можем интерпретировать суб­паттерны, т.е. словосочетания в этих предложениях, и объединять, или связывать, интерпретации этих субпаттернов. Эти субпаттерны соответст­вуют основным фразам, или модулям, в структуре предложения. Эти фра­зовые модули иначе называются компонентами. [Ранее] мы обсуждали данные, подтверждающие психологическую реальность структуры фразы при генерировании языка. Ниже мы рассмотрим несколько свидетельств психологической реальности использования компонентной структуры при понимании.

Казалось бы, чем более опознаваема компонентная структура пред­ложения, тем легче данное предложение для понимания. Граф и Торри1 предъявляли испытуемым предложения, разбив их на отдельные строки. Эти отрывки могли быть представлены как в форме А, в которой каж­дая линия соответствует границе основного компонента, так и в форме Б, в которой применена другая последовательность. Ниже приведены примеры двух типов отрывков.

Испытуемые лучше понимали отрывки из формы А. Это указывает на то, что выявление компонентной структуры важно для синтаксичес­кого анализа предложения.

Форма А Форма Б

В течение Второй мировой войны даже В течение Второй мировой войны даже

фантастические схемы принимались во фантастические схемы принимались во

внимание если казалось, что они помогут внимание, если казалось, что они

в прекращении конфликта. помогут в прекращении конфликта.

1 См.: Graf P., Torrey J.W. Perception of phrase structure in written language // American Psychological Association Convention Proceedings. 1966. P. 83-88.


Андерсон Д.Р. [Распознавание речи и понимание языка] 609



Рис. 5. Время пословного чтения предложения. Черточки на графике обозначают границы между фразовыми структурами1

Когда люди читают подобные отрывки, они машинально делают паузу на границах между смысловыми группами. Ааронсон и Скарборо2 предложили испытуемым прочитать слово за словом предложение, пока­занное на экране компьютера. Когда испытуемые хотели прочитать но­вое слово, они должны были нажать клавишу. На рис. 5 показан паттерн времени чтения предложения с целью последующего воспроизведения. Обратите внимание на V-образные паттерны с длительными паузами на границах фраз. По-видимому, после прочтения каждой главной фразы участникам требуется время, чтобы обработать информацию.

Когда человек обработал компонент или фразу, уже нет необходи­мости ссылаться на конкретные слова в данном компоненте. Это связано с тем, что такие компоненты являются естественными смысловыми еди­ницами, а интерпретация слов может завершиться ближе к границе ком­понента. Таким образом, мы можем прогнозировать, что испытуемые будут хуже запоминать точную словесную форму выражения компонен­та после завершения синтаксического анализа одного компонента и на­чала анализа другого. Эксперимент Джарвеллы3 подтверждает это пред­положение. Он читал участникам отрывки, которые прерывал в разных местах. В паузах испытуемых просили записать прочитанный отрывок как можно полнее. Интерес представляли отрывки, заканчивавшиеся предложениями, в составе которых было 13 слов. Вот пример такого предложения.

1 См.: Aaronson D., Scarborough H.S. Performance theories for sentence coding: Some
quantitative models // Journal of Verbal Learning and Verbal Behavior. 1977. 16. P. 277-
304.

2 См.: Aaronson D., Scarborough H.S. Performance theories for sentence coding: Some quan­
titative models // Journal of Verbal Learning and Verbal Behavior. 1977. 16. P. 277-304.

3 См.: Jarvella R.J. Syntactic processing of connected speech // Journal of Verbal Learning
and Verbal Behavior. 1971. 10. P. 409-416.

39 3iiK. 1949


610 Тема 18. Экспериментальные исследования мышления


12 3 4 5 6

Having failed to disprove the charges,

? 8 9 10 11 12 13

Taylor was later fired by the president.

(Поскольку Тейлор не смог опровергнуть обвинений, позднее он был уволен президентом.)

Сразу после завершения чтения участникам напоминали первое слово предложения и просили восстановить остальные слова. Каждое предложение состояло из придаточного предложения из 6 слов, за кото­рым следовало главное предложение из 7 слов. На рис. 6 показан гра­фик вероятности вспоминания каждого из 12 слов в предложении (исклю­чая первое слово, которое использовалось как подсказка). Обратите вни­мание на резкий подъем функции на 7 слове, т.е. в начале главного предложения. Эти данные указывают на то, что испытуемые лучше по­мнят последний главный компонент, и этот результат подтверждает ги­потезу о том, что испытуемые дословно запоминают только последний главный компонент.

 
 


1 Адаптировано из: Jarvella R.J. Syntactic processing of connected speech // Journal of Verbal Learning and Verbal Behavior. 1971. 10. P. 409-416.


Андерсон Д.Р. [Распознавание речи и понимание языка]



В эксперименте Каплана1 также получены доказательства ис­пользования компонентной структуры, но в этом исследовании исполь­зовался метод, основанный на измерении времени реакции. Испытуемым сначала устно предъявляли предложения, а затем — тестовое слово; пос­ле этого их просили как можно быстрее определить, присутствовало ли тестовое слово в предложении. Каплан сравнивал пары предложений, подобные следующей.

1. Now that artists are working fewer hours oil prints are rare. (Те­перь, когда художники работают меньшее время, масляные оттиски ста­новятся раритетом.)

2. Now that artists are workingin oilprints are rare. (Теперь, когда художники работают маслом, оттиски становятся раритетом.)

Интерес исследователей был сосредоточен на том, чтобы узнать, насколько быстро участники опознают слово oil, когда оно стоит в конце каждого из двух предложений. Предложения были составлены так, что­бы в них обоих слово oil было четвертым с конца, а за ним следовали одни и те же слова. На самом деле путем монтажа пленки Каплан предъявлял стимул так, чтобы участники слышали ту же самую запись этих последних четырех слов, каким бы ни было все предложение. Но в предложении 1 слово oil является элементом последнего компонента — oil prints are rare, — тогда как в предложении 2 это слово принадлежит первому компоненту — now that artists are working in oil. Каплан пред­положил, что участники быстрее опознают слово oil в предложении 1, потому что в их памяти все еще активна репрезентация этого компонен­та. Как он и предполагал, тестовое слово опознается быстрее, если оно находится в последнем компоненте. Испытуемые обрабатывают значение предложения по одной фразе и сохраняют доступ к фразе только во вре­мя обработки ее значения.






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.