Оперантное обусловливание психотерапия. Инструментальное, или оперантное, обусловливание

Классическое обусловливание - форма научения, исследованная И.П. Павловым - . Характеризуется тем, что вместе со стимулом, закономерно вызывающим определенную реакцию, подается нейтральный стимул. В дальнейшем этот стимул приобретает значение условного раздражителя, автоматически запускающего ту же реакцию. Синоним - Classical conditioning.
Оперантное обусловливание - форма научения - . Характеризуется тем, что подкрепляется то спонтанное поведение, которое признается желательным. Синоним - инструментальное научение, operant conditioning.
Теория инструментального, или О. о. связана с именами Торндайка (Thorndike E. L.) и Скиннера (Skinner В. F.). В отличие от принципа классического обусловливания (S->R), они разработали принцип О. о. (R->S), согласно которому поведение контролируется его результатами и последствиями. Основной путь воздействия на поведение, исходя из этой формулы, - влияние на его результаты.
Для различения стимула классического условного рефлекса и стимула инструментального условного рефлекса Скиннер предложил обозначать первый как Sd (дискриминантный стимул), а второй - Sr (pecпондентный стимул). Sd - стимул, по времени предшествующий определенной поведенческой реакции, Sr - стимул, подкрепляющий определенную поведенческую реакцию и по времени следующий за ней. Хотя в повседневной жизни эти стимулы часто совмещены в одном объекте, они могут быть разделены путем анализа с целью систематизации и определения последовательности мер воздействия на модифицируемое поведение. При использовании оперантных методов управление результатами поведения осуществляется для воздействия на само поведение. Поэтому здесь очень важен этап функционального анализа или поведенческой диагностики. Задача этого этапа состоит в определении подкрепляющей значимости окружающих пациента объектов, установлении иерархии их подкрепляющей силы. Это делается путем прямого наблюдения за поведением человека и установления связи между частотой и интенсивностью проявляемого поведения (зависимая переменная) и имеющимися в это время объектами и событиями, происходящими в окружении (независимая переменная).
Оперантные методы могут быть использованы для решения ряда задач.
1. Формирование нового стереотипа поведения, которого до этого не было в репертуаре поведенческих реакций человека (например, кооперативное поведение ребенка, поведение самоутверждающего типа у пассивного ребенка и т. д.). Для решения этой задачи может быть использовано несколько стратегий выработки нового поведения.
Под шейпингом понимается поэтапное моделирование сложного поведения, которое не было свойственно ранее индивиду. В цепи последовательных воздействий важным является первый элемент, который, хотя и отдаленно, связан с конечной целью шейпинга, однако с большой степенью вероятности направляет поведение в нужное русло. Этот первый элемент должен быть точно дифференцирован, а критерии оценки его достижения четко определены. Для облегчения проявления первого элемента желательного стереотипа должно быть выбрано условие, которое может быть достигнуто быстрее и легче всего. Для этого используется разнообразное варьирующее подкрепление, от материальных предметов до социального подкрепления (одобрение, похвала и др.). Например, при обучении ребенка навыкам самостоятельного одевания первым элементом может быть привлечение его внимания к одежде.
В случае «сцепления» используется представление о поведенческом стереотипе как о цепи отдельных поведенческих актов, при этом конечный результат каждого акта является дискриминантным стимулом, запускающим новый поведенческий акт. При реализации стратегии сцепления следует начинать с формирования и закрепления последнего поведенческого акта, находящегося ближе всего к самому концу цепи, к цели. Рассмотрение сложного поведения как цепи последовательных поведенческих актов позволяет понять, какая часть цепи хорошо сформирована, а какая должна быть создана с помощью шейпинга. Тренинг должен продолжаться до того момента, пока желательное поведение всей цепи не осуществляется с помощью обычных подкрепляющих стимулов.
Фейдинг - это постепенное уменьшение величины подкрепляющих стимулов. При достаточно прочно сформированном стереотипе пациент должен реагировать на минимальное подкрепление прежним образом. Фейдинг играет важную роль при переходе от тренировок с психотерапевтом к тренировкам в повседневном окружении, когда подкрепляющие стимулы исходят от других людей, замещающих психотерапевта.
Побуждение является вариантом вербального или невербального подкрепления, который повышает у обучающегося уровень внимания и фокусировки на желательном стереотипе поведения. Подкрепление может выражаться в демонстрации этого поведения, прямых инструкциях, центрированных или на нужных действиях, или на объекте действия и т. д.
2. Закрепление уже имеющегося в репертуаре индивида желательного стереотипа поведения. Для решения этой задачи может использоваться положительное подкрепление, отрицательное подкрепление, контроль стимула.
3. Уменьшение или угашение нежелательного стереотипа поведения. Достигается с помощью методик наказания, угашения, насыщения.
4. Лишение всех положительных подкреплений.
5. Оценка ответа.

ОПЕРАНТНОЕ ОБУСЛОВЛИВАНИЕ

Для понимания сущности закона эффекта Торндайка нам необходимо дать четкое определение понятия «вероятность реакции». Это очень важное понятие, но, к сожалению, очень трудное. При обсуждении поведения человека мы часто апеллируем к тенденциям «расположенности» вести себя определенным образом. Почти в каждой теории поведения используются такие термины, как «потенциал возбуждения», «сила привычки» или «детерминирующая тенденция». Но как мы наблюдаем тенденцию? И как можно ее замерить?

Если бы определенное поведение существовало в двух ипостасях - в одном случае оно всегда бы имело место, а в другом - никогда, то мы оказались бы почти в беспомощном состоянии при введении программы функционального анализа. Феномен, имеющий характеристики «все и ничего», имеет только простые формы описания. Гораздо более продуктивным является предположение, что вероятность осуществления реакции последовательно распределяется между этими двумя полюсами «все - ничего». Тогда мы можем рассмотреть переменные, которые в отличие от стимулов порождения (eliciting stimulus), «не являясь причиной данного поведения», делают его наступление более вероятным. Далее мы можем, например, рассмотреть последствия действия нескольких таких переменных.

Распространенные выражения, отражающие вероятностную природу явления, - «тенденция» или «предрасположенность» - характеризуют частоту наступления определенных видов поведения. Мы никогда не наблюдаем вероятность. Мы говорим, что кто-то «обожает бридж», потому что замечаем, что он часто играет в бридж и часто говорит о нем. «Глубоко интересоваться» музыкой означает много играть, часто слушать музыку и много говорить о музыке. «Неисправимый игрок» много играет в карты. Любитель киносъемок делает снимки, проявляет их и любуется своими собственными снимками и снимками других людей и т. д…

Характеризуя поведение человека с точки зрения его частоты, мы принимаем определенные стандартные условия: он должен быть способен выполнить и повторить определенное действие, при этом другие виды поведения не должны мешать. Например, мы не можем знать, насколько сильна тяга человека к музыке, если ему приходится также заниматься другими вещами. Подойдя к проблеме уточнения научного определения вероятности, мы обнаруживаем, что исходными моментами являются частота и условия, при которых наблюдается то или иное поведение. Мы устраняем или по крайней мере сохраняем в неизменном виде любое условие, которое способствует проявлению конкурирующего с изучаемым нами видом поведения. Животное помещается в отдельный (quiet) ящик, и за его поведением наблюдают с помощью одно-канального экрана, или оно регистрируется посредством специальных технических устройств. Эти условия нельзя рассматривать как вакуумную среду, так как животное будет реагировать на свойства ящика многими способами, однако его поведение постепенно достигнет достаточно устойчивого уровня, на котором можно исследовать частоту заданной реакции.

Для изучения процесса, который Торндайк назвал запечатлением, мы должны иметь его «последствие». Это может быть, например, предъявление еды голодному животному. Мы можем предъявлять нашему испытуемому еду в удобном для него месте, на большом подносе, с помощью специального устройства. При первом предъявлении подноса животное, вероятно, будет реагировать на него различными поведенческими реакциями, которые мешают проявлению изучаемого нами поведения. Постепенно после нескольких кормлений оно без промедления принимает пищу и мы получаем возможность рассматривать это последствие как зависящее от поведения и наблюдать его результат.

Мы выбираем относительно простой вид поведения, который свободно и многократно воспроизводим и который легко поддается наблюдению и регистрации. Например, если испытуемым является голубь, то поднятие им головы выше определенного уровня является удобным поведением для изучения. Оно может быть зафиксировано взглядом экспериментатора на шкале, прикрепленной к задней стенке ящика, на фоне которой находится голубь. Сначала мы изучаем естественную высоту поднятия головы голубем и выбираем на шкале отметку, которая достигается им только в отдельных случаях. Фиксируя свой взгляд на шкале, экспериментатор начинает очень быстро открывать поднос, как только голова поднимается выше этой линии. Если эксперимент проводится в соответствии со спецификациями, то получается один и тот же результат: мы наблюдаем быстрое изменение частоты пересечения головой голубя заданной линии. Мы также видим, что голова голубя поднимается на более высокий уровень, и этот факт имеет большое теоретическое значение. Мы можем очень быстро заставить голубя высоко поднимать голову, установив время предъявления пищи. Через одну-две минуты поза голубя изменяется таким образом, что его голова редко опускается ниже линии, которую мы выбрали вначале.

Когда мы демонстрируем процесс запечатления в такой относительно простой форме, мы видим, что некоторые обычные интерпретации эксперимента Торндайка избыточны. Выражение «научение путем проб и ошибок», которое часто связывается с законом эффекта, здесь явно неуместно. Мы вкладываем особый смысл в наши наблюдения, когда называем любое поднятие головы «пробой», и нет оснований считать «ошибочным» любое движение, которое не приводит к установленному нами результату. Даже употребление термина «научение» вводит в заблуждение. Утверждение, что «птица научается получать пищу посредством вытягивания шеи», является неадекватным выражением того, что происходит. Говорить, что она приобрела «навык» вытягивать шею - значит просто обращаться к объяснительным вымыслам, поскольку единственным доказательством наличия навыка является приобретенная тенденция выполнять действие. Простейшим возможным описанием данного процесса является следующее: мы делаем данный контингент следствий зависимым от определенных физических свойств поведения (поднятия головы), далее фиксируем, что частота появления этого поведения возрастает. Принято рассматривать любое движение живого существа как реакцию. Это слово заимствовано из исследований, посвященных изучению рефлексов. Оно означает действие, которое наступает в ответ на предшествующее событие - стимул. Но мы можем сделать событие зависимым от поведения без определения предшествующего стимула. Мы не изменяем среду обитания голубя для того, чтобы вызвать поднятие головы. Вероятно, нельзя показать, что любой простой стимул неизменно предшествует этому движению. Такое поведение может оказаться под контролем стимулов, но при этом отсутствуют отношения по типу «одно порождает другое», поэтому термин «реакция» не вполне адекватен, но он настолько укоренился, что далее мы будем его использовать.

Конечно, нельзя предсказать и проконтролировать реакцию, которая уже произошла. Можно только предсказать, что похожие реакции будут наблюдаться в будущем. Поэтому единицей науки о прогнозировании является не реакция, а класс реакций. Для его описания будет использоваться слово «оперантный». Данный термин показывает, что поведение «воздействует» (operates) на среду, генерируя последствия. Следствия определяют свойства, по которым устанавливается сходство реакций. Он будет использоваться и как прилагательное (оперантное поведение), и как существительное, обозначающее поведение, определенное данным следствием.

Поднятие голубем головы один раз в определенный момент является реакцией. Это прошлое и его можно рассматривать со всех точек зрения, которые представляют для нас интерес. Поведение, называемое «поднятием головы», которое происходит независимо от определенных обстоятельств (instances), является оперантным. Его можно описать не как завершенное действие, а как состав действий, определяющийся свойствами высоты, на которую нужно поднять голову. В этом смысле оперант можно определить посредством следствия, характеризуемого с помощью физических терминов. «Поднятие головы» («cutoff») на определенную высоту является частью (property) поведения.

Традиционное употребление термина «научение» может быть сохранено для описания перераспределения реакций на классы в сложной ситуации. Терминология, необходимая для описания процесса запечатления, может быть заимствована из теории условных рефлексов И. П. Павлова. Сам Павлов называет все события, которые усиливают поведение «подкреплением» и все возникающие в связи с ним изменения, «обусловливанием». Однако в экспериментах Павлова подкрепление сочетается со стимулом, а при оперантном поведении оно зависит от реакции. Поэтому оперантное подкрепление является специальным процессом и нуждается в специальном анализе. В обоих случаях усиление поведения, происходящее в результате подкрепления, называется «обусловливанием». При оперантном обусловливании мы усиливаем оперант, чтобы увеличить вероятность или частоту появления реакции. В условиях павловского, или «респондентного», обусловливания мы просто повышаем величину реакции, вызванную условным стимулом, и сокращаем время между стимулом и реакцией. Мы уже отмечали, что этими двумя случаями исчерпываются возможности: 1) организм обусловливается, когда подкрепление сопровождает другой стимул или 2) следует за поведением организма. Любое событие, которое не приводит к одному из этих случаев, не влияет на изменение вероятности реакции. Тогда в эксперименте с голубем еда является тем, что подкрепляет, а.ее предъявление, когда реакция «выделяется», является подкреплением. Оперант определяется свойствами, от которых зависит подкрепление - высотой, на которую должна подниматься голова голубя. Изменение частоты поднятия головы на эту высоту есть процесс оперантного обусловливания.

Находясь в состоянии бодрствования, мы постоянно воздействуем на среду, и многие последствия нашего поведения имеют силу подкрепления. Посредством оперантного обусловливания среда конструирует базисный репертуар поведения, благодаря которому мы сохраняем равновесие, ходим, играем в спортивные игры, пользуемся инструментами, говорим, пишем, гребем, управляем автомобилем и самолетом. Мы можем оказаться не готовыми к изменению в среде, например появлению нового автомобиля, нового друга, новых интересов, к смене работы и местожительства, но мы обычно быстро приспосабливаемся к новой обстановке, приобретая новые реакции и утрачивая старые. ‹:…› Оперантное подкрепление не только структурирует репертуар поведения. Оно улучшает продуктивность поведения и еще долгое время сохраняет его после того, как его усвоение или продуктивность теряют свою значимость.

Из книги Думают ли животные? автора Фишель Вернер

Оперантное обусловливание по Скиннеру Название раздела звучит научно и недоступно. Пусть пока оно так и останется непонятным, поскольку вначале речь пойдет о творческом наследии И. П. Павлова. Труды Павлова получили мировое признание и в 1904 году были отмечены

ОПЕРАНТНОЕ ОБУСЛОВЛИВАНИЕ

ОПЕРАНТНОЕ ОБУСЛОВЛИВАНИЕ. Теория инструментального, или О. о. связана с именами Торндайка (Thorndike E. L.) и Скиннера (Skinner В. F.). В отличие от принципа классического обусловливания (S->R), они разработали принцип О. о. (R->S), согласно которому поведение контролируется его результатами и последствиями. Основной путь воздействия на поведение, исходя из этой формулы, - влияние на его результаты.
Для различения стимула классического условного рефлекса и стимула инструментального условного рефлекса Скиннер предложил обозначать первый как Sd (дискриминантный стимул), а второй - Sr (pecпондентный стимул). Sd - стимул, по времени предшествующий определенной поведенческой реакции, Sr - стимул, подкрепляющий определенную поведенческую реакцию и по времени следующий за ней. Хотя в повседневной жизни эти стимулы часто совмещены в одном объекте, они могут быть разделены путем анализа с целью систематизации и определения последовательности мер воздействия на модифицируемое поведение. При использовании оперантных методов управление результатами поведения осуществляется для воздействия на само поведение. Поэтому здесь очень важен этап функционального анализа или поведенческой диагностики. Задача этого этапа состоит в определении подкрепляющей значимости окружающих пациента объектов, установлении иерархии их подкрепляющей силы. Это делается путем прямого наблюдения за поведением человека и установления связи между частотой и интенсивностью проявляемого поведения (зависимая переменная) и имеющимися в это время объектами и событиями, происходящими в окружении (независимая переменная).
Оперантные методы могут быть использованы для решения ряда задач.
1. Формирование нового стереотипа поведения, которого до этого не было в репертуаре поведенческих реакций человека (например, кооперативное поведение ребенка, поведение самоутверждающего типа у пассивного ребенка и т. д.). Для решения этой задачи может быть использовано несколько стратегий выработки нового поведения.
Под шейпингом понимается поэтапное моделирование сложного поведения, которое не было свойственно ранее индивиду. В цепи последовательных воздействий важным является первый элемент, который, хотя и отдаленно, связан с конечной целью шейпинга, однако с большой степенью вероятности направляет поведение в нужное русло. Этот первый элемент должен быть точно дифференцирован, а критерии оценки его достижения четко определены. Для облегчения проявления первого элемента желательного стереотипа должно быть выбрано условие, которое может быть достигнуто быстрее и легче всего. Для этого используется разнообразное варьирующее подкрепление, от материальных предметов до социального подкрепления (одобрение, похвала и др.). Например, при обучении ребенка навыкам самостоятельного одевания первым элементом может быть привлечение его внимания к одежде.
В случае "сцепления" используется представление о поведенческом стереотипе как о цепи отдельных поведенческих актов, при этом конечный результат каждого акта является дискриминантным стимулом, запускающим новый поведенческий акт. При реализации стратегии сцепления следует начинать с формирования и закрепления последнего поведенческого акта, находящегося ближе всего к самому концу цепи, к цели. Рассмотрение сложного поведения как цепи последовательных поведенческих актов позволяет понять, какая часть цепи хорошо сформирована, а какая должна быть создана с помощью шейпинга. Тренинг должен продолжаться до того момента, пока желательное поведение всей цепи не осуществляется с помощью обычных подкрепляющих стимулов.
Фейдинг - это постепенное уменьшение величины подкрепляющих стимулов. При достаточно прочно сформированном стереотипе пациент должен реагировать на минимальное подкрепление прежним образом. Фейдинг играет важную роль при переходе от тренировок с психотерапевтом к тренировкам в повседневном окружении, когда подкрепляющие стимулы исходят от других людей, замещающих психотерапевта.
Побуждение является вариантом вербального или невербального подкрепления, который повышает у обучающегося уровень внимания и фокусировки на желательном стереотипе поведения. Подкрепление может выражаться в демонстрации этого поведения, прямых инструкциях, центрированных или на нужных действиях, или на объекте действия и т. д.
2. Закрепление уже имеющегося в репертуаре индивида желательного стереотипа поведения. Для решения этой задачи может использоваться положительное подкрепление, отрицательное подкрепление, контроль стимула.
3. Уменьшение или угашение нежелательного стереотипа поведения. Достигается с помощью методик наказания, угашения, насыщения.
4. Лишение всех положительных подкреплений.
5. Оценка ответа.
См. также Бихевиоризм, Поведенческая психотерапия, Положительное и отрицательное подкрепление.

Теория-инструментального, или оперантного, обусловливания связана с именами Э. Л. Торндайка (Е. L. Thorndike) и Б. Ф. Скиннера (В. F. Skinner). Скиннер и Торндайк - виднейшие представители бихевиоризма - показали, что воздействие окружающей среды определяет поведение человека. Они рассматривают в качестве главного фактора формирования человеческого поведения культуру, содержание которой выражается в определенном наборе комплексов подкреплений. С их помощью можно создавать и модифицировать человеческое поведение в нужном направлении. На таком понимании основаны методы модификации поведения, использующиеся не только в психотерапевтической практике, но и, например, при воспитательных воздействиях.

Термины «инструментальное научение» и «оперант- ное обусловливание» означают, что реакция организма, которая формируется по методу проб и ошибок, является инструментом для получения поощрения и предполагает оперирование средой, то есть поведение есть функция его последствий. Согласно принципу оперантного обусловливания, поведение контролируется его результатом и последствиями. Модификация поведения осуществляется за счет влияния на его результаты и последствия. В соответствии со схемой оперантного обусловливания экспериментатор, наблюдая поведение, фиксирует случайные проявления желательной, «правильной», реакции и сразу же подкрепляет ее. Таким образом, стимул следует после поведенческой реакции, используется прямое подкрепление через поощрение и наказание. Результатом подобного научения является оперантное научение, или оперант. В этом случае подкрепляется не стимул, а реакция организма, именно она вызывает подкрепляющий стимул, поэтому такое научение обозначается как научение типа R. Оперантное, или инструментальное, поведение (поведение типа R) - это поведение, вызванное подкреплением, следующим за поведением. Скиннер, подчеркивая различия между респондентным и оперантным поведением, указывает, что респондентное поведение вызвано стимулом, предшествующим поведению, а оперантное поведение - стимулом, следующим за поведением. Иными словами, в классическом обусловливании стимул предшествует поведенческой реакции, а в оперантном - следует за ней.

Необходимо обратить внимание на соотношение таких понятий, как позитивное и негативное подкрепление и наказание, различать наказание и негативное подкрепление. Позитивное или негативное подкрепление усиливает поведение, наказание - ослабляет. Позитивное подкрепление основано на предъявлении стимулов (наград), которые усиливают поведенческую реакцию. Негативное подкрепление заключается в усилении поведения за счет удаления негативных стимулов. То есть всякое подкрепление (и позитивное, и негативное) усиливает частоту реакции и поведение, наказание же, напротив, уменьшает частоту реакции, ослабляет поведение. (Например, позитивное подкрепление: животное находит выход из лабиринта и получает пищу; негативное подкрепление: животное находит выход из лабиринта, где действует электрический ток, и ток выключают; наказание: животное в лабиринте упирается в тупик, и ток включают. Таким образом, первые два вида воздействия экспериментатора усиливают реакцию, поскольку являются подкреплением, а третий - уменьшает, являясь наказанием.)

Для различения стимула классического условного рефлекса и стимула оперантного условного рефлекса Скиннер предложил обозначать первый как Sd (дискриминантный стимул), а второй - как Sr (респондент- ный стимул). Дискриминантный стимул по времени предшествует определенной поведенческой реакции, респондентами стимул, подкрепляющий определенную поведенческую реакцию, следует за ней.

Итак, сравнительные характеристики классического и оперантного обусловливания:

Классическое обусловливание S-R. Научение типа S. Классическая парадигма Павлова. Реакция возникает только в ответ на воздействие какого-либо стимула. Стимул предшествует реакции. Подкрепление связано со стимулом. Респондентное поведение - поведение, вызванное определенным стимулом, ему предшествующим.

Оперантное обусловливание R-S. Научение типа R. Оперантная парадигма Скиннера. Желательная реакция может появиться спонтанно. Стимул следует за поведенческой реакцией. Подкрепление связано с реакцией. Оперантное поведение - поведение, вызванное подкреплением, за ним следующим.

(operant conditioning) Термин О. о. применительно к научению используется в двух значениях. В более узком смысле с ним связывается набор процедур, использующихся при изучении процессов инструментального обусловливания. В более широком и более фундаментальном смысле термином О. о. обозначается общий теорет. подход, к-рый использует эти процедуры и связанные с ними понятия для анализа всего спектра поведения животных и чел. Оперантные процедуры Отличительные особенности процедур О. о. можно проиллюстрировать на следующем примере. Крысу помещают в тускло освещенную небольшую клетку, находящуюся в поглощающей звуки и изолированной от внешних источников света комнате. Из одной стены этой совершенно пустой клетки выступает небольшой рычаг, и когда крыса нажимает этот рычаг, в находящуюся рядом с ним чашку падает небольшой шарик пищи. Такое устройство часто называют ящиком Скиннера по имени психолога Б. Ф. Скиннера, к-рый его впервые сконструировал. Этот пример иллюстрирует одну отличительную особенность, к-рая позволяет наиболее четко отделить оперантные процедуры от др. процедур инструментального обусловливания. Интересующее нас поведение может многократно воспроизводиться обучающимся субъектом. В отличие от процедур, связанных с дискретными попытками, таких, как научение в лабиринте, в к-ром поведение состоит из серии отдельных эпизодов, реагирование в оперантных процедурах не прерывается извне и является свободным. В связи с возможностью повторного реагирования следует отметить две вытекающие отсюда особенности процедур О. о. Во-первых, реагирование измеряется скоростью появления реакции или ее частотой. Частота реагирования рассматривается в качестве аппроксимации осн. показателя силы реакции - ее вероятности. Наклон кривой, вычерчиваемой по совокупным данным наблюдений, служит прямой мерой частоты реагирования в каждый данный момент времени. Во-вторых, предоставление возможности повторного реагирования позволяет манипулировать взаимосвязями между различными качественными характеристиками реакции (напр., количеством ее повторений или длительностью) и критическим событием, поддерживающим эту реакцию (напр., появлением пищи). Правило, к-рое описывает характеристики реакции, необходимые для возникновения критического события, называется режимом подкрепления. Различные режимы подкрепления вызывают различные паттерны реагирования. Высокая частота реагирования и сложность мн. режимов подкрепления при проведении экспериментов по О. о. требуют обычно использования автоматического оборудования, включая компьютеры. Оперантная теория В более широком значении О. о. является одним из подразделов биологии, занимающимся идентификацией средовых детерминант поведения при помощи методов эксперим. анализа. Предполагается, что поведение животных и чел. имеет свои первопричины в окружающей среде. Родовая среда обитания индивида (особи) воздействует на его (ее) поведение через посредство генетических механизмов, действие к-рых суммируется принципом естественного отбора. Этими предшествующими формами поведения занимается эволюционная биология. Прошлое и настоящее окружения индивида (особи) воздействуют на его (ее) поведение через посредство нейрохимических механизмов (до сих пор практически неизученных), действие к-рых суммируется принципом подкрепления. Анализом этих воздействий индивидуальной среды на поведение как раз и занимается О. о. И принцип естественного отбора, и принцип подкрепления предполагают, что будущее поведение м. б. понято путем изучения последствий прошлого поведения. В случае естественного отбора отбираются те формы поведения (и структуры), к-рые повышают репродуктивную способность. В случае подкрепления усиливаются те формы поведения, за к-рыми наступают критические события и для к-рых был изобретен специальный термин - подкрепления. Когда средовые детерминанты идентифицированы и описаны их функциональные связи с поведением, в окружение могут вводиться изменения, к-рые могут влиять на направление изменений текущего поведения, подобно тому как генная инженерия может влиять на ход эволюции. Из базового допущения о том, что поведение всех организмов, включая людей, в конечном счете формируется средой, вытекает ряд методологических следствий. Во-первых, так как люди и животные на протяжении своей эволюции сталкивались с родовой (видовой) средой обитания, к-рая "отбирала" их за способность к модификации поведения в пределах отпущенного им жизненного цикла (т. е. за способность к научению), общая функциональная формулировка принципа подкрепления, по-видимому, выводится из изучения любого широко представленного биолог. вида. Во-вторых, поскольку изменение в поведении возникает в рез-те контакта организма со своей средой и поскольку родовая (видовая) и индивидуальная среды могут варьировать от одного организма к др. даже при максимально контролируемых условиях, процесс изменения должен изучаться на одном организме. Выводы, осн. на усредненных групп. рез-тах, могут заслонять и искажать поведенческие процессы, протекающие у отдельного индивида (особи). В-третьих, с учетом того, что рано или поздно будет получено нейрохимическое описание механизмов, лежащих в основе изменений поведения, и в надежде на свою способность воспользоваться этим знанием, О. о. стремится к анализу поведения как продукта одних только предшествующих воздействий среды, без обращения к постулированным на основе логического вывода процессам или структурам. Считается, что теорет. конструкты этого типа отвлекают от задачи эксперим. анализа и квалифицируются как объяснения по форме, но не по существу, поскольку они часто приводят к ошибкам гипостазирования (приписывания отвлеченным сущностям самостоятельного существования) и логической замкнутости. О. о. пытается разложить взаимодействие между организмом и его средой на последовательность или ситуацию из трех элементов. Рез-том успешного эксперим. анализа является идентификация, с одной стороны, средовых событий (сигнальных, или различительных стимулов), обусловливающих возникновение данного поведения (операнта), и, с др. стороны, средовых событий (подкрепляющих стимулов, или подкреплений), необходимых для приобретения и сохранения этого поведения. Поведение, к-рое требуется для появления подкрепления, называют оперантом, подчеркивая то обстоятельство, что оно действует на складывающуюся в дальнейшем среду, чтобы вызвать определенные последствия. Наконец, изменения в средовом контроле поведения, возникающие в рез-те О. о., не обязательно ограничиваются характеристиками конкретного стимула и реакции, выявленными в ходе первоначального эксперим. анализа. Как рез-тат О. о., эти изменения чаще всего затрагивают класс стимулов, к-рые контролируют класс реакций. См. также Модификация поведения, Оперантное поведение, Режимы подкрепления Дж. У. Донахью

Определения, значения слова в других словарях:

Психотерапевтическая энциклопедия

Теория инструментального, или О. о. связана с именами Торндайка (Thorndike E. L.) и Скиннера (Skinner В. F.). В отличие от принципа классического обусловливания (S->R), они разработали принцип О. о. (R->S), согласно которому поведение контролируется его результатами и...