Теория оперантного обусловливания скиннера кратко. Скиннер: оперантное обусловливание

Б. Скиннер (1904-1990) является представителем необихевиоризма.

Основные положения теории «оперантного бихевиоризма":

1. Предметом исследования является поведение организма в его двигательной составляющей.

1. Поведение - это то, что делает организм и что можно наблюдать, и поэтому сознание и его феномены - воля, творчество, интеллект, эмоции, личность - не могут быть предметом изучения, так как они не наблюдаемы объективно.

3. Человек не свободен, так как сам никогда не управляет своим поседением, которое детерминировано внешней средой;

4. Личность понимается как набор поведенческих шаблонов "ситуация - реакции-, причем последняя зависит от предыдущего опыта и генетической истории.

5. Поведение можно разделить на три вида; безусловно-рефлекторное и условно-рефлекторное, которые являются простым ответом на стимул, и оперантное, возникающее спонтанно и определяемое как обусловливание; этот тип поведения играет решающую роль в адаптации организма к внешним условиям.

6. Главной характеристикой оперантного поведения является его зависимость от прошлого опыта, или последнего стимула, получившего название подкрепления. Поведение усиливается или ослабляется в зависимости от подкрепления, которое может быть отрицательным или положительным.

7. Процесс положительного или отрицательного подкрепления за совершенное действие называется обусловливанием.

8. На основе подкрепления можно построить всю систему обучения ребенка, так называемое программированное обучение, когда весь материал расчленяется на мелкие части и в случае успешного прохождения и усвоения каждой части учащийся получает положительное подкрепление, а в случае неудачи - отрицательное.

9. На этой же основе строится и система воспитания и управления человеком - социализация происходит путем положительного подкрепления необходимых для общества норм, ценностей и правил поведения, в то время как асоциальное поведение должно иметь негативное подкрепление со стороны общества.

Режимы подкрепления.

Суть оперантного научения состоит в том, что подкрепленное поведение стремится повториться, а поведение неподкрепленное или наказуемое имеет тенденцию не повторяться или подавляться. Следовательно, концепция подкрепления играет ключевую роль в теории Скиннера.

Скорость, с которой оперантное поведение приобретается и сохраняется, зависит от режима применяемого подкрепления. Режим подкрепления - правило, устанавливающее вероятность, с которой подкрепление будет происходить. Самым простым правилом является предъявление подкрепления каждый раз, когда субъект дает желаемую реакцию. Это называется режимом непрерывного подкрепления и обычно используется на начальном этапе любого оперантного научения, когда организм учится производить правильную реакцию. В большинстве ситуаций повседневной жизни, однако, это либо неосуществимо, либо неэкономично для сохранения желаемой реакции, так как подкрепление поведения бывает не всегда одинаковым и регулярным. В большинстве случаев социальное поведение человека подкрепляется только иногда. Ребенок плачет неоднократно, прежде чем добьется внимания матери. Ученый много раз ошибается, прежде чем приходит к правильному решению трудной проблемы. В обоих этих примерах неподкрепленные реакции встречаются до тех пор, пока одна из них не будет подкреплена.

Скиннер тщательно изучал, как режим прерывистого , или частичного, подкрепления влияет на оперантное поведение. Хотя возможны многие различные режимы подкрепления, их все можно классифицировать в соответствии с двумя основными параметрами: 1) подкрепление может иметь место только после того, как истек определенный или случайный временной интервал с момента предыдущего подкрепления (так называемый режим временного подкрепления ); 2) подкрепление может иметь место только после того, как с момента подкрепления было получено определенное или случайное количество реакций (режим пропорционального подкрепления ). В соответствии с этими двумя параметрами выделяют четыре основных режима подкрепления.

1. Режим подкрепления с постоянным соотношением (ПС). В данном режиме организм подкрепляется по наличию заранее определенного или «постоянного» числа соответствующих реакций. Этот режим является всеобщим в повседневной жизни и ему принадлежит значительная роль в контроле над поведением. Во многих сферах занятости сотрудникам платят отчасти или даже исключительно в соответствии с количеством единиц, которые они производят или продают. В промышленности эта система известна как плата за единицу продукции. Режим ПС обычно устанавливает чрезвычайно высокий оперантный уровень, так как чем чаще организм реагирует, тем большее подкрепление он получает.

2. Режим подкрепления с постоянным интервалом (ПИ). В режиме подкрепления с постоянным интервалом организм подкрепляется после того, как твердо установленный или «постоянный» временной интервал проходит с момента предыдущего подкрепления. На уровне человека режим ПИ действителен при выплате зарплаты за работу, выполненную за час, неделю или месяц. Подобно этому, еженедельная выдача денег ребенку на карманные расходы образует ПИ форму подкрепления. Университеты обычно работают в соответствии с временным режимом ПИ. Экзамены устанавливаются на регулярной основе и отчеты об академической успеваемости издаются в установленные сроки. Любопытно, что режим ПИ дает низкую скорость реагирования сразу после того, как получено подкрепление - феномен, названный паузой после подкрепления . Это показательно для студентов, испытывающих трудности при обучении в середине семестра (предполагается, что они сдали экзамен хорошо), так как следующий экзамен будет еще нескоро. Они буквально делают перерыв в обучении.

3. Режим подкрепления с вариативным соотношением (ВС). В этом режиме организм подкрепляется на основе какого-то в среднем предопределенного числа реакций. Возможно, наиболее драматической иллюстрацией поведения человека, находящегося под контролем режима ВС, является захватывающая азартная игра. Рассмотрим действия человека, играющего в игральный автомат, где нужно опускать монетку или специальной рукояткой вытягивать приз. Эти аппараты запрограммированы таким образом, что подкрепление (деньги) распределяется в соответствии с числом попыток, за которые человек платит, чтобы управлять рукояткой. Однако выигрыш непредсказуем, непостоянен и редко позволяет получать свыше того, что вложил игрок. Это объясняет тот факт, почему владельцы казино получают значительно больше подкреплений, чем их постоянные клиенты. Далее, угасание поведения, приобретенного в соответствии с режимом ВС, происходит очень медленно, так как организм точно не знает, когда будет следующее подкрепление. Таким образом, игрок принуждается опускать монеты в прорезь автомата, несмотря на ничтожный выигрыш (или даже проигрыш), в полной уверенности, что в следующий раз он «сорвет куш». Такая настойчивость типична для поведения, вызванного режимом ВС.

4. Режим подкрепления с вариативным интервалом (ВИ). В этом режиме организм получает подкрепление после того, как проходит неопределенный временной интервал. Подобно режиму ПИ, подкрепление при этом условии зависит от времени. Однако время между подкреплениями по режиму ВИ варьирует вокруг какой-то средней величины, а не является точно установленным. Как правило, скорость реагирования при режиме ВИ является прямой функцией примененной длины интервала: короткие интервалы порождают высокую скорость, а длинные интервалы порождают низкую скорость. Также при подкреплении в режиме ВИ организм стремится установить постоянную скорость реагирования, и при отсутствии подкрепления реакции угасают медленно. В конечном итоге, организм не может точно предвидеть, когда будет следующее подкрепление.

В повседневной жизни режим ВИ нечасто встречается, хотя несколько его вариантов можно наблюдать. Родитель, например, может хвалить поведение ребенка довольно произвольно, рассчитывая, что ребенок будет продолжать вести себя соответствующим образом и в неподкрепленные интервалы времени. Подобно этому, профессора, которые дают «неожиданные» контрольные работы, частота которых варьирует от одной в три дня до одной в три недели, в среднем одна в две недели, используют режим ВИ. При этих условиях от студентов можно ожидать сохранения относительно высокого уровня прилежания, так как они никогда не знают, в какой момент будет следующая контрольная работа.

Как правило, режим ВИ порождает более высокую скорость реагирования и большую сопротивляемость угасанию, чем режим ПИ.

Условное подкрепление.

Теоретики, занимающиеся научением, признавали два типа подкрепления - первичное и вторичное. Первичное подкрепление - это любое событие или объект, сами по себе обладающие подкрепляющими свойствами. Таким образом, они не требуют предварительной ассоциации с другими подкреплениями, чтобы удовлетворить биологическую потребность. Первичные подкрепляющие стимулы для людей - это пища, вода, физический комфорт и секс. Их ценностное значение для организма не зависит от научения. Вторичное , или условное подкрепление, с другой стороны, - это любое событие или объект, которые приобретают свойство осуществлять подкрепление посредством тесной ассоциации с первичным подкреплением, обусловленным прошлым опытом организма. Примерами общих вторичных подкрепляющих стимулов у людей являются деньги, внимание, привязанности и хорошие оценки.

Небольшое изменение в стандартной процедуре оперантного научения демонстрирует, как нейтральный стимул может приобрести подкрепляющую силу для поведения. Когда крыса научилась нажимать на рычаг в «ящике Скиннера», сразу же ввели звуковой сигнал (сразу после осуществления реакции), за которым следовал шарик еды. В этом случае звук действует как различительный стимул (то есть животное учится реагировать только при наличии звукового сигнала, так как он сообщает о пищевом вознаграждении). После того, как эта специфическая оперантная реакция устанавливается, начинается угасание: когда крыса нажимает на рычаг, не появляются ни пища, ни звуковой сигнал. Через какое-то время крыса перестает нажимать на рычаг. Затем звуковой сигнал повторяется каждый раз, когда животное нажимает на рычаг, но шарик пищи не появляется. Несмотря на отсутствие первоначального подкрепляющего стимула, животное понимает, что нажатие на рычаг вызывает звуковой сигнал, поэтому оно продолжает настойчиво реагировать, тем самым ослабляя угасание. Другими словами, установленная скорость нажатия на рычаг отражает тот факт, что звуковой сигнал теперь действует как условный подкрепляющий фактор. Точная скорость реагирования зависит от силы звукового сигнала как условного подкрепляющего стимула (то есть от числа случаев, когда звуковой сигнал ассоциировался с первичным подкрепляющим стимулом, пищей, в процессе научения). Скиннер доказывал, что фактически любой нейтральный стимул может стать подкрепляющим, если он ассоциируется с другими стимулами, ранее имевшими подкрепляющие свойства. Таким образом, феномен условного подкрепления в значительной степени увеличивает сферу возможного оперантного научения, особенно если это касается социального поведения человека. Иначе говоря, если бы все, чему мы научились, было пропорционально первичному подкреплению, то возможности для научения были бы очень ограничены, и деятельность человека не была бы столь разнообразна.

Характерным для условного подкрепления является то, что оно генерализуется, если объединяется с более чем одним первичным подкреплением. Деньги - особенно показательный пример. Очевидно, что деньги не могут удовлетворить какое-либо из наших первичных влечений. Все же благодаря системе культурного обмена деньги являются мощным и сильным фактором для получения множества удовольствий. Например, деньги позволяют нам иметь модную одежду, яркие машины, медицинскую помощь и образование. Иные виды генерализованных условных подкрепляющих стимулов - это лесть, похвала, привязанности и подчинение себе других. Эти так называемые социальные подкрепляющие стимулы (включающие в себя поведение других людей) часто действуют очень сложно и едва уловимо, но они существенны для нашего поведения в разнообразных ситуациях. Внимание - простой случай. Все знают, что ребенок может получить внимание, когда притворяется больным или плохо себя ведет. Часто дети назойливы, задают нелепые вопросы, вмешиваются в разговор взрослых, рисуются, поддразнивают младших сестер или братьев и мочатся в постель - и все это для привлечения внимания. Внимание значимого другого - родителей, учителя, возлюбленного - особенно эффективный генерализованный условный стимул, который может содействовать ярко выраженному поведению привлечения внимания.

Еще более сильный генерализованный условный стимул - это социальное одобрение. Например, многие люди проводят массу времени, прихорашиваясь перед зеркалом, в надежде получить одобряющий взгляд супруга или любовника. И женская, и мужская мода - это предмет одобрения, и она существует до тех пор, пока есть социальное одобрение. Студенты высшей школы соревнуются за место в университетской легкоатлетической команде или участвуют в мероприятиях вне учебного плана (драма, диспут, школьный ежегодник) для того, чтобы получить одобрение родителей, сверстников и соседей. Хорошие отметки в колледже - тоже позитивный подкрепляющий стимул , потому что ранее за это получали похвалу и одобрение родителей. Будучи мощным условным подкрепляющим стимулом, удовлетворительные оценки также способствуют поощрению учения и достижению более высокой академической успеваемости.

Скиннер полагал, что условные подкрепляющие стимулы очень важны в контроле поведения человека (Skinner, 1971). Он также отмечал, что каждый человек проходит уникальную науку научения, и вряд ли всеми людьми управляют одни и те же подкрепляющие стимулы. Например, для кого-то очень сильным подкрепляющим стимулом является успех в качестве антрепренера; для других важно выражение нежности; а иные находят подкрепляющий стимул в спорте, академических или музыкальных занятиях. Возможные вариации в поведении, поддержанные условными подкрепляющими стимулами, бесконечны. Следовательно, понять условные подкрепляющие стимулы у человека намного сложнее, чем понять, почему крыса, лишенная пищи, нажимает рычаг, получая в качестве подкрепления только звуковой сигнал.

Контроль поведения посредством аверсивных стимулов.

С точки зрения Скиннера, в основном поведение человека контролируется аверсивными (неприятными или болевыми) стимулами. Два наиболее типичных метода аверсивного контроля - это наказание и негативное подкрепление . Эти термины часто используются как синонимы для описания концептуальных свойств и поведенческих эффектов аверсивного контроля. Скиннер предложил следующее определение: «Вы можете различать наказание, при котором происходит аверсивное событие, пропорциональное реакции, и негативное подкрепление, в котором подкреплением является устранение аверсивного стимула, условного или безусловного» (Evans, 1968, р. 33).

Наказание. Термин наказание относится к любому аверсивному стимулу или явлению, которое следует или которое зависит от появления какой-то оперантной реакции. Вместо того, чтобы усиливать реакцию, которую оно сопровождает, наказание уменьшает, по крайней мере временно, вероятность того, что реакция повторится. Предполагаемая цель наказания - побудить людей не вести себя данным образом. Скиннер (Skinner, 1983) заметил, что это наиболее общий метод контроля поведения в современной жизни.

По Скиннеру, наказание может быть осуществлено двумя различными способами, которые он называет позитивное наказание и негативное наказание (табл. 7-1). Позитивное наказание встречается всякий раз, когда поведение ведет к аверсивному исходу. Вот несколько примеров: если дети плохо себя ведут, их шлепают или бранят; если студенты пользуются шпаргалками на экзамене, их исключают из вуза или школы; если взрослых ловят на краже, их штрафуют или сажают в тюрьму. Негативное же наказание встречается всякий раз, когда за поведением следует устранение (возможного) позитивного подкрепляющего стимула. Например, детям запрещают смотреть телевизор из-за плохого поведения. Широко используемый подход к негативному наказанию - методика приостановки. В соответствии с этой методикой человека моментально удаляют из ситуации, в которой доступны определенные подкрепляющие стимулы. Например, непослушного ученика четвертого класса, мешающего занятиям, могут выгнать из кабинета.

<Физическая изоляция - это один из способов наказания с целью предотвратить проявления нежелательного поведения.>

Негативное подкрепление. В отличие от наказания, негативное подкрепление - это процесс, в котором организм ограничивает аверсивный стимул или избегает его. Любое поведение, которое препятствует аверсивному положению дел, таким образом чаще повторяется и является негативно подкрепленным (см. табл. 7-1). Поведение ухода - это тот самый случай. Скажем, человек, который прячется от палящего солнца, уходя в помещение, скорее всего снова пойдет туда, когда солнце вновь станет палящим. Следует заметить, что уход от аверсивного стимула не то же самое, что избегание его, поскольку аверсивный стимул, которого избегают, физически не представлен. Следовательно, другой способ бороться с неприятными условиями - научиться избегать их, то есть вести себя так, чтобы предотвратить их появление. Эта стратегия известна как научение избегания. Например, если учебный процесс позволяет ребенку избежать домашнего задания, негативное подкрепление используется для усиления интереса к обучению. Поведение избегания также имеет место, когда наркоманы разрабатывают искусные планы, с тем чтобы сохранить свои привычки, но не довести дело до аверсивных последствий - тюремного заключения.

Таблица 7-1. Позитивное и негативное подкрепление и наказание

Как подкрепление, так и наказание могут выполняться двумя способами, это зависит от того, что следует за реакцией: предъявление или устранение приятного или неприятного стимула. Обратите внимание на то, что подкрепление усиливает реакцию; наказание - ослабляет ее.

Скиннер (Skinner, 1971, 1983) боролся с использованием всех форм контроля поведения, основанных на аверсивных стимулах. Он особо выделял наказание как неэффективное средство контроля поведения. Причина в том, что из-за своей угрожающей природы тактика наказания нежелательного поведения может вызвать отрицательные эмоциональные и социальные побочные эффекты. Тревога, страх, антисоциальные действия и потеря самоуважения и уверенности - это только некоторые возможные негативные побочные явления, связанные с использованием наказания. Угроза, внушаемая аверсивным контролем, может также подтолкнуть людей к моделям поведения даже более спорным, чем те, за которые их первоначально наказали. Рассмотрим, например, родителя, который наказывает ребенка за посредственную учебу. Позже, в отсутствии родителя, ребенок может вести себя еще хуже - прогуливать уроки, шататься по улицам, портить школьное имущество. Вне зависимости от исхода ясно, что наказание не принесло успеха в выработке желаемого поведения у ребенка. Так как наказание может временно подавлять нежелательное или неадекватное поведение, основным возражением Скиннера было то, что поведение, за которым последовало наказание, скорее всего вновь появится там, где отсутствует тот, кто может наказать. Ребенок, которого несколько раз наказали за сексуальную игру, совсем необязательно откажется от ее продолжения; человек, которого посадили в тюрьму за жестокое нападение, не обязательно будет меньше склонен к жестокости. Поведение, за которое наказали, может опять появиться после того, как исчезнет вероятность быть наказанным (Skinner, 1971, p. 62). Этому легко можно найти примеры в жизни. Ребенок, которого отшлепают за то, что он ругался в доме, может свободно это делать в другом месте. Водитель, оштрафованный за превышение скорости, может заплатить полицейскому и продолжать свободно превышать скорость, когда поблизости нет патруля с радаром.

Вместо аверсивного контроля поведения Скиннер (Skinner, 1978) рекомендовал позитивное подкрепление , как наиболее эффективный метод для устранения нежелательного поведения. Он доказывал, что, поскольку позитивные подкрепляющие стимулы не дают негативных побочных явлений, связанных с аверсивными стимулами, они более пригодны для формирования поведения человека. Например, осужденные преступники содержатся в невыносимых условиях во многих карательных учреждения (свидетельство тому - многочисленные тюремные бунты в Соединенных Штатах за последние несколько лет). Очевидно, что большинство попыток реабилитировать преступников провалились, это подтверждает высокий уровень рецидивов или повторных нарушений закона. Применив подход Скиннера, можно было бы так урегулировать условия окружения в тюрьме, чтобы поведение, напоминающее поведение законопослушных граждан, позитивно подкреплялось (например, научение навыкам социальной адаптации, ценностям, отношениям). Подобная реформа потребует привлечения экспертов по поведению, имеющих знания о принципах научения, личности и психопатологии. С точки зрения Скиннера, такую реформу можно было бы успешно выполнить, используя уже имеющиеся ресурсы и психологов, обученных методам бихевиоральной психологии.

Скиннер показал возможности позитивного подкрепления, и это повлияло на стратегии поведения, используемые в воспитании детей, в образовании, бизнесе и промышленности. Во всех этих областях появилась тенденция к все большему поощрению желательного поведения, а не наказанию нежелательного.

Генерализация и различение стимулов.

Логическим расширением принципа подкрепления является то, что поведение, усиленное в одной ситуации, весьма вероятно повторится, когда организм столкнется с другими ситуациями, напоминающими ее. Если бы это было не так, то наш поведенческий набор был бы так сильно ограничен и хаотичен, что мы бы, возможно, проснувшись утром, долго размышляли над тем, как реагировать должным образом на каждую новую ситуацию. В теории Скиннера тенденция подкрепленного поведения распространяться на множество подобных положений называется генерализацией стимула . Этот феномен легко наблюдать в повседневной жизни. Например, ребенок, которого похвалили за утонченные хорошие манеры дома, будет обобщать это поведение в соответствующих ситуациях и вне дома, такого ребенка не нужно учить, как прилично вести себя в новой ситуации. Обобщение стимула также может быть результатом неприятного жизненного опыта. Молодая женщина, изнасилованная незнакомцем, может генерализировать свой стыд и враждебность по отношению ко всем лицам противоположного пола, так как они напоминают ей о физической и эмоциональной травме, нанесенной незнакомцем. Подобно этому, единственного случая испуга или аверсивного опыта, причиной которого явился человек, принадлежащий к определенной этнической группе (белый, черный, латиноамериканец, азиат), может быть достаточно для индивида, чтобы создать стереотип и таким образом избежать будущих социальных контактов со всеми представителями данной группы.

Хотя способность обобщать реакции - важный аспект многих наших повседневных социальных интеракций, все же очевидно, что при адаптивном поведении нужно обладать способностью делать различия в разных ситуациях. Различение стимула , составная часть обобщения, - это процесс научения реагировать адекватным образом в различных ситуациях окружения. Примеров множество. Автомобилист остается в живых в час пик благодаря тому, что различает красный и зеленый цвета светофора. Ребенок учится различать домашнюю собачку и злобного пса. Подросток учится различать поведение, находящее одобрение у сверстников, и поведение, раздражающее и отчуждающее других. Диабетик сразу обучается различать пищу, содержащую много и мало сахара. В самом деле, практически все разумное поведение человека зависит от способности делать различение.

Способность к различению приобретается через подкрепление реакций в присутствии одних стимулов и неподкрепление их в присутствии других стимулов. Различительные стимулы таким образом дают нам возможность предвидеть вероятные результаты, связанные с изъявлением особой оперантной реакции в различных социальных ситуациях. Соответственно, индивидуальные вариации различительной способности зависят от уникального прошлого опыта различных подкреплений. Скиннер предположил, что здоровое личностное развитие происходит в результате взаимодействия генерализирующей и различительной способностей, с помощью которых мы регулируем наше поведение так, чтобы максимизировать позитивное подкрепление и минимизировать наказание.

Последовательное приближение: как заставить гору прийти к Магомету.

Первые опыты Скиннера в области оперантного научения были сфокусированы на реакциях, обычно изъявляемых со средней или высокой частотой (например, клевок голубя по ключу, нажатие рычага крысой). Однако вскоре стало очевидным, что стандартная методика оперантного научения плохо подходила для большого числа сложных оперантных реакций, которые могли спонтанно встречаться с вероятностью, равной почти нулю. В сфере поведения человека, например, сомнительно, что с помощью общей стратегии оперантного научения можно было бы успешно научить пациентов психиатрического отделения приобретать соответствующие навыки межличностного общения. Для того, чтобы облегчить эту задачу, Скиннер (Skinner, 1953) придумал методику, при которой психологи могли эффективно и быстро уменьшить время, требуемое для обусловливания почти любого поведения в том наборе, которым располагал человек. Эта методика, названная методом успешного приближения , или формированием поведения , состоит из подкрепления поведения, наиболее близкого к желаемому оперантному поведению. К этому приближаются шаг за шагом, и поэтому одна реакция подкрепляется, а затем подменяется другой, более близкой к желаемому результату.

Скиннер установил, что процесс формирования поведения обусловливает развитие устной речи. Для него язык - это результат подкрепления высказываний ребенка, представленных первоначально вербальным общением с родителями, братьями и сестрами. Таким образом, начинаясь с довольно простых форм лепета в младенчестве, детское вербальное поведение постепенно развивается, пока не начинает напоминать язык взрослых. В «Вербальном поведении» Скиннер дает более подробное объяснение тому, как «законы языка», подобно любому другому поведению, постигаются с помощью тех же самых оперантных принципов (Skinner, 1957). И, как можно было ожидать, другие исследователи поставили под сомнение утверждение Скиннера, что язык - это просто продукт вербальных высказываний, выборочно подкрепленных в течение первых лет жизни. Ноэм Хомский (Chomsky, 1972), один из наиболее строгих критиков Скиннера, утверждает, что большую скорость усвоения вербальных навыков в раннем детстве никак нельзя объяснить в терминах оперантного научения. С точки зрения Хомского, особенности, которыми обладает мозг при рождении, являются причиной того, что ребенок приобретает язык. Другими словами, существует врожденная способность усваивать сложные правила разговорного общения.

Мы закончили краткий обзор научающе-бихевиорального направления Скиннера. Как мы увидели, Скиннер не считал необходимым рассматривать внутренние силы или мотивационные состояния человека в качестве причинного фактора поведения. Скорее он сосредотачивался на взаимоотношениях между определенными явлениями окружения и открытым поведением. Далее, он придерживался мнения, что личность - это не что иное как определенные формы поведения, которые приобретаются посредством оперантного научения. Добавляют что-то эти рассуждения к всеобъемлющей теории личности или нет, но Скиннер имел глубокое влияние на наши представления о проблемах научения человека. Философские положения, лежащие в основе системы взглядов Скиннера на человека, четко отделяют его от большинства персонологов, с которыми мы уже познакомились.

Беррес Фредерик Скиннер — один из величайших психологов XX века. Его книги достойны отдельного повествования. Этот выдающийся человек был удостоен множества наград и премий. Включая премию Торндайка.

Одними из самых известных книг являются «Бихеворизм» Скиннера и «По ту сторону свободы и достоинства».

Кто такой Скиннер?

Выдающийся американский психолог, живший в XX веке. Он внес значительный вклад в развитие бихевиоризма. Наибольшую известность приобрел благодаря своей теории оперантного обусловливания. Кроме достижений в психологии, Беррес Скиннер был прекрасным изобретателем. Одним из изобретений ученого является ящик, названный в его честь — ящик Скиннера. Эта конструкция предназначена для изучения принципов оперантного научения.

Скиннер стал первопроходцем в работе функционального анализа. Именно он предложил его в качестве метода исследования поведения.

Известно, что в 1958 году знаменитому психологу была вручена премия «За выдающийся вклад в развитие науки». И вручила эту премию Американская Психологическая Ассоциация. Отмечалось, что мало кто из психологов Америки смог внести такой значительный вклад в развитие психологии.

В 1972 году эта же Ассоциация признала Берреса Фредерика Скиннера самым выдающимся психологом XX века. Вторую строчку в ту пору занял З. Фрейд.

На счету сотни статей и несколько десятков научных книг.

Теория бихевиоризма Скиннера — это прорыв в науке психологии. И она будет рассмотрена ниже.

Что такое бихевиоризм?

С английского behavior слово переводится как «поведение». Таким образом, бихевиоризм Скиннера — это не что иное, как изучение поведения под воздействием определенных факторов окружающей среды.

Оперантное поведение

Оперантный бихевиоризм Скиннера, или оперантное поведение — это какие-либо действия, направленные на достижение определенной цели. Оно находится под действием предшествующих факторов и последствий.

Таким образом, теория следующая: процесс обучения, основанный на действиях предшествующих факторов и последствий.

Последствия формируют И следовательно, его частота в будущем увеличивается или уменьшается.

Предшествующие факторы влияют на проявление поведения в настоящем времени.

Кратко о бихевиоризме Скиннера: формирование оперантного поведения происходит в следствие «оперирования последствиями». То есть создаются определенные условия в окружающей среде.

Создание условий

Эти условия, согласно бихевиоризму Скиннера, создаются с помощью положительных или отрицательных усилений (подкреплений). Положительное подкрепление усиливает проявление того или иного поведения в дальнейшем. Отрицательное, наоборот, гасит его.

К примеру, ребенок постоянно капризничает в магазине. Мама покупает ему шоколадку или игрушку, малыш прекращает свои капризы. Шоколадка и есть положительное подкрепление в данной ситуации для маленького капризули. У него уже выработался четкий алгоритм поведения, и ребенок знает, что стоит ему начать истерику в магазине, он получит за это своеобразное усиление.

Иной пример. Ребенок закатывает истерику в магазине. Мама игнорирует. Ребенок еще сильнее кричит, пытается упасть на пол и биться в истерике. Мама сильно шлепает его и уводит из магазина, ничего не купив. Во второй раз малыш опять включает такую систему поведения, и опять получает шлепок. Вряд ли на третий раз ему захочется быть отшлепанным. Ребенок начинает вести себя спокойно в магазине, не пытаясь капризничать. А почему? Потому что шлепок — отрицательное подкрепление. И малышу не нравится этот метод, поэтому он будет стараться избежать его в дальнейшем.

Усиление поведения

Принцип усиления поведения — это процесс, который происходит в окружающей среде, после того, как поведение уже образовалось и проявилось.

Усиление происходит сразу после проявления поведения.

Положительное усиление — это проявление стимула после демонстрации поведения. Оно приводит к его усилению в будущем.

Отрицательное усиление — это стимул, который дается сразу после проявления поведения, и снижает его последующую возможность возникновения.

Согласно оперантному бихевиоризму Скиннера, отрицательное усиление — это освобождение. Получив его однажды, человек в дальнейшем будет стремиться освободиться от усиления неприятного стимула.

Виды процессов усиления

Бихевиоризм Б. Скиннера говорит о двух видах данных процессов: непосредственные и опосредственные. Первые являются процессами, при которых задействованы внешние раздражители окружающей среды, имеющие непосредственное влияние на человека. Они, в свою очередь, подразделяются на:

Положительные — внимание, сон, еда.
Отрицательные — избегание неприятного человека.

Непосредственные процессы — автоматические. Они, как и опосредственные подразделяются на положительные и отрицательные.

Процессы ослабления поведения

Бихевиоризм Скиннера включает в себя и процессы ослабления. Что это такое? Это процесс наказания или ослабления, который происходит после того, как поведение проявилось. И приводит он к ослаблению нежелательного поведения в будущем.

Данные процессы подразделяются на положительные и отрицательные.

Положительное ослабление — процесс, при котором после проявления поведения предоставляется неприятный стимул, приводящий к уменьшению и/или сокращению поведения в будущем.

Отрицательное ослабление — процесс ликвидации приятных стимулов после демонстрации нежелательного поведения, для того, чтобы проявление поведения в будущем снизилось или сократилось.

Предшествующие факторы

К одной из стадий бихевиоризма Скиннера относятся различные стимулы и мотивационные операции.

Мотивационные операции увеличивают или уменьшают эффективность того или иного стимула для усиления или ослабления поведения. Подразделяются на побуждающие и подавляющие.

Побуждающие повышают мотивационную ценность. А значит, вероятность возникновения поведения увеличивается.

Подавляющие, в свою очередь, понижают мотивационную ценность стимула, уменьшая вероятность возникновения того или иного поведения.

Стимулы

Они оказывают влияние на поведение вследствие прошлого опыта. Их можно разделить на три варианта.

После поведения произойдет усиливающее последствие.
Усиливающего последствия не произойдет.
Произойдет неприятное последствие, которое приведет к ослаблению поведения в будущем.

То есть, первый вариант — это побуждающее воздействие. Поведение будет происходить с большей вероятностью, так как оно усиливалось в прошлом в присутствии данного стимула.

Второй вариант — подавляющее воздействие. Поведение не будет происходить, так как в прошлом, при воздействии данного стимула, произошел процесс гашения.

Третий вариант — запрещающее воздействие. Поведение не будет происходить потому, что в прошлом в присутствии данного стимула появился неприятный стимул, который ослабил это.

Радикальный бихевиоризм Скиннера

Чтобы понять, что это такое, нужно знать его отношение к теории З. Фрейда. Скиннер считал, что тот сделал колоссальное открытие относительно того, что человеческое поведение, по большей мере, обусловлено бессознательными причинами. Однако в корне не соглашался с Фрейдом по поводу его изобретения психического аппарата и сопутствующих процессов для объяснения поведения человека.

По мнению Скиннера, процессы поведения не имеют ничего общего с поведением. Психические звенья создают лишь проблему для объяснения поведения.

Скиннер считал, что рефлекс — это понятие соотношения между стимулом и ответом на этот стимул. Таким образом, если организм получает подкрепление за свое поведение, то происходит его усиление. Организм запоминает их, и соответственно, идет заучивание и становление определенного вида поведения. Если же подкрепление отсутствует, то поведенческие акты, ничем не подкрепленные, исчезают из репертуара поведения организма.

Это можно назвать рефлекторным поведением или невольным. Его основное отличие от оперантного в том, что последнее нельзя вызвать. Оно добровольное. А рефлекторное поведение вызывается тем или иным стимулом, неважно, условным или безусловным. Эта теория совпадала с мнением русского ученого И. Павлова.

Управление человеком

Воспитание в Б. Скиннера основано на том, что личность человека — это совокупность физических реакций, возникающих при наличии предшествующих факторов и последствий.

Человеческое поведение формируется согласно подкреплениям. Чаще всего, на основе положительного. Может формироваться и под воздействием отрицательного подкрепления.

Зная это, поведением человека можно управлять, основываясь на:

Положительном подкреплении верных реакций. Это способствует их закреплению в поведении личности.
Субъективной ценности подкрепления. То есть исходя из того, что является наиболее стимулирующим для данной личности.
Оперантное обусловливание. Личность знает, что за ее поведением может последовать отрицательное подкрепление. Чтобы избежать негативных последствий, человек вполне способен отказаться от конкретного вида поведения.
Субъективная вероятность последствий. Если человек осознает то, что вероятность возникновения отрицательного подкрепления от его действий мала, он готов рисковать.
Подражание. Людям свойственно бессознательное подражание тем, кого они считают своим авторитетом.
Тип личности. Управлять теми, кто склонен перекладывать ответственность за свои поступки и действия на других людей и жизненные обстоятельства, гораздо легче. Такой тип личности называется экстерналами. Интерналы, наоборот, берут всю ответственность за происходящее с ними только на себя.

По ту сторону свободы и достоинства

Говоря о Скиннере, сложно не упомянуть об этой книге. В ней переворачиваются все прежние ценности и идеалы обычного человека. Автор четко и ясно излагает, как можно управлять людьми. Что такое деньги, например. Они благо для людей или способ воздействия на толпу? Или как принудить человека работать? Достаточно платить ему ежемесячную зарплату в таком объеме, чтобы хватило лишь на еду. Этот прием известен еще со времен Древнего Рима, где люди работали за еду. Сейчас в ее роли выступают шуршащие бумажки.

Какова ценность человеческой жизни, а главное — как пересмотреть собственные взгляды и решиться изменить привычный уклад? Беррес Фридерик Скиннер дает конкретные и очень четкие ответы за эти вопросы в своей книге. Для тех, кто хочет что-то изменить в своей жизни, она станет отличным толчком к действиям.

Заключение

Итак, мы рассмотрели бихевиоризм Скиннера в психологии. Какова основная мысль статьи? Человеческое поведение формируется под воздействием внешней окружающей среды. Эту среду можно создавать искусственным путем, и тем самым управлять человеком, опираясь на 6-ти принципах.

Второстепенная мысль — положительное и отрицательное подкрепление играет огромную роль в формировании поведенческих актов. Если дать за определенное поведение положительное подкрепление, то оно усилится в дальнейшем. Отрицательное подкрепление, наоборот, способствует уменьшению или исчезновению поведения в будущем.

В основании теории оперантного обусловливания Скиннера лежит тот простой факт, что не всегда действия живого существа являются реакцией на ту или иную комбинацию внешних воздействий - стимулов. Довольно часто (по мнению Скиннера , в большинстве случаев) поведение выглядит так, как будто бы ему не предшествуют никакие видимые стимулы. В знаменитых опытах Скиннера лабораторная крыса помещалась в пустой ящик с педалью внутри (так называемый "ящик Скиннера ") и получала полную свободу действий. В процессе хаотичного исследования ящика крыса неизбежно задевала педаль и получала порцию пищи. После нескольких случайных нажатий на педаль у крысы формировалась новая форма поведения, которая не была связана ни с какими предшествующими стимулами. Теперь, проголодавшись, крыса целенаправлено следовала к педали и, нажав на нее - получала желаемое. Таким образом, ключевое отличие оперантного обусловливания от классического состоит в том, что в случае оперантного обусловливания живой организм своим поведением активно воздействует на окружающую среду и сталкивается с теми или иными последствиями. В случае формирования условного рефлекса такого воздействия не наблюдается. Животные в опытах Павлова были специально, в целях соблюдения чистоты эксперимента, лишены какой-либо возможности влиять на окружение. В этом смысле оперантное поведение активно и направлено на исследование окружающего мира, респондентное поведение реактивно и лишь следует тем или иным воздействиям, в процессе классического обусловливания, приобретшим для организма определенное сигнальное воздействие. Но сама по себе исследовательская активность ничего не дает - она лишь увеличивает шансы встретить те или иные последствия. То, каким образом видоизменяется поведение, зависит в первую очередь от характера последствий - от того, будут эти последствия приятными или неприятными. Приятные последствия Скиннера называл "подкреплением". Экспериментируя с разными типами подкрепления, Скиннер вывел одну бесспорную и всегда воспроизводимую закономерность: образцы поведения (операнты), вслед за которыми следуют приятные последствия, в будущем встречаются чаще. Крыса чаще нажимает на педаль, если непосредственно вслед за этим действием она получает кусочек пищи. Голубь, помещенный в клетку, на полу которой имеется красное пятно, лишь случайным образом может клюнуть в него. Но если сразу вслед за этим он получит пищу - зернышко, то этот оперант (действие в расчете на успех) будет чаще встречаться в будущем. Человек, которого вкусно накормят в одном из ресторанов города, будет чаще ходить в этот ресторан, даже если он довольно далеко расположен от дома. Эту закономерность Скиннер назвал "законом выгоды (приобретения)", иногда его еще называют первым законом оперантного научения . Закон приобретения означал для Скиннера и его последователей следующее: если перед терапевтом или учителем встает задача сформировать новые привычки, новые образцы поведения, то единственный способ, который дает предсказуемые и надежные результаты, состоит в том, что мы специально создаем позитивные последствия для так называемого "целевого" поведения, т.е. поведения, с которым мы бы хотели чаще встречаться впредь. Подкрепляя это поведение, мы обязательно добьемся своего: это поведение будет встречаться чаще.

Последнее обновление: 09/12/2018

Оператное научение включает в себя систему поощрений и наказаний с целью усилить или прекратить определенный тип поведения.

Оперантное научение – это метод обучения, который происходит посредством вознаграждения и наказания за определенный тип поведения. Суть оперантного научения заключается в том, чтобы установить ассоциативную связь между поведением и следствием этого поведения.

Идея оперантного научения принадлежит бихевиористу , поэтому часто этот метод обучения называют методом Скиннера. Скиннер считал, что невозможно объяснить поведение внутренними мыслями и мотивацией. Вместо этого он предложил обратить внимание на внешние причины, влияющие на поведение человека.

Скиннер использовал термин «оперантный» для описания любого поведения, которое под влиянием внешних факторов выливается в определенные последствия. Иными словами, теория Скиннера объясняет, как мы приобретаем различные повседневные привычки и модели поведения.

Примеры оперантного научения

На самом деле, примеров оперантного научения вокруг нас множество: школьник, который делает домашнее задание, чтобы получить награду от родителей, или сотрудники, которые работают над проектом ради повышения зарплаты или продвижения по службе.
Эти примеры показывают нам, что перспектива награды способствует выполнению задания, но оперантное научение также может использоваться, чтобы отучить человека от чего-либо посредством наказания или лишения желаемого. Например, детей можно отучить разговаривать в классе, если лишить их за это возможности играть на большой перемене.

Компоненты оперантного научения

Подкрепление – это любое действие, которое будет влиять на развитие определенной модели поведения. Существует два вида подкрепления:
Позитивное подкрепление – это вознаграждение, которое используется для поощрения желаемого поведения: например, похвала или награда.
Негативное подкрепление – это неприятные действия или результаты, которые прекращаются или снижаются для поощрения желаемого поведения.
Оба вида подкрепления используются, чтобы поощрять определенную модель поведения.

Наказание – это неприятные действия, которые предпринимаются для того, чтобы прекратить нежелательную модель поведения.

Существует два вида наказаний:

Позитивное наказание подразумевает использование нежелательного действия, чтобы ослабить последующую за ним реакцию.
Негативное наказание подразумевает собой прекращение желаемого действия или лишение желаемого предмета в случае проявления поведения, от которого необходимо отучить.

Оба вида наказания направлены на то, чтобы ослабить нежелательную модель поведения.

Следующая теория, которая будет рассмотрена в данном реферате, это - Теория оперантного научения Б.Ф. Скиннера, мне бы хотелось остановиться на настоящей концепции, потому что работы этого персонолога наиболее убедительно доказывают, что воздействие окружающей среды определяет поведение человека. Эта теория относится к научающе - бихевиоральному направлению в теории личности. Личность, с точки зрения научения - это тот опыт, который человек приобрёл в течение жизни. Это накопленный комплект моделей поведения. Научающе - бихевиоральное направление в теории личности занимается доступными непосредственному наблюдению (открытыми) действиями человекаё как производными от его жизненного опыта. Теоретики научающе - бихевиорального направления не призывают задумываться над психическими структурами и процессами скрытыми в " разуме", а наоборот, принципиально рассматривают внешнее окружение, как ключевой фактор человеческого поведения. Именно окружение, а не внутренние психические явления формирует человека.

Беррес Фредерик Скиннер родился в 1904 году в Саскуэханне, штат Пенсильвания. Атмосфера в его семье была тёплой и непринужденной, дисциплина была довольно строгой, а награды давались, когда их заслуживали. Мальчишкой он много времени проводил за конструированием всевозможных механических устройств.

В 1926 году в Гамильтоновском колледже, Скиннер получил степень бакалавра гуманитарных наук по английской литературе. После учёбы он вернулся в родительский дом, попытался стать писателем, но из этой затеи, к счастью, ничего не вышло. Затем Беррес Фредерик поступил в Гарвардский университет для изучения психологии, в 1931 году он был удостоен степени доктора наук.

С 1931 по 1936 год Скиннер занимался в Гарварде научной работой, а с 1936 по 1945 год преподавал в Миннесотском университете. В этот период он много и плодотворно работал и приобрёл известность, как один из ведущих бихевиористов США. А с 1945 по 1947 год занимал должность руководителя кафедры психологии в Университете штата Индианы, после чего, до ухода на пенсию в 1974 году, проработал лектором в Гарвардском университете.

Научная деятельность Б.Ф. Скиннера была отмечена многими наградами, в частности Президентской медалью за науку, а в 1971 году - золотой медалью Американской психологической ассоциации. В 1990 году он получил благодарность президента Американской психологической ассоциации - за прижизненный вклад в психологию.

Скиннер был автором многих трудов: "Поведение организмов" (1938), "Уолден - 2" (1948), "Вербальное поведение" (1957), "Технологии обучения" (1968), "Портрет бихевиориста" (1979), "К дальнейшим размышлениям" (1987) и других. Он умер в 1990 году от лейкемии.

Научающе - бихевиоральный подход к личности, разрабатываемый Б.Ф. Скиннером, относится к открытым действиям человека в соответствии с его жизненным опытом. Он утверждал, что поведение детерминировано (т.е. обусловлено воздействием каких-то событий и не проявляется открыто), предсказуемо и контролируется окружением. Скиннер решительно отметал идею о внутренних "автономных" факторов в качестве причины действий человека и пренебрегал физиолого-генетическим объяснением поведения.

Скиннер признавал два основных типа поведения:

1. Респондентное, (специфическая реакция, которая испускается известным стимулом, который всегда предшествует этой реакции) как ответ на знакомый стимул.
2. Оперантное, (реакции, свободно изъявляемые организмом, на частоту которых сильно влияет применение различных режимов подкрепления) определяемое и контролируемое результатом, следующим за ним.

Его работа почти полностью сосредоточена на оперантном поведении. При оперантном научении организм действует на окружение, производя результат, который влияет на вероятность того, что поведение повторится. Оперантная реакция, за которой следует положительный результатё старается повториться, а оперантная реакция, за которой следует отрицательный результат, старается не повториться. По Скиннеру, поведение лучше всего можно понять в терминах реакций на окружение.

Подкрепление - ключевая теория системы Скиннера. Подкреплениеё в классическом понимании - ассоциация, образующаяся при неоднократном объединении условного стимула с безусловным. Оперантном научении - ассоциация, образующаяся тогда, когда за оперантной реакцией следует подкрепляющий стимул. Были описаны четыре различных режима подкрепления, имеющие своим результатом различные формы реагирования: с постоянным соотношением, с постоянным интервалом, с вариативным соотношением, с вариативным интервалом. Было проведено различие между первичным (безусловным) и вторичным (условным) подкрепляющими стимулами. Первичное подкрепление - это любое событие или объект, обладающие врождёнными подкрепляющими свойствами. Вторичное подкрепление - это любой стимул, приобретающий подкрепляющие свойства посредством тесной ассоциации с первичным подкреплением в прошлом научающем опыте организма. В теории Скиннера, вторичные подкрепляющие стимулы (деньги, внимание, одобрение) сильно влияют на поведение человека. Он также считал, что поведение контролируется аверсивными (в пер. с лат. - отвращение) стимулами, такими как наказание (следует за нежелательным поведением и уменьшает вероятность повторения такого поведения) и негативное подкрепление (состоит в устранении неприятного стимула после получении желаемой реакции). Позитивное наказание (предъявление аверсивного стимула при реакции) имеет место, когда за реакцией следует неприятный стимул, а негативное наказание состоит в том, что за реакцией происходит удаление приятного стимула, а негативное подкрепление встречается тогда, когда организму удается ограничить или избежать предъявления аверсионного стимула. Б.Ф. Скиннер боролся с использованием аверсивных методов (особенно наказания) в контроле поведения и придавал большое значение контролю посредством позитивного подкрепления (предъявление приятного стимула после реакции, повышающее вероятность её повторения).

В оперантном научении генерализация стимула происходит при подкреплении реакции, когда один стимул встречается вместе с другими подобными стимулами. Дискриминация стимулов, с другой стороны, состоит в том, чтобы реагировать по-разному на различные стимулы окружения. И то, и другое обязательно для эффективного функционирования. Метод последовательных приближений или формирования, включает подкрепление в том случае, когда поведение становится похожим на желаемое. Скиннер был убеждён, что вербальное поведение, а также язык, приобретается через процесс подкрепления. Скиннер отрицал все внутренние источники поведения.

Концепция оперантного научения не раз подвергалась экспериментальной проверке. Подход Б.Ф. Скиннера к бихевиоральным исследованиям характеризуется изучением одного субъекта, использованием автоматизированного оборудования и чётким контролем условий окружения. В виде наглядного примера было показано исследование эффективности жетонной системы вознаграждения для получения лучших форм поведения в группе госпитализированных психиатрических пациентов.

Современное применение принципов оперантного научения довольно обширно. Две основные области такого применения:

1. Обучение навыкам общения - методика бихевиоральной терапии, разработанная для улучшения межличностных навыков клиента в интеракциях реальной жизни.
2. Биологическая обратная связь - тип бихевиоральной терапииё при использовании которой клиент учится контролировать некоторые функции своего организма (например, артериальное давление) при помощи специального оборудования, обеспечивающего информацию о процессах происходящих внутри тела.

Бихевиоральная терапия - это набор терапевтических методик для изменения плохо приспособленного или нездорового поведения посредством применения принципов оперантного научения.

Предполагают, что тренировка уверенности в себе, основанная на методиках репетиции поведения (методика тренировки уверенности в себе, при использовании которой клиент учится интерперсональным (межличностными) навыкам в структурных ролевых играх) и самоконтроля, очень полезна для того чтобы каждый человек вёл себя более успешно в различных общественных интеракциях. Оказывается, что тренинг с биологической обратной связью эффективен при лечении мигрени, тревоги, мышечного напряжения и гипертензии. Однако остаётся неясным, как биологическая обратная связь фактически позволяет производить контроль над непроизвольными функциями тела.

Труды Б.Ф. Скиннера наиболее убедительно доказывают, что воздействия окружающей среды определяют наше поведение. Скиннер утверждал, что поведение почти полностью непосредственно обусловлено возможностью подкрепления из окружающей среды. По его мнению, для того чтобы объяснить поведение (и таким образом понять личность), исследователю нужно только проанализировать функциональные отношения между видимыми действиями и видимыми последствиями. Работа Скиннера послужила фундаментом для создания науки о поведении, не имеющей аналогов в истории психологии. По представлению многих, он является одним из самых высокочтимых психологов нашего времени.