С моей точки зрения существуют десять правил, управляющих процессом выработки. Некоторые - по крайней мере четыре первых - берут начало из психологических лабораторий и установлены экспериментально. Другие, насколько мне известно, даже не являлись предметом специального изучения, но рассматриваются всеми, кто имел дело с выработкой поведения, как неотъемлемая особенность: вы всегда знаете (обычно слишком поздно), когда вы нарушили одно из них. Я перечислю эти правила, а затем несколько подробнее остановлюсь на каждом из них:
1. Повышайте критерий небольшими градациями, чтобы у субъекта всегда была реальная возможность выполнить требуемое и получить подкрепление.
2. В конкретный промежуток времени отрабатывайте что-нибудь одно, не пытайтесь формировать поведение по двум критериям одновременно.
3. Прежде чем увеличивать или повышать критерий, пользуйтесь подкреплением текущего уровня ответа, т.е. подкрепляйте любое исполнение данного действия, имеющегося в данный момент.
4. Вводя новый критерий, временно ослабьте старые.
1. Повышайте критерий небольшими градациями, чтобы у субъекта всегда была реальная возможность выполнить требуемое и получить подкрепление.
2. В конкретный промежуток времени отрабатывайте что-нибудь одно, не пытайтесь формировать поведение по двум критериям одновременно.
3. Прежде чем увеличивать или повышать критерий, пользуйтесь подкреплением текущего уровня ответа, т.е. подкрепляйте любое исполнение данного действия, имеющегося в данный момент.
4. Вводя новый критерий, временно ослабьте старые.
Есть два аспекта выработки: первый способ и приемы, то есть последовательность шагов, необходимых для выработки типа поведения, и второй - закономерности или правила, предписывающие, как, когда и почему эти типы поведения должны подкрепляться.
Большинство тренеров, большинство книг о тренировке и большинство тех, кто обучает тренеров,- имеет дело потом исключительно со способом или приемом. "Возьмите в руки клюшку для гольфа как показано на рисунке", "Подведите прицел винтовки под нужное место мишени", "Никогда не наклоняйтесь в горах", "Взбивайте яйца металлическим венчиком по часовой стрелке" Это прекрасно. Эти приемы обычно складываются годами при участии многих людей, путем проб и ошибок, и поэтому они оптимальны. В самом деле вы будете более уверенно сидеть на лошади, если пятки у вас опущены, а мяч для гольфа будет послан вами дальше, если вы хорошенько отклонитесь в сторону замаха. Если вы заинтересованы в том, чтобы овладеть каким-либо навыком, я могу вас уверить, что вы извлечете максимум возможного от устоявшихся приемов выполнения действий, которые включаются в данный навык, почерпнув это из книг, от преподавателей, инструкторов и наблюдая или изучая действия других людей. Другую сторону выработки составляют закономерности, которые регулируют сам процесс обучения: когда надо поднажать, когда подослабить обучение; как наиболее эффективно повышать критерии, что делать, если возникли затруднения, и, вероятно, самое главное - когда остановиться. В этих вопросах обычно полагаются на интуицию и опыт тренеров или инструкторов, на случай или удачу. Между тем именно успешность применения этих закономерностей определяет разницу между просто хорошим и великим преподавателями, между радостным, быстрым и успешным обучением и обучением, приводящим к срывам, медленным, скучным и неприятным. Хороший процесс выработки, а не только хорошие приемы, делают обучение эффективным.
Большинство тренеров, большинство книг о тренировке и большинство тех, кто обучает тренеров,- имеет дело потом исключительно со способом или приемом. "Возьмите в руки клюшку для гольфа как показано на рисунке", "Подведите прицел винтовки под нужное место мишени", "Никогда не наклоняйтесь в горах", "Взбивайте яйца металлическим венчиком по часовой стрелке" Это прекрасно. Эти приемы обычно складываются годами при участии многих людей, путем проб и ошибок, и поэтому они оптимальны. В самом деле вы будете более уверенно сидеть на лошади, если пятки у вас опущены, а мяч для гольфа будет послан вами дальше, если вы хорошенько отклонитесь в сторону замаха. Если вы заинтересованы в том, чтобы овладеть каким-либо навыком, я могу вас уверить, что вы извлечете максимум возможного от устоявшихся приемов выполнения действий, которые включаются в данный навык, почерпнув это из книг, от преподавателей, инструкторов и наблюдая или изучая действия других людей. Другую сторону выработки составляют закономерности, которые регулируют сам процесс обучения: когда надо поднажать, когда подослабить обучение; как наиболее эффективно повышать критерии, что делать, если возникли затруднения, и, вероятно, самое главное - когда остановиться. В этих вопросах обычно полагаются на интуицию и опыт тренеров или инструкторов, на случай или удачу. Между тем именно успешность применения этих закономерностей определяет разницу между просто хорошим и великим преподавателями, между радостным, быстрым и успешным обучением и обучением, приводящим к срывам, медленным, скучным и неприятным. Хороший процесс выработки, а не только хорошие приемы, делают обучение эффективным.
Подкрепить поведение, которое уже имеется, чтобы оно возникало чаще, - это понятно, но как обучающим заставить своих подопечных делать то, что случайно может ни когда и не возникнуть? Как заставить собаку сделать сальто назад или дельфина прыгнуть через обруч?
Когда дело касается собак, делающих сальто, дельфинов, прыгающих через обруч, или людей, бросающих баскетбольный мяч в кольцо, то эти действия уже совершаются в процессе выработки. Выработка же состоит в том, чтобы использовать малейшую тенденцию изменений поведения в нужном направлении и шаг за шагом сдвигать ее к поставленной цели. На лабораторном жаргоне это называется последовательное приближение. Процесс выработки возможен потому, что поведение живых существ вариабельно. Что бы живое существо ни делало, в одних случаях оно выполняет это более энергично, чем обычно, а в других случаях - наоборот. Неважно, сколь сложно и трудно то окончательное поведение, которое вы хотите выработать, вы всегда можете, установить ряд последовательных целей, найти какое-либо поведение, которое осуществляется уже сейчас, и использовать его как первый шаг. Например представим, что я решила обучить цыпленка "танцевать". Я могу начать с наблюдения за естественными движениями цыпленка и давать ему подкрепление всякий раз, как он повернется налево. Скоро первая цель будет достигнута: цыпленок начнет поворачиваться налево гораздо чаще, а вследствие вариабельности эти повороты будут то меньшими, то большими.
Когда дело касается собак, делающих сальто, дельфинов, прыгающих через обруч, или людей, бросающих баскетбольный мяч в кольцо, то эти действия уже совершаются в процессе выработки. Выработка же состоит в том, чтобы использовать малейшую тенденцию изменений поведения в нужном направлении и шаг за шагом сдвигать ее к поставленной цели. На лабораторном жаргоне это называется последовательное приближение. Процесс выработки возможен потому, что поведение живых существ вариабельно. Что бы живое существо ни делало, в одних случаях оно выполняет это более энергично, чем обычно, а в других случаях - наоборот. Неважно, сколь сложно и трудно то окончательное поведение, которое вы хотите выработать, вы всегда можете, установить ряд последовательных целей, найти какое-либо поведение, которое осуществляется уже сейчас, и использовать его как первый шаг. Например представим, что я решила обучить цыпленка "танцевать". Я могу начать с наблюдения за естественными движениями цыпленка и давать ему подкрепление всякий раз, как он повернется налево. Скоро первая цель будет достигнута: цыпленок начнет поворачиваться налево гораздо чаще, а вследствие вариабельности эти повороты будут то меньшими, то большими.
Одним из наиболее полезных практических применений подкрепления является самоподкрепление. Мы им часто пренебрегаем, отчасти потому, что это не приходит нам в голову, отчасти, потому что склонны требовать от себя гораздо больше, чем от других. Как сказал один мой знакомый министр: "Немногие имеют столь низкие критерии, что по ним легко жить". В результате мы часто по нескольку дней не расслабляемся, переходя от одной задачи к другой, от нее к третьей, не замеченные и неотблагодаренные даже самими собой. Не говоря уже о подкреплении себя за изменение какой-либо привычки или приобретение нового навыка, какое-либо подкрепление необходимо и просто для будничной жизни; лишение себя подкреплений, мне кажется, - один из факторов повышения нервозности и депрессий.
Вы можете подкрепить себя здоровыми способами - часом досуга, прогулкой, разговором с друзьями или хорошей книгой; или нездоровыми - сигаретами, виски, пищей, от которой толстеют, наркотиками, сидением допоздна и т.д. Мне нравится высказывание актера Рута Гордона: "Актер должен получать комплименты. Если мне приходится долго обходиться без комплиментов, я хвалю себя сам, и это хорошо хотя бы потому, что при этом я уверен в искренности".
Вы можете подкрепить себя здоровыми способами - часом досуга, прогулкой, разговором с друзьями или хорошей книгой; или нездоровыми - сигаретами, виски, пищей, от которой толстеют, наркотиками, сидением допоздна и т.д. Мне нравится высказывание актера Рута Гордона: "Актер должен получать комплименты. Если мне приходится долго обходиться без комплиментов, я хвалю себя сам, и это хорошо хотя бы потому, что при этом я уверен в искренности".
Собрания участвующих в распродаже, клубы организации рекламы, курсы Дейдла Карнеги, общество контроля за собственным весом, да и большинство организаций, в которых происходит групповое обучение самоусовершенствованию используют в основном влияние подкрепления индивидуума группой. Похвала, медали, церемонии награждения и другие формы группового признания являются мощными подкреплениями, используемыми иногда с большим воображением. Директор фирмы, занимающейся распродажей, желая вознаградить свою "команду" за удачный год, арендовал футбольный стадион, устроил большой праздник для служащих старших администраторов и членов их семей; он сделал так, что комиссионеры выбегали на поле через туннель для игроков, а на табло под аплодисменты всех присутствующих вспыхивали их имена. Несколько лет назад я посещала курсы хозяйствования Вернера Эрхарда, программа не лишена духа торгашества, но с точки зрения обучения это, как мне кажется остроумное, а часто даже блестящее применение формирования и подкрепления. Программа, называлась, и я думаю справедливо, тренировкой. Руководитель назывался тренером. Целью формирования было лучше познать самого себя, а основным подкреплением были не реплики тренера, а поведение всей группы, не имеющее словесного выражения. Чтобы групповое поведение стало подкреплением, 250 человек, составлявших группу, просили аплодировать каждому выступавшему независимо от того, понравилась ли им речь или нет. Таким образом, с самого начала застенчивые были ободрены, смелые вознаграждены, и все выступления, как проникновенные, так и бессодержательные получили признание группы. Поначалу аплодисменты были не более чем обязанностью. Но скоро они стали действительно коммуникативным средством, выражающим не степень удовольствия, как в театре, а оттенки чувств и значений. Например, в нашей группе, а я полагаю, что такое бывает в каждой подобной группе, был заядлый спорщик, который часто подвергал сомнению то, что говорил тренер. Когда это произошло в третий или четвертый раз, тренер вступил с ним в спор. Всем было ясно, что с точки зрения логики любитель споров на этот раз был в общем-то прав. Но поскольку спор тянулся и тянулся, всем остальным в аудитории было все равно, кто прав.
Вот несколько примеров того, чего добились мои знакомые с помощью положительного подкрепления: Джуди, дизайнер по профессии, чтобы оставаться в форме, поступила в вечерний рисовальный класс при соседнем университете, где занятия происходили раз в неделю; из двадцати человек в классе большинство тоже были дизайнерами, либо коммерческими художниками. Преподаватель на неделю задавал домашнюю работу, выполнением которой многие из этих занятых людей себя не утруждали. Преподаватель каждый раз по десяти, а то и более минут разглагольствовал о слабом выполнении домашних заданий. Устав от того, что их без конца бранили, Джуди предложила преподавателю подкреплять тех. Кто принес домашние работы, вместо того чтобы вправлять мозги тем, кто не сделал их. Так он и поступил, подкрепляя своих учеников публичной похвалой за каждое выполненное задание. К третьей неделе в классе не только улучшилось настроение, но и возросло число выполнивших домашнее задание с одной трети до трех четвертей класса. Шеннон, студентка колледжа, пришла в гости к одним знакомым и застала такую сцену. Четверо взрослых безуспешно и не без некоторого риска для себя пытались удержать немецкую овчарку и полечить ее больное ухо. Шеннон, которая не особенно любит собак, но изучает роль положительного подкрепления, достала из холодильника немного сыра и за пять минут научила собаку сидеть смирно, пока она без посторонней помощи обработала ей ухо. Молодая женщина вышла замуж за человека, который очень любил распоряжаться и командовать. Хуже того, и его отец, который жил с ними, тоже взялся помыкать невесткой. Эту историю рассказывала мне мать девушки. Она была в ужасе, когда впервые увидела, что приходится терпеть ее дочери. "Не беспокойся, мама, - сказала дочь, - поживем - увидим". Дочь взяла за правило как можно меньше реагировать на команды и резкие реплики, и одновременно подкреплять послушанием и живостью реакции любое проявление вежливости и внимания со стороны мужчин. За год она превратила их в очень славных людей. Теперь, когда она приходит домой, они встречают ее улыбками, и оба с радостью соглашаются помочь с покупками.
В реальной жизни подкрепления возникают на каждом шагу и часто представляют собой лишь случайное стечение обстоятельств. Один биолог, изучавший ястребов, заметил, что если ястреб поймал под каким-либо кустом мышь, то в течение недели, а иногда и больше, он будет ежедневно проверять этот куст; вероятность его полета именно над этим местом обусловлена силой подкрепления. Попробуйте пройти мимо мусорной корзины, тщательно к ней не приглядываясь, если накануне - нашли в ней пять долларов. Случайное подкрепление полезно для ястреба; вообще можно сказать, что поведение животных эволюционировало так, что каждый вид обладает возможностью извлекать пользу из любого подкрепления. Однако многие случайные подкрепления не сопровождаются полезным результатом, но тем не менее могут оказать сильное влияние на поведение. Когда поведение не связано с последующими событиями, но в мозгу субъекта связывается с ними в качестве необходимого условия их осуществления, говорят о суеверном поведении. Пример этого - человек, грызущий карандаш. Если во время экзамена вам случится взять в рот карандаш и тут же вам придет в голову правильный ответ или хорошая мысль, то такое подкрепление может изменить ваше поведение: хорошие мысли пришли, когда грыз карандаш, таким образом, это действие подкрепляется. Когда я училась в колледже, у меня не было ни одного карандаша, не покрытого отметинами от зубов, - на особенно трудных экзаменах я иногда перегрызла карандаш пополам. Я была уверена, что это помогало мне думать. В действительности же это было всего лишь случайно обусловленное поведение. То же самое можно сказать отношении определенной одежды или совершении некого ритуала перед тем как взяться за какое-либо дело.
Лишь в одном случае не следует прибегать к вариативному режиму подкрепления, после того как поведение заучено, - это когда оно направлено на решение своего рода головоломки или теста. При одном из видов дрессировки собака должна выбирать из нескольких разнородных предметов тот, который побывал в руках у хозяина и хранит его запах. При этом необходимо каждый раз говорить собаке, что она выбрала правильно, чтобы в следующий раз она знала, что надо делать. В тестах на различение, - скажем, идентификация более высокого из двух звуков - необходимо подкреплять каждый правильный ответ испытуемого, чтобы он был постоянно информирован о том, какую задачу он решает (подойдет, конечно, и условное подкрепление). Когда мы отгадываем Кроссворд или составляем картинку-загадку, мы получаем подкрепления за правильные догадки, так как только они являются "подходящими". Если бы при составлении картинки-загадки можно было вставить в одну ячейку несколько кусочков, то положительного подкрепления за правильный выбор, который является обязательной обратной связью в любой ситуации выбора, не получалось бы.
Долговременные программы поведения
В дополнение к вариативному режиму подкреплений можно ввести и закрепленный, при котором субъект знает, что он должен работать определенное время или выполнить определенный комплекс поведенческих реакций за каждое подкрепление. Например, подкрепляя каждый шестой прыжок, можно сделать так, что дельфин будет прыгать шесть раз подряд, и вскоре получим стабильные серии из шести прыжков.
Долговременные программы поведения
В дополнение к вариативному режиму подкреплений можно ввести и закрепленный, при котором субъект знает, что он должен работать определенное время или выполнить определенный комплекс поведенческих реакций за каждое подкрепление. Например, подкрепляя каждый шестой прыжок, можно сделать так, что дельфин будет прыгать шесть раз подряд, и вскоре получим стабильные серии из шести прыжков.
Бытует неправильный взгляд, что если вы начали вырабатывать поведение с помощью положительного подкрепления, то должны продолжать его применение на протяжении всей дельнейшей жизни субъекта, если этого не будет, то поведение исчезнет. Это неверно: постоянное под крепление необходимо только на стадиях обучения. Вы можете несколько раз вознаградить годовалого ребенка за пользование горшком, но как только поведение заучено, предмет обучения сам о себе позаботится. Мы даем или должны давать начинающему множество подкреплений - обучение ребенка езде на велосипеде идет под настоящий поток: "Правильно, крепче держи руль, у тебя получилось, хорошо!" Но вы будете выглядеть довольно глупо (а ребенок решит, что вы сошли с ума), если вы будете продолжать хвалить его после того как навык установился. Для того чтобы поддерживать уже выученное поведение на определенном уровне надежности, не только не надо подкреплять его все время, а даже, наоборот, следует прекратить регулярные подкрепления и перейти на эпизодическое использование подкрепления, подаваемого в случайном и не предсказуемом порядке. Это и есть то, что психологи называют вариабельным режимом подкрепления. Вариабельный режим гораздо более эффективен для поддержания поведения, чем постоянный, предсказуемый. Один психолог объяснил это мне так: если у вас машина новая и всегда хорошо заводилась, а однажды, когда вы сели в нее, повернули ключ, она не завелась, то вы, может быть, и попробуете завести ее еще несколько раз, но скоро решите, что что-нибудь не в порядке, и позвоните в гараж. Поведение, состоящее в поворачивании ключа, при отсутствии ожидаемого немедленного подкрепления быстро угаснет. С другой стороны, если у вас вместо машины старая консервная банка, которая еще ни разу не заводилась с первой попытки, и каждый раз требуется целая вечность для того, чтобы привести ее в движение, вы можете продолжать попытки ее завести в течение получаса; ваше поведение по поворачиванию ключа происходит в низковероятностном режиме подкрепления и поэтому сильнейшим образом поддерживается.
Очень часто, особенно при работе с пищевым подкреплением, его невозможно дать в тот момент, когда субъект делает то, что хотели бы поощрить. Если я учу дельфина прыгать, то я никак не могу дать ему рыбку в тот момент, когда он находится в воздухе. Если за каждым прыжком следует брошенная рыбка (отставленное подкрепление), то у животного в конце концов образуется связь между прыжком и едой, и оно будет прыгать чаще. Однако это не несет информации о том, какой из аспектов прыжка мне нравится. На какую высоту? С каким прогибом? Может, надо войти обратно в воду со всплеском? Таким образом, потребуется очень много повторений, чтобы животное установило, какой именно прыжок я имела в виду. Чтобы обойти эту трудность, мы используем условное подкрепление. Условное подкрепление представляет собой какой-либо изначально ничего незначащий сигнал - звук, свет, движение, - который умышленно связывают с подачей подкрепления. Тренеры дельфинов остановили свой выбор на полицейском свистке: его хорошо слышно даже под водой и он не связывает руки, чтобы можно было давать сигналы и бросать рыбу. С другими животными я обычно использую "сверчка", десятицентовую игрушку, которая щелкает, когда на нее нажимаешь, или особые поощряющие слова, выбранные и приберегаемые для использования в качестве условного подкрепления: "хорошая собака", "хорошая лошадка". Школьные учителя часто прибегают к некоторым таким ритуальным и тщательно нормированным словам похвалы - "замечательно" или "очень хорошо", - за которые дети страстно работают и ждут их. Наша жизнь изобилует условными подкреплениями. Нам нравится слышать, как звонит телефон или видеть набитый почтовый ящик, даже если половина звонков неинтересна и большая часть корреспонденции - утиль, потому что множество случаев научили нас связывать звонок или конверт с хорошим.
Одним из наиболее полезных приемов пищевого или какого-либо другого подкрепления для человека и животных является получение куша. Это награда, которая во много, иногда в 10 раз больше обыкновенного подкрепления и являющаяся сюрпризом для субъекта. В рекламном агентстве, где я когда-то работала, бывали официальные вечера на Рождество, а также неофициальные праздники по поводу окончания большой работы или заполучения нового клиента. Но у председателя правления была еще привычка устраивать в год один-два абсолютно неожиданных вечера. Внезапно в середине дня он проносился по всем комнатам конторы, крича, чтоб все кончали работу. Коммутаторы выключались, появлялась процессия поставщиков провизии, музыканты, буфетчики, шампанское, копченая семга, и все это только для нас и безо всякой особенной причины. Это было неожиданным кушем для пятидесяти человек. Я думаю, что это очень способствовало поднятию духа коллектива. Куш можно использовать и для того, чтоб отметить внезапное озарение. Один мой знакомый наездник, когда лошадь впервые проделывает какой-нибудь сложный маневр, соскакивает с нее, освобождает от седла и уздечки и свободно выпускает на манеж - куш полной свободы, который часто, по-видимому, может привести к образованию новой линии поведения. Как ни странно, получение всего одного куша может так же улучшить ответы непокорного, испуганного или сопротивляющегося субъекта, который вообще не проявлял нужного поведения. В океанариуме "Жизнь моря" мы проводи ли исследования по заданию ВМС США, в которых дельфин получал подкрепление за новые реакции, осуществляемые вместо старого, ранее выработанного поведения. Испытуемой была понятливая самочка по имени Хоу, которая редко давала новые ответы. Когда ей не стало удаваться получать подкрепления за свои действия, она стала неактивной, и в конце концов в течение одного занятия за двадцать минут не дала ни одного ответа. Наконец, тренер кинул ей пару рыбок "ни за что". Явно ошарашенная такой щедростью, Хоу снова стала активной и вскоре выполнила движение, которое можно было подкрепить, что привело к несомненному прогрессу на последующих занятиях.
Начинающие тренеры, использующие пищевое подкрепление при работе с животными, часто не знают, какова должна быть величина каждого подкрепления. Ответ таков: чем меньше, тем лучше. Чем меньше подкрепление, тем быстрее животное съест его. Это не только экономит время, но и позволяет дать большее количество подкреплений за один сеанс, прежде чем животное насытиться. В 1979 г. Национальный зоопарк в Вашингтоне, штат Колумбия, пригласил меня в качестве консультанта для обучения группы работников зоопарка технике положительного подкрепления. Одна из смотрительниц в моей группе жаловалась, что обучение панды продвигается у нее очень медленно. Мне показалось это странным, потому что интуитивно я чувствовала, что панды - эти большие, прожорливые, активные животные - должны легко поддаваться обучению с пищевым подкреплением. Я понаблюдала за ее занятиями и обнаружила, что, когда смотрительнице удавалось добиться какого-либо движения, она давала панде целую морковку. Панда долго смаковала каждую морковку, поэтому в течение пятнадцати минут отведенного ей драгоценного времени она зарабатывала только три подкрепления (а, кроме того, морковь ей надоедала). Один ломтик моркови на подкрепление был бы лучше.