Условное подкрепление. Не рычите на собаку. О дрессировке животных и людей. Карен Прайор. Подкрепление: лучше, чем вознаграждение.

Очень часто, особенно при работе с пищевым подкреплением, его невозможно дать в тот момент, когда субъект делает то, что хотели бы поощрить. Если я учу дельфина прыгать, то я никак не могу дать ему рыбку в тот момент, когда он находится в воздухе. Если за каждым прыжком следует брошенная рыбка (отставленное подкрепление), то у животного в конце концов образуется связь между прыжком и едой, и оно будет прыгать чаще. Однако это не несет информации о том, какой из аспектов прыжка мне нравится. На какую высоту? С каким прогибом? Может, надо войти обратно в воду со всплеском? Таким образом, потребуется очень много повторений, чтобы животное установило, какой именно прыжок я имела в виду. Чтобы обойти эту трудность, мы используем условное подкрепление. Условное подкрепление представляет собой какой-либо изначально ничего незначащий сигнал — звук, свет, движение, — который умышленно связывают с подачей подкрепления. Тренеры дельфинов остановили свой выбор на полицейском свистке: его хорошо слышно даже под водой и он не связывает руки, чтобы можно было давать сигналы и бросать рыбу. С другими животными я обычно использую «сверчка», десятицентовую игрушку, которая щелкает, когда на нее нажимаешь, или особые поощряющие слова, выбранные и приберегаемые для использования в качестве условного подкрепления: «хорошая собака», «хорошая лошадка». Школьные учителя часто прибегают к некоторым таким ритуальным и тщательно нормированным словам похвалы — «замечательно» или «очень хорошо», — за которые дети страстно работают и ждут их. Наша жизнь изобилует условными подкреплениями. Нам нравится слышать, как звонит телефон или видеть набитый почтовый ящик, даже если половина звонков неинтересна и большая часть корреспонденции — утиль, потому что множество случаев научили нас связывать звонок или конверт с хорошим. Нам нравится рождественская музыка, и мы ненавидим запах зубного кабинета. Мы храним окружающие нас вещи — картины, посуду, трофеи — не потому, что они красивы или полезны, а потому, что они напоминают нам о временах, когда мы были счастливы, или о людях, которых мы любили. Они представляют собой условные подкрепления. Практически дрессировка животных с использованием положительного подкрепления почти всегда должна начинаться с выработки условного подкрепления. Прежде чем начать выработку поведения как такового, пока субъект еще ничего особенного и не делает, вы учите его понимать значимость условного подкрепления, сочетая его с пищей, поглаживанием иди другим истинным подкреплением.

Иногда, по крайней мере при работе с животными, вы можете уловить, когда субъект начинает узнавать ваш сигнал, означающий «Хорошо!». Видно, как животное вздрагивает при действии условного подкрепления и начинает искать истинное подкрепление. После выработки условного подкрепления в ваших руках оказывается реальный способ сообщения животному, что в его поведении вас интересует. Чтобы разговаривать с животными, вам не обязательно быть доктором Дулиттлом, можно очень многое сказать таким выработанным подкреплением. Условные подкрепления приобретают чрезвычайную силу. Так как информация «Ты прав» сама по себе представляет ценность, она не обязательно должна сопровождаться первичным подкреплением. Фактически использование пищи, ласки или чего-нибудь в этом роде можно практически свести к нулю, а условное подкрепление будет приносить прекрасные результаты. Я видела, как морские млекопитающие долго работали после насыщения за условные подкрепления, а лошади и собаки работают по часу и более с маленьким или безо всякого безусловного подкрепления. Люди конечно же тоже могут бесконечно работать за деньги, являющиеся ничем иным как условным подкреплением, обозначением вещей, которые на них можно купить, особенно люди, которые уже заработали гораздо больше денег, чем они когда-либо смогут действительно потратить, и, следовательно, пристрастившиеся к условному подкреплению. Действие условного подкрепления можно усилить, сочетая его с несколькими безусловными подкреплениями. В данный момент субъект может не хотеть, скажем, есть, но если тот же подкрепляющий звук или слово были умышленно связаны еще и с водой или другими потребностями или приятными моментами, он сохраняет свое действие и в этом случае. Мои кошки слышат слова «хорошая киса!», когда получают ужин, когда их гладят, когда их впускают в дом и выпускают из дома, когда они проделывают маленькие трюки и получают за них вознаграждение. В результате я могу использовать эти слова для поощрения кошки, спрыгивающей с кухонного стола, и нет нужды сопровождать его каким-либо безусловным подкрепдением. Быть может, причина того, что деньги оказывают на нас такое подкрепляющее действие, кроется в том, «что они могут связываться практически с чем угодно. Это чрезвычайно обобщенное условное подкрепление. Как только вы выработали условное подкрепление, вы должны пользоваться им осторожно, не разбрасывать без толку, иначе его сила уменьшится. Дети, которые ездили на моих уэльских пони, очень скоро научились говорить: «Хорошая лошадка!» только когда хотели подкрепить поведение. Если им просто хотелось выразить свою привязанность, они могли болтать с пони, как угодно, не употребляя этих слов. Однажды девочка, которая только что присоединилась к их компании, начала гладить пони, приговаривая: «Ты хорошая лошадка!». Трое остальных тотчас же ополчились на нее: «Ты за что ему это говоришь? Он же ничего не сделал!». Подобным же образом можно и должно окружить заботой и вниманием детей, супруга, родителей, любимых и друзей безотносительно к какому-нибудь определенному поведению, но необходимо приберечь что-то специально в качестве условного подкрепления чего-либо определенного.

Существует множество реальных событий, заслуживающих похвалы, подкрепления, которым щедро обмениваются в счастливых семьях. Однако фальшивая или незначимая награда вскоре вызывает негодование даже у маленьких детей и теряет всякую силу в качестве подкрепления. Можно выработать и условное отрицательное подкрепление, которое может быть очень полезным. Дети и многие животные часто моментально реагируют на резкое, громкое слово запрета, которое ничем не сопровождается. Возможно, оно является первичным или безусловным подкреплением. Но некоторые животные — особенно этим славятся кошки — игнорируют окрики и брань. Одна моя подруга совершенно безуспешно пыталась отучить свою кошку царапать кушетку, используя в качестве отрицательного подкрепления возглас «Нет!». Однажды в кухне она уронила большой латунный поднос, случайно упавший почти рядом с кошкой, и, когда раздался громкий грохот подноса, воскликнула: «Нет!». Кошка была страшно напугана, подпрыгнула вверх, подняв шерсть дыбом. В следующий раз, когда кошка начала драть кушетку, хозяйка крикнула: «Нет!», у кошки сделался испуганный вид, и она тотчас же перестала. Двух-трех повторений ставшего условным слова оказалось достаточно, чтобы навсегда прекратить это поведение.

 

Rambler's Top100