Руководство по поведенческой медицине собак и кошек
Шрифт:
– фиксированную продолжительность (после того, как животное воспроизводит желательную реакцию в течение определенного периода).
• Переменный режим, при котором время подкрепления реакции устанавливается произвольно.
• Дифференцированный режим, при котором время подкрепления реакции устанавливается по ее качественной характеристике.
В режиме прерывистого подкрепления независимо от степени проявления поведенческой реакции объем подкрепления, по определению, всегда меньше, чем в режиме непрерывного подкрепления. Следовательно, дрессировка может продолжаться дольше. На практике чаще используют либо переменный, либо дифференцированный режим, поскольку
Режим прерывистого подкрепления для выработки требуемой поведенческой реакции
Если режим прерывистого подкрепления используют для того, чтобы выработать определенную модель поведения, то первоначально подкрепление производят часто, а затем, как только устанавливается стабильная ответная реакция, начинают применять все реже и реже. Так, на начальном этапе животное поощряют за исполнение любого действия, приближающегося к целевому поведению, а позднее только за наиболее четкое выполнение требований, с тем чтобы его поведение формировалось в заданном направлении. Этот процесс, называемый последовательным приближением, наиболее эффективен в тех случаях, когда в определенный отрезок времени работа ведется только с одним аспектом поведения. Например, если животное учат садиться по команде, то первоначально его вознаграждают каждый раз, когда оно выполняет команду (непрерывное подкрепление); как только ответная реакция становится стабильной, обычно переходят на дифференцированный режим, т.е. поощряют только те случаи, когда животное садится правильно и быстро.
Использование режимов прерывистого подкрепления позволяет также снизить частоту некоторых поведенческих проявлений или даже полностью устранить их. Это достигается путем дифференцированного подкрепления ослабленных проявлений проблемного поведения (ДПО), причем для успеха не требуется активного участия животного в программе дрессировки.
При ограниченном ДПО подкрепляется поведение, при котором частота или продолжительность нежелательных проявлений не превышают предварительно заданного уровня. Экспериментально установлено, что некоторые варианты метода позволяют устранять усвоенное нежелательное поведение быстрее, чем простым прекращением подкрепления (Zeiler, 1971).
Этот метод наиболее целесообразно применять на ранних этапах борьбы с чрезмерно громкими голосовыми сигналами животного, особенно если цель данного поведения — привлечь внимание хозяина. Успех зависит от характера голосовых сигналов, а также от того, насколько животное заинтересовано в получаемом от владельца вознаграждении.
• Первоначально вознаграждаются менее интенсивные проявления, благодаря чему животное быстро понимает, что предпочтительны более мягкие формы поведения.
• Затем требования становятся строже: поощряется еще более спокойное поведение.
• Даже после того, как реакции животного станут стабильно менее интенсивными, эту стратегию продолжают до тех пор, пока не достигнут допустимого уровня громкости, либо совсем перестают обращать на проблему внимание.
• В качестве альтернативы можно использовать раздельное ДПО, при котором подкрепляют реакции, разделенные определенным временным интервалом.
Одна из причин, почему эти методы очень полезны для коррекции некоторых типов поведения, направленного на привлечение внимания, состоит в том, что трудно ожидать от хозяина, чтобы он не обращал внимания на своего питомца каждый раз, когда тот пытается установить контакт,— ведь большинство живот-ных-компаньонов содержат именно ради радости общения с ними. Практичнее попросить владельца ограничивать свое внимание к животному и не проявлять его хотя бы в те минуты, когда животное оставляет его одного.
При использовании данных методов следует очень осторожно относиться к росту ожиданий животного, поэтому важно увеличивать объем вознаграждения лишь по мере улучшения поведения. Если же животное будет получать все большее вознаграждение при минимальном уровне требований к нему, успеха не будет. Исходя из этого, необходимо, чтобы клиент вел записи того, какой объем вознаграждения он использует каждый день.
Принцип затухания заключается в следующем: если после обычно подкрепляемой поведенческой реакции не давать аппетентного подкрепления, вероятность ее проявления будет снижаться. По существу это форма отрицательного наказания за сформированное поведение.
Как правило, подкрепление, приводящее к возникновению проблемы, бывает неумышленным. Например, доставив почту, почтальон уходит, а непосредственно перед его уходом собака случайно начинает лаять. Поведение собаки подкрепляется уходом почтальона, так как собака не знает, что почтальон все равно ушел бы, даже если бы она не среагировала подобным образом. В этом случае для разрушения ассоциации методом затухающего подкрепления необходимо, чтобы “подставной почтальон” пришел в дом и не уходил до тех пор, пока собака не успокоится. Если повторить это упражнение несколько раз, собака, в конце концов, поймет, что ее реакция никак не влияет на исход ситуации.
Хотя метод затухающего подкрепления часто рекомендуется для устранения многих приобретенных нежелательных поведенческих реакций, существует ряд факторов, ограничивающих эффективность программ, построенных на основе простого отказа от подкрепления.
• Для некоторых форм поведения (например, самоподкрепляющихся) этот режим не подходит, даже если данному поведению способствует внешнее подкрепление. Так, кошек, царапающих мебель, нельзя отучить от этой привычки только тем, что владелец не перестанет обращать на них внимание, поскольку сам процесс царапанья обеспечивает аппетентное подкрепление. Точно так же лай, мотивированный игрой, не поддается затухающему подкреплению.
• Определенное поведение часто подкрепляется несколькими источниками, и, чтобы выполнение режима затухающего подкрепления было эффективным, необходимо выявить и устранить каждый из них. Самую большую опасность в этом отношении представляют доброхоты - посторонние и домочадцы, которых обычно не слишком интересует питомец (и поэтому они не желают как-то изменять свои привычки ради него). Другим источником подкрепления, особенно тех форм поведения, которые направлены на привлечение внимания, бывает слабость со стороны хозяина.
• Процесс затухающего подкрепления приводит к эмоциональной фрустрации, а это означает, что поведение ухудшается перед тем, как выправиться. Многие владельцы не способны справиться с этим и поэтому бросают выполнение программы.
• Эффективность режимов затухающего подкрепления можно повысить, если объединить их с программами, включающими положительное подкрепление допустимого уровня других форм нежелательного поведения (см. выше раздел о дифференцированном подкреплении).