Вопрос о
подкреплении, как ни странно, довольно запутанный. В отечественной школе
физиологов подкреплением считают все безусловные (непосредственные) воздействия
на животное, которые следуют после условного сигнала (например, команды).
Безусловные воздействия это и предложение пищи собаке, наш окрик, поглаживание,
шлепок, в общем, все, что собака непосредственно может воспринять. В случае
наличия подкрепления условный рефлекс называют положительным (подкрепляемым) и отрицательным
или тормозным (неподкрепляемым), в случае отсутствия безусловного воздействия.
При таком подходе болевые воздействия на собаку можно считать подкреплением
положительным для того действия, которое мы вырабатываем. Например, когда
отрабатываем движение собаки рядом с собой. А действие, которое вырабатывается
при помощи боли - оборонительным положительным рефлексом. На самом деле собака
совершает нужные нам действия, уходя от боли, предотвращая ее, то есть
обороняется.
В оперантной
же дрессировке подкреплением считается любое воздействие, увеличивающее или
уменьшающее вероятность повторения в будущем предшествующего его воздействию
поведения. В таком случае положительным подкреплением считается воздействие,
которое увеличивает в будущем вероятность предшествующего ему действия. Другими
словами, животное стремится к получению положительного подкрепления. Момент
получения положительного подкрепления всегда положительно эмоционален. И,
наоборот животное стремится избежать отрицательного подкрепления. Факт
отрицательного подкрепления вызывает отрицательные (негативные) эмоции и
снижает вероятность повторения в будущем поведения, приводящего к нему.
Неудовлетворение потребности считается в оперантной дрессировке мощным
отрицательным подкреплением.
Некоторые
свойства подкрепления мы уже рассматривали, сейчас же мы примем точку зрения
Карен Прайор, по мнению которой отрицательное подкрепление - это любое
неприятное событие или ощущение, действие которого можно прекратить или
избежать, изменив поведение. Отличие отрицательного подкрепления от наказания в
том, что отрицательное подкрепление, как и положительное, происходит во время
поведения, а не после него, и на него можно повлиять изменением поведения.
Для того
чтобы наверняка понять отличие отрицательного подкрепления от наказания,
давайте вернемся, к примеру, из предыдущей главы. Ваша собака лазает на диван.
Вам это не нравится, и вы отучаете ее следующим образом: как только застаете на
диване, тут же кричите в ее адрес ругательные слова и задаете трёпку. Как
правило, агрессивное поведение хозяина прекращается сразу же, как только собака
спрыгивает с дивана.
Если
следовать вашей логике, то благодаря применённым мерам воздействия собака
должна сообразить, что лазать на диван ей нельзя. Ничего подобного! Сначала
собака понимает, что в случае ее локализации на диване грубый, резкий окрик
хозяина означает: скорей слезай, чтобы избежать трепки.
Многие
собаки достаточно быстро понимают, что появление хозяина, когда она лежит на
диване, приводит к резкому окрику, а если с дивана не слезть, то схлопочешь. В
результате ретируются с дивана сразу, как только на пороге комнаты появляется
хозяин. Третьи идут еще дальше, они связывают наличие хозяина, а квартире с его
агрессивным поведением во время диванного положения, и в присутствии хозяина
ведут себя как паиньки. Когда же хозяина нет, все категории собак ведут себя
одинаково -диванолюбиво. Почему? Да потому, что ваше неприятное воздействие на
собаку выступает подкреплением (отрицательным или положительным - это еще
вопрос) спрыгивания с дивана и является наказанием по отношению к залезанию на
диван. То есть таким педагогическим воздействием вы обучаете собаку быстро
спрыгивать с дивана по команде (в данном случае это сложная команда или
комплексный раздражитель: ваш вид и осуждающий крик).
Таким
образом, хотелось бы показать, что отрицательное подкрепление, как впрочем, и
положительное, какому-то действию или поведению происходит во время этого
действия или в конце его, и на его появление, интенсивность и знак можно
повлиять, изменив или прекратив именно это поведение. Тогда как наказание, о
котором мы говорили ранее, происходит через некоторое время после совершения
проступка.
А как же
отучить собаку залезать на диван? Нужно придумать нечто такое, что делало бы
неприятным именно это действие. Например, можно поставить на диване заряженные
мышеловки. А одного добермана, который со всего размаха шлепался на диван,
отучили так: разложили на диване остриями вверх шиферные кнопки и прикрыли их
покрывалом. Для отучения оказалось достаточным, одного доберманьего прыжка.
Более того, бедняга начал активно сопротивляться при попытке затащить его на
диван.
Отрицательное
подкрепление - очень эффективный способ формирования поведения, но это не
делает его лучшим. Последите за собой, в общении с людьми и собаками мы в
основном пользуемся именно им. Нам почему-то кажется, что правильное хорошее
поведение это норма. Так и должно быть и чего тут радоваться и хвалить? Поэтому
и, не замечаем, а что самое плохое и не подкрепляем положительно нужное нам
поведение. Мы его как будто не видим, а обращаем, внимание только на огрехи. Но
слишком частое применение отрицательного подкрепления приводит, особенно у
щенков, к появлению робости, неуверенности в себе, тревожности и отбивает охоту
от самого процесса дрессировки. Потому что собака в первую очередь начинает
понимать: появление нового навыка увеличивает возможность дополнительного
получения отрицательного подкрепления. А его она, естественно, стремится
избежать. Кстати, классическая дрессировка, оттого и является классической, что
строится в основном на отрицательном подкреплении. Например, команда
"Сидеть!" свидетельствует о возможных неприятных, а то и болевых
воздействиях в области крестца, и чтобы их избежать, необходимо сесть.
|