Punição positiva: o ingrediente essencial.

No universo acadêmico de trabalho com cães, muito se fala sobre os quatro quadrantes de condicionamento operante. É com base nessa premissa que muitos estilos de treinamento são desenvolvidos. Quando o discurso é direcionado para termos como estudos científicos, ou cientificamente comprovado, eu garanto que em algum momento você vai escutar alguma coisa relacionada à condicionamento operante.

De acordo com a descrição desse método no site wikipedia, o resumo é:

O condicionamento operante (também chamado de condicionamento instrumental) é um processo de aprendizado através do qual a força de um comportamento é modificada por reforço ou punição. É também um procedimento que é usado para trazer esse aprendizado.

“Embora o condicionamento operante e clássico envolvam comportamentos controlados por estímulos ambientais, eles diferem em natureza. No condicionamento operante, estímulos presentes quando um comportamento é recompensado ou punido passam a controlar esse comportamento. Por exemplo, uma criança pode aprender a abrir uma caixa para pegar os doces que estão dentro ou aprender a evitar tocar em um fogão quente; em termos operativos, a caixa e o fogão são "estímulos discriminativos". Diz-se que o comportamento operante é "voluntário": por exemplo, a criança pode escolher entre abrir a caixa e acariciar um filhote.

Em contraste, o condicionamento clássico envolve um comportamento involuntário baseado no pareamento de estímulos com eventos biologicamente significativos. Por exemplo, a visão de doces pode fazer a criança salivar, ou o som de uma batida de porta pode sinalizar um pai zangado, fazendo a criança tremer. Salivação e tremor não são operantes; elas não são reforçadas por suas conseqüências e não são voluntariamente "escolhidos".

O estudo da aprendizagem animal no século XX foi dominado pela análise desses dois tipos de aprendizagem, e eles ainda estão no centro da análise do comportamento.”

Ainda na descrição dessa definição estão os seguintes detalhes;

Reforço e punição são as principais ferramentas através das quais o comportamento operante é modificado. Esses termos são definidos pelo seu efeito no comportamento. Qualquer um pode ser positivo ou negativo.

Reforço positivo e reforço negativo aumentam a probabilidade de um comportamento se repetir, enquanto que punição positiva e punição negativa reduzem a probabilidade de um comportamento se repetir.

Outro procedimento é o chamado de "extinção".

A extinção ocorre quando um comportamento previamente reforçado não é mais reforçado com reforço positivo ou negativo. Durante a extinção, o comportamento se torna menos provável.

Há um total de cinco conseqüências.

O reforço positivo ocorre quando um comportamento (resposta) é recompensador ou o comportamento é seguido por outro estímulo que é recompensador, aumentando a frequência desse comportamento. Por exemplo, se um rato em uma caixa de Skinner ganhar comida quando pressionar uma alavanca, sua taxa de repetição aumentará. Este procedimento é geralmente chamado simplesmente de reforço.

Reforço negativo (também conhecido como escape) ocorre quando um comportamento (resposta) é seguido pela remoção de um estímulo aversivo, aumentando assim a frequência do comportamento original. No experimento da caixa de Skinner, o estímulo aversivo pode ser um ruído alto continuamente dentro da caixa; reforço negativo aconteceria quando o rato pressionasse uma alavanca para desligar o ruído.

Punição positiva (também conhecida como "punição por estimulação contingente") ocorre quando um comportamento (resposta) é seguido por um estímulo aversivo. Exemplo: dor de uma surra, que muitas vezes resultaria em uma diminuição nesse comportamento. Punição positiva é um termo confuso, então o procedimento é geralmente referido como "punição".

Punição negativa (penalidade) (também chamada de "punição por retirada contingente") ocorre quando um comportamento (resposta) é seguido pela remoção de um estímulo. Exemplo: tirar o brinquedo de uma criança seguindo um comportamento indesejado por ele, o que resultaria em uma diminuição do comportamento indesejável.

A extinção ocorre quando um comportamento (resposta) previamente reforçado não é mais efetivo. Exemplo: primeiro, um rato recebe comida várias vezes para pressionar uma alavanca, até que o experimentador não dê mais comida como recompensa. O rato normalmente pressionaria a alavanca com menos frequência e depois pararia. A pressão da alavanca seria então "extinta".

É importante notar que os animais não são mencionados como sendo reforçados, punidos ou extintos; são as ações que são reforçadas, punidas ou extintas. Reforço, punição e extinção não são termos cujo uso é restrito ao laboratório. Consequências naturais também podem reforçar, punir ou extinguir o comportamento e nem sempre são planejadas ou entregues de propósito.”

Todos esses detalhes fazem parte do texto completo, que vocês podem encontrar em diversas fontes na internet e em livros. O propósito em mencionar as raízes dessa teoria aqui é esclarecer as dúvidas que muitas pessoas ainda tem em relação às modalidades e estilos de treinamento, e porque alguns deles são mais eficazes.

Eu particularmente acredito que tudo que foi mostrado nesse estudo faz parte de uma premissa de bom senso. Considerando que o estudo não foi feito apenas pensando em animais, mas considerando o lado de psicologia humana também, podemos ver que tudo isso pode ser observado, diariamente no contexto social em diversas espécies.

Analisando a idéia de reforço e punição, fica muito claro o que define o comportamento do indivíduo em uma série de situações. Quando falamos de cães e sua adaptação no nosso mundo doméstico urbano, as regras principais continuam valendo. As variáveis seriam apenas as aplicações. Então vamos aos exemplos;

Você traz um novo cão para casa. No primeiro dia você já tem em mente o que quer que aconteça. Você já sabe aonde quer que o cão durma, se alimente e use o banheiro. Mas como fazer esse animal entender essa mensagem? Afinal vocês são de espécies diferentes e não falam a mesma língua. Bom, não existe outra alternativa a não ser trabalhar com os quatro quadrantes para estabelecer essa comunicação.

Nos primeiros dias é comum vermos a apresentação de limitação de espaço, seja com o uso de portões entre ambientes ou uso da caixa de transporte. Essa limitação, pode ser chamada de reforço negativo (remoção de liberdade de circulação), não necessariamente porque o cachorro fez alguma coisa errada, mas porque pode fazer, caso tenha liberdade para isso. Manter o cachorro num espaço menor, e oferecer comida, brinquedos, água e carinho nesse espaço seria o reforço positivo da equação (boas consequências por estar nesse espaço).

Com o passar das semanas o cachorro é introduzido ao universo social. A primeira coisa apresentada é a coleira e a guia, para fazer as caminhadas com segurança. A coleira e guia (sejam elas quais forem) já são uma possível forma de punição, positiva ou negativa, dependendo da situação. Quando o cachorro usa a coleira e guia pela primeira vez, ele não entende muito bem pra que elas servem, e normalmente só descobre quando chega no fim do comprimento da guia. Ali ele encontra a pressão, que é apresentada como consequência por se distanciar do condutor, que é você. Isso é punição positiva. Quando o cachorro volta para sua direção e se posiciona corretamente, ele recebe a punição negativa, ou seja, a pressão desaparece.

Com o progresso do convívio o cão eventualmente é apresentado à novas situações. Algumas pessoas tem o hábito de deixar os cães soltos em casa, com toda liberdade, quando recebem visitas. As visitas chegam e o cão imediatamente vai investigar quem é quem. Muitos cães pulam nas pessoas estranhas e essas, constrangidas pela situação, não reagem. Está ai mais um exemplo de reforço positivo. O cachorro se auto recompensou por investigar, de forma invasiva, pessoas estranhas dentro de casa. A tendência desse comportamento se repetir é enorme.

Outra situação interessante é quando o cachorro reage, vocalmente, à sons como campainhas, barulhos externos em geral, e movimentos de pessoas e outros animais ao redor de seu território (casa, apartamento e etc.). Se esse comportamento não é seguido por consequências, ele se torna auto recompensador, traduzindo assim o reforço positivo. Vejam que reforço positivo não é apenas alguma coisa que vem de você (carinho, brinquedo, comida e etc.), ou que é necessariamente boa aos nossos olhos. Cães tem preferências bem peculiares e podem sentir muita satisfação em atividades como patrulhar o território, rolar em fezes de outros animais, lamber suas partes íntimas e mastigar objetos como seu controle remoto da TV, seu tênis novo, o rolo de papel higiênico e etc. Sem consequências esses comportamentos tendem a se repetir casa vez mais.

Consequência de valor (punição) também é outro fator que não necessariamente precisa vir de você para ser efetivo, mas, para o bem do seu cachorro, é melhor que venha. Esclarecendo; imagine um cão caminhando com você na rua. Você acredita que seu cão é confiável o suficiente então você tira a guia e deixa ele curtir a caminhada solto. Alguém do bairro resolve soprar numa vuvuzela por alguma razão e seu cão se assusta. Nesse pequeno momento ele vai correr em alguma direção. Se for para o meio da rua ele pode ser atingido por um carro em movimento. Está aí um exemplo de punição positiva, que nesse caso, por não vir de você, pode ser fatal.

Outro bom exemplo de punição positiva provida pelo ambiente é a seguinte: você acredita que seu cão é confiável o suficiente para ficar solto, livre, em casa, enquanto você sai. No período da sua ausência seu cão vai explorar e encontra as garrafas de produtos de limpeza dentro do armário da cozinha, que estava fechado, mas ele conseguiu abrir. Ele puxa as garrafas com a boca e testa pra ver se vale a pena. A consequência aqui, se não for fatal, pode ser uma longa estadia num hospital, com um bom período de recuperação, sem falar no prejuízo financeiro que seria a consequência para você, o humano da equação.

Veja que os quatro quadrantes já existem na sua vida com seu cão, mesmo que você nunca tenha prestado maior atenção nos detalhes. O benefício de entender como esse processo funciona é o esclarecimento sobre reforço e punição, e a habilidade de colocar tudo isso em prática, visando uma vida melhor para o seu cão. Reforço e punição tem o seu lugar, e ambos devem ser postos em prática da forma correta para que os resultados se materializem de verdade. A punição positiva ou negativa, quando aplicadas com o uso de equipamentos de treinamento de qualidade (e-collar, prong collar), e adequados, são extremamente eficazes e tornam a vida do cachorro mais segura e previsível.

A falta de punição, seja positiva ou negativa, reduz a vida do cão à apenas reforços (continuidade de comportamentos já apresentados), logo nenhum comportamento negativo, dentro dessa metodologia de treinamento limitada, jamais será extinto. Isso é a famosa ciência que todos gostam de mencionar. Isso é bom senso na minha opinião. Essa á a razão pela qual muitos cães que apresentam problemas de comportamento não superam essas questões dentro do treinamento puramente positivo.

Se você quer aprender como aplicar punições da forma correta, dentro de um treinamento equilibrado, usando os quatro quadrantes, veja nosso calendário de cursos com ótimas opções, para iniciantes, profissionais da área e pessoas interessadas em viver melhor com seus cães. Acompanhe também nosso blog com artigos semanais, e o canal do Youtube com muitos vídeos educativos.