Efeitos da Punição com Jato de Ar Quente (JAQ) Durante a Extinção e Recondicionamento do Responder

Yslaíne Lopes Silva; Marcus Bentes de Carvalho Neto; Paulo Sérgio Dillon Soares Filho

resúmenes

secciones

referencias

imágenes

Resumo: Com base na pergunta “Qual o efeito da punição com jato de ar quente na taxa da resposta durante sessões de extinção e na reaquisição do operante previamente punido?”, o presente estudo buscou identificar em quais momentos a supressão seria transitória ou permanente. Foram utilizados 12 ratos machos Wistar (Rattus norvegicus). Os sujeitos foram submetidos a sessões de reforçamento (Fase 1); extinção (Fase 2), nas quais metade dos sujeitos foi exposta à punição em FI 30 s (15 minutos) na primeira sessão (grupo Ext+JAQ) e a outra metade passou apenas por extinção (grupo Ext); e sessões de recondicionamento iguais a Fase 1 (Fase 3). Como resultado, ambos os grupos diminuíram a taxa de respostas na Fase 2, porém, durante a sessão de punição, o grupo Ext+JAQ apresentou maior supressão da resposta, em comparação com a linha de base, que o grupo Ext. Após a retirada do JAQ na Fase 2, os sujeitos do grupo Ext+JAQ apresentaram recuperação da resposta, mas o percentual acumulado das respostas emitidas foi menor para o grupo punido. Na Fase 3, os sujeitos de ambos os grupos aumentaram a taxa de resposta, não havendo diferenças significativas entre eles. Os dados sugerem que a intensidade do JAQ, nesse contexto, pode ser considerada leve ou moderada e, dependendo da ocasião da medida e da métrica adotada, a durabilidade da supressão oscila entre efeitos breves e efeitos permanentes.

Palavras-chave: punição, supressão da resposta, extinção, recuperação da resposta, recondicionamento operante, jato de ar quente.

Abstract: One of the main debates about punishment concerns its transient or permanent suppressive effects. The asymmetric theory holds that the suppression observed in punishment is not a direct result of the response-punishment relationship, and therefore, the suppressive effects would be temporary. The symmetric theory argues that punishment is the result of a consequential history that directly weakens the response. Studies addressing this issue have used different time points to measure the effects of punishment, ranging from the presentation of the aversive stimulus to times after its removal. Given the ambiguous results of these studies, the present study aimed to evaluate the effect of punishment on responding during extinction and reconditioning sessions, using a hot air blast (HAB) as the aversive stimulusParte inferior do formulário, seeking to identify in which contexts suppression would be transient or permanent. Twelve experimentally naive male Wistar rats (Rattus norvegicus) were exposed to response-reinforcement sessions (Phase 1), and extinction sessions (Phase 2) - where half of the subjects were exposed to punishment in FI-30 s from minute five to twenty of the first session (Ext+HAB group), and the other half were exposed to only extinction (Ext group) - and three reconditioning sessions (Phase 3). As a result, both groups suppressed the response during Phase 2, however, during the punishment session, the Ext+HAB group showed greater response suppression than the Ext group. After the removal of the HAB in Phase 2, the subjects in the Ext+HAB group showed response recovery, but the cumulative percentage of responses emitted was lower than those in the Ext group. In Phase 3, both groups responded again, with no systematic difference between groups. The data was similar to the results of Boe and Church (1967) when using mild or moderate intensities of electric shock, allowing the suppression of the response at levels approximate to that of the Ext group. This result indicates that, depending on the current contingencies, the timing of the measurement, and the adopted metric, the durability of suppression oscillates between brief effects and permanent effects.

Keywords: punishment, response suppression, extinction, response recovery, operant reconditioning, hot air blast.

Carátula del artículo

Efeitos da Punição com Jato de Ar Quente (JAQ) Durante a Extinção e Recondicionamento do Responder

Yslaíne Lopes Silva yslainelopes@outlook.com

Universidade Federal do Pará, Brasil

Marcus Bentes de Carvalho Neto

Universidade Federal do Pará, Brasil

Paulo Sérgio Dillon Soares Filho

Universidade Federal do Pará, Brasil

Acta Comportamentalia: Revista Latina de Análisis de Comportamiento, vol. 32, núm. 3, pp. 381-400, 2024
Universidad de Guadalajara

Esta obra está bajo una Licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional.

Recepción: 23 Enero 2024

Aprobación: 09 Mayo 2024

Na Análise do Comportamento, coexistem hoje pelo menos duas grandes teorias da punição. De um lado, autores como Skinner (1938) e Sidman (1989) sustentam que a supressão observada tipicamente na punição não poderia ser explicada pelo efeito direto da contingência entre resposta-evento aversivo/punidor, como ocorre com o reforçamento. Para eles, a diminuição da frequência da resposta punida seria um resultado indireto do aumento da frequência de outras respostas (eliciadas e/ou negativamente reforçadas), e, uma vez que a diminuição da frequência da resposta punida não está diretamente relacionada com uma aprendizagem da relação entre resposta-evento aversivo, os efeitos supressivos seriam apenas temporários. Tal teoria é chamada de assimétrica. Por outro lado, autores como Azrin e Holz (1966) e Catania (1998/1999), defendem que, assim como o aumento na frequência da resposta seria resultado direto da contingência resposta-reforçador, na punição o mesmo mecanismo estaria presente, com a diferença apenas de que o efeito teria o sentido oposto: a diminuição do responder. Tal teoria é conhecida como simétrica (para uma revisão das duas teorias, ver Carvalho Neto et al., 2017; Holth, 2005; Mayer & Gongora, 2011).

Skinner defende a teoria assimétrica com base, em parte, em experimentos publicados na obra The Behavior of Organisms (Skinner, 1938). Em um dos experimentos, oito ratos foram submetidos a três sessões de intervalo fixo (FI) 4 minutos de fortalecimento da resposta de pressão à barra (intervalo não especificado pelo autor, mas inferido a partir de estudos realizados posteriormente, como o de Estes, 1944); em seguida, foram submetidos a duas sessões de extinção com duração de 120 minutos cada. Para metade dos sujeitos (Grupo Punição), um estímulo aversivo (“tapa nas patas” produzido pelo movimento reverso da barra) era apresentado em um esquema de razão fixa (FR) 1 nos 10 primeiros minutos da primeira sessão de extinção. Para a outra metade (Grupo Controle), havia apenas extinção, sem qualquer punição programada. Como resultado, Skinner descreve que durante a punição houve uma supressão parcial do responder; porém, quando o aversivo foi suspenso, observou-se uma aceleração do responder ao longo das sessões de extinção (recuperação da resposta), levando os dois grupos ao mesmo patamar de respostas totais emitidas ao final da fase de extinção.

Esse resultado contribuiu para que Skinner (1938) concluísse que a supressão observada durante a apresentação do estímulo aversivo seria indireta, não afetando realmente a força da resposta operante previamente reforçada, sendo produto da eliciação momentânea de respostas incompatíveis e concorrentes com a resposta de pressão à barra. Além disso, a recuperação do responder sem o aversivo ocorreria gradual e sistematicamente, com a dissipação dos efeitos da eliciação de respostas incompatíveis. Ressalta-se que, na época do citado estudo, Skinner tinha como base o conceito de “reserva de reflexo”, no qual o reforço supostamente “acrescentaria respostas potenciais”, enquanto a extinção permitiria “esvaziar o total de respostas” acumulado em tal reserva após uma determinada história de reforçamento. Os efeitos da punição foram analisados juntamente com a extinção após uma história de reforçamento, para verificar exatamente se esse “esvaziamento da resposta” seria afetado diferencialmente pela contingência de punição (Santos & Carvalho Neto, 2019).

Na mesma linha de investigação, Estes (1944, Experimento A) replicou o experimento de Skinner (1938), substituindo o “tapa na pata” pelo choque elétrico como estímulo aversivo (em uma intensidade não especificada denominada de “punição leve”). Dezesseis ratos foram submetidos a três sessões de treino em FI 4 minutos e posteriormente a três sessões de extinção com duração de 60 minutos cada. Para a metade dos sujeitos houve, na primeira sessão de extinção, a sobreposição do estímulo aversivo (choque elétrico em FI 30 s contingente à pressão à barra) do minuto 5 ao minuto 20. Os resultados foram similares aos do experimento original de Skinner: supressão parcial do responder durante a punição, seguida pela recuperação gradual da frequência da resposta após a retirada do estímulo aversivo durante as sessões de extinção. Ao final da última sessão de extinção, os sujeitos apresentaram um total de respostas semelhante para ambos os grupos, com ou sem história de punição. Assim, a punição, quando aplicada por um breve período, não reduziria o total de respostas emitidas ao longo da fase de extinção, pois imediatamente após a descontinuação do estímulo aversivo, os sujeitos do grupo punido apresentariam um incremento no número de respostas, passando a responder mais que o grupo controle. O autor chamou essa aceleração positiva do responder após o término da apresentação do evento aversivo de “recuperação compensatória”.

Azrin e Holz (1966) compilaram as evidências experimentais existentes até aquele momento sobre a punição e afirmaram, entre outras coisas, que a supressão do responder poderia sim ser completa e duradoura, a depender dos parâmetros utilizados, e que o mecanismo supressivo poderia ser atribuído diretamente a apresentação contingente do estímulo punidor como consequência, sem a necessidade de apelar para a produção de respostas concorrentes. Uma das variáveis apontadas como crítica para a supressão do responder seria a intensidade do estímulo aversivo, levando os autores a sugerirem que a intensidade do evento aversivo utilizada por Skinner (1938) e por Estes (1944) não seria a ideal, o que poderia explicar, pelo menos em parte, o padrão de supressão parcial e temporária observado por eles.

Boe e Church (1967), no Experimento 1, replicaram parcialmente os estudos de Skinner (1938) e Estes (1944) utilizando diferentes intensidades do choque elétrico. Sessenta sujeitos foram submetidos a três sessões em FI 4 minutos de fortalecimento da resposta de pressão à barra, nove sessões de extinção e três sessões de recondicionamento, todas com duração de 60 minutos. Na primeira sessão de extinção, do minuto cinco até o minuto vinte, a pressão à barra produzia choques elétricos de cordo com um esquema de FI 30 s. Os sujeitos foram distribuídos em seis grupos, sendo cada um exposto a uma diferente intensidade de choque elétrico: 0 (Grupo Controle), 35, 50, 75, 120 e 220 volts. Observou-se que a supressão do responder foi diretamente proporcional à intensidade do choque utilizada. As taxas de resposta voltaram a aumentar após a retirada do estímulo aversivo com as intensidades menores (35 e 50 volts), mas não ao ponto de ser observado frequências de respostas similares entre o grupo controle e os grupos experimentais. Em intensidades maiores (75, 120 e 220 volts) não houve recuperação do responder, mesmo após nove sessões de extinção. Por fim, todos os sujeitos aumentaram a frequência da resposta durante a fase de recondicionamento, contudo, a frequência da resposta dos grupos punidos foi menor que a do grupo controle. Esse resultado foi tomado pelos autores como mais uma evidência que os efeitos supressivos da punição foram duradouros. Ademais, os autores sugeriram que as divergências na recuperação do responder do grupo punido em relação aos estudos anteriores (Estes, 1944; Skinner, 1938) ocorreram em função, principalmente, da diferença nas intensidades e na precisão da administração dos estímulos aversivos utilizados, como o tapa na pata utilizado no estudo de Skinner (1938) que não foi adequadamente calibrado para todos os sujeitos.

Estudos mais recentes testaram a generalidade dos resultados previamente apresentados, utilizando o jato de ar quente (JAQ) como estímulo aversivo (Mayer & Carvalho Neto, 2016; Silva & Carvalho Neto, 2022). Mayer e Carvalho Neto (2016) expuseram dois grupos, com três ratos cada, às mesmas condições do Experimento 2 descrito por Skinner (1938): fortalecimento do responder (FI 4 minutos), seguido de sessões de extinção (duas sessões de 90 minutos cada, sendo os sujeitos de um dos grupos expostos concomitantemente à punição contínua [FR 1] nos 10 minutos iniciais da primeira sessão). Os autores observaram, a partir da análise do total de respostas acumulada, uma supressão inicial das respostas de pressão à barra, recuperação do responder após a suspensão do estímulo aversivo e igualação do número total de respostas entre os dois grupos ao final da segunda sessão de extinção. Replicaram, portanto, os resultados principais de Skinner (1938) com “tapas na pata” como estímulo aversivo e de Estes (1944) com intensidades mais brandas de choque elétrico.

Silva e Carvalho Neto (2022), também replicando parcialmente o experimento original de Skinner (1938) com JAQ, acrescentaram três sessões de recondicionamento com reforço contínuo (FR 1) após a fase de punição/extinção para avaliar como seria o desempenho dos sujeitos punidos. Além dessa mudança, o esquema de reforçamento foi alterado para um intervalo variável (VI) 4 minutos durante a Fase 1 (linha de base) visando uma maior estabilidade das taxas de respostas durante essa fase. Os autores observaram que durante a apresentação do JAQ os três sujeitos do grupo exposto à punição apresentaram maior supressão da resposta, mas após a retirada do aversivo houve um aumento na frequência de respostas apresentada por esses sujeitos, ao ponto de ultrapassar, ao final da fase de extinção, o total de respostas apresentado pelos três sujeitos do grupo que não foi exposto à punição. Tal resultado, apesar de seguir na mesma direção dos achados de Skinner (1938), Estes (1944) e Mayer e Carvalho Neto (2016), diferiu dos demais ao não apresentar uma igualação entre os grupos ao final das sessões de extinção. Na fase adicional de recondicionamento foi observado, a partir da inspeção visual dos dados, que ambos os grupos aumentaram a frequência da resposta, mas a média de reposta do grupo punido ficou abaixo do grupo controle.

No conjunto de textos revisados aqui, podemos identificar quatro momentos distintos que são utilizados para avaliar os efeitos da punição: (a) a frequência (ou taxa) da resposta quando a punição está vigente, sendo registrada em geral uma supressão imediata do responder em todos os grupos punidos; (b) a frequência (ou taxa) da resposta imediatamente após a descontinuação da punição, sendo normalmente registrado um aumento do responder em todos os grupos punidos (recuperação da resposta); (c) o total ou percentual de respostas emitidas ao final das sessões de extinção (i.e., registro cumulativo), em que alguns estudos, com estímulos menos intensos, registraram um total de respostas equivalentes para os grupos controle e experimental, sendo esse resultado diretamente relacionado à recuperação da resposta após a retirada do estímulo aversivo (d) a frequência (ou taxa) da resposta durante a reaquisição, em sessões de recondicionamento operante, sendo registrado o aumento da frequência da resposta para todos os sujeitos punidos e não punidos.

Com relação as contingências que podem afetar o responder nos momentos descritos anteriormente, as avaliações dos efeitos da punição nas ocasiões (a) e (b) podem ser amplamente afetadas pela função eliciadora do estímulo aversivo, sendo difícil separar seus possíveis efeitos como consequência. Já a avaliação com base na supressão da resposta na ocasião (c) parece ser diretamente afetada pela intensidade do aversivo, tendo efeitos que podem ser duradouros, ou seja, efeitos que se mantém após a retirada do aversivo (com aversivos intensos) ou temporários (com aversivos brandos). A quarta ocasião (d) (recondicionamento) parece não ter os problemas anteriores e foi até aqui muito pouco explorada desde sua introdução por Boe e Church (1967), tanto pelos próprios autores quanto em outros estudos (e.g., Silva & Carvalho Neto, 2022), que não apresentaram dados descritivos dessa etapa e nem uma análise comparativa dos níveis de supressão e recuperação de cada fase.

O presente trabalho pretendeu responder qual o efeito da punição com jato de ar quente na taxa da resposta durante sessões de extinção e na reaquisição do operante previamente punido. O estudo concentrou-se especificamente na resposta a cada uma das seguintes perguntas: (1) Houve diferença entre os grupos na taxa da resposta durante a linha de base? (2) Houve diferença na proporção da resposta (em comparação com a linha de base) durante apresentação do estímulo aversivo? (3) Houve diferença entre os grupos na proporção da resposta (em comparação com a linha de base) após a retirada do estímulo aversivo? (4) Houve diferença no percentual cumulativo entre os grupos ao longo das sessões de extinção? (5) Houve diferença entre os grupos na proporção da resposta (em comparação com a linha de base e com a fase de punição/extinção) durante o recondicionamento da resposta?

Assim, o estudo teve como objetivo avaliar o efeito da punição no responder durante sessões de extinção e de recondicionamento, utilizando o jato de ar quente como estímulo aversivo. O procedimento de punição adotado foi baseado no estudo de Boe e Church (1967) que, diferentemente dos estudos anteriores – nessa mesma linha de investigação, que utilizaram JAQ (e.g., Mayer & Carvalho Neto, 2016; Silva & Carvalho Neto, 2022) – prolonga o tempo de exposição ao estímulo aversivo e inclui mais sessões de extinção. Essa abordagem possibilitou a análise dos efeitos da punição ao longo de um período mais amplo, com o objetivo de identificar em quais momentos os efeitos são temporários ou permanentes.

Método

Sujeitos

Doze ratos machos (Rattus norvegicus, Wistar), provenientes do biotério do Instituto Evandro Chagas. Os sujeitos foram alojados em duplas, em viveiros com dimensões de 17 x 30 x 50 cm, no Biotério do Núcleo de Teoria e Pesquisa do Comportamento (NTPC), mantidos em regime de ciclos claro/escuro com iluminação natural, temperatura de 20 °C e fornecimento ad libitum de água potável e a 85% do seu peso livre por meio da privação de comida com alimentação pós-sessão. O trabalho foi previamente aprovado pelo Comitê de Ética no Uso de Animais (CEUA) da UFPA (CEUA nº 4671090218).

Materiais e Equipamentos

Foi utilizada uma caixa de condicionamento MED Associates (modelo standard ENV-008-VP), com dimensões de 29,53 x 24,84 x 18,67 cm com uma barra de alumínio localizada no centro da lateral direita, com um comedouro logo abaixo da barra e uma luz na parte de cima, utilizada para a iluminação geral do equipamento. A caixa MED foi adaptada ao uso do JAQ como estímulo punidor, produzido por dois secadores de cabelos (TURBO WIND, modelo 2800 TANY) localizados na parte superior da caixa de condicionamento. O JAQ era acionado em sua intensidade máxima durante 5s aumentando a temperatura ambiente em 4 ° C, com uma pressão do ar de 216.5 dyn / cm² (2,165 N/m) e um ruído de 85 dB (para uma descrição detalhada, ver Mayer & Carvalho Neto, 2016). Os estímulos reforçadores foram pelotas de alimento de 45 mg (Bioserv, Dustless Precision Pellets). Todos os eventos foram controlados utilizando o programa MED-PC IV.

Procedimento

Para avaliar o efeito do JAQ (variável independente) sobre a taxa de resposta (variável dependente), foi utilizado o delineamento de dois grupos, em que os sujeitos foram distribuídos aleatoriamente em um grupo controle (Grupo Ext; n= 6) e um grupo experimental (Grupo Ext+JAQ; n= 6).

Todos os sujeitos foram inicialmente expostos a sessões de treino ao comedouro e modelagem da resposta de pressão à barra, uma sessão de fortalecimento da resposta sob um esquema FR 1 e três fases experimentais. Na Fase 1 (Reforçamento) do experimento, os sujeitos passaram por três sessões de reforço durante as quais a pressão à barra produziu comida sob um esquema FI 4 minutos. Todas essas sessões tiveram 60 minutos de duração.

Na Fase 2 (Extinção + JAQ), os sujeitos passaram por nove sessões de 60 minutos cada. Nessa fase, durante todas as sessões a resposta não foi seguida pelo estímulo reforçador (i.e., extinção). Durante a primeira sessão de extinção, para metade dos sujeitos (n = 6), a pressão à barra produziu um jato de ar quente em um esquema FI 30 s do minuto cinco ao vinte (15 minutos) e nas demais sessões de extinção não houve a apresentação de JAQ (Grupo Ext+JAQ). A ativação do JAQ não foi cumulativa, ou seja, pressões adicionais não prolongaram a sua duração. Para a outra metade dos sujeitos (n = 6), a resposta não produziu nenhuma consequência ao longo das nove sessões (Grupo Ext).

Na Fase 3 (Recondicionamento), os sujeitos de ambos os grupos foram expostos a três sessões de recondicionamento de 60 minutos cada. Na primeira sessão, as cinco respostas iniciais foram reforçadas com uma pelota de alimento cada (FR 1), depois o reforço passou a ocorrer de acordo com um esquema FI 4 minutos

Análise de Dados

Inicialmente, foi realizada uma análise descritiva da taxa de resposta obtida em cada uma das fases (dados individuais, média e erro padrão). Para avaliar a supressão da resposta durante a Fase 2, foi calculada a proporção da taxa de respostas de cada sessão da Fase 2 em relação à taxa de resposta da última sessão da Fase 1 e, para avaliar a recuperação do responder na Fase 3, foi utilizada a proporção da taxa da resposta em cada uma das sessões em relação ao responder na última sessão da Fase 2 e em relação a última sessão da Fase 1.

Similarmente ao realizado por Boe e Church (1967), a proporção entre a taxa da resposta em cada sessão da Fase 2 e a última sessão da Fase 1 foi multiplicada por 100 (i.e., percentual do responder em relação à linha de base). Para avaliar o total de respostas emitidas e as possíveis mudanças no fluxo do responder ao longo das sessões de extinção, foi realizado o registro acumulativo desse percentual. Diferente do estudo de Boe e Church (1967), no presente estudo foi utilizada a média ao invés da mediana do percentual acumulado, visto que não foi identificada discrepâncias entre as duas medidas e nem nos valores do erro padrão.

As comparações na taxa de resposta e proporções para cada uma das fases foram realizadas a partir de uma análise estatística bayesiana (versão bayesiana da ANOVA de medidas repetidas e Teste t de amostras independentes) através do software JASP (2022, versão 0.16.4). A hipótese prévia não informativa foi definida pelo programa (Cauchy, 0,707) para calcular o fator de Bayes (BF₁₀). O valor de BF₁₀indica a força da evidência de cada fator, podendo ser um valor anedótico (BF₁₀ entre 1,00 e 3,00), moderado (BF₁₀ entre 3,00 e 10,00), forte (BF₁₀ entre 10,00 e 30,00), muito forte (BF₁₀ entre 30,00 e 100,00) e extremo (BF₁₀ maior que 100,00) para a hipótese alternativa, ou anedótico (BF₁₀ entre 1,00 e 0,33), moderado (BF₁₀ entre 0,33 e 0,01), forte (BF₁₀ entre 0,01 e 0,03), muito forte (BF₁₀ entre 0,03 e 0,01) e extremo (BF₁₀ menor que 0,01) para a hipótese nula (Silva et al., 2022; Wagenmakers et al., 2018).

Essa abordagem estatística foi escolhida devido a sua ênfase nas evidências analisadas através da comparação das hipóteses nula, que pressupõe que não há interação entre as variáveis analisadas, e alternativa, que pressupõe que há interação entre as variáveis, e valores de parâmetros anteriores aos dados e após a coleta das evidências, sendo calculadas as probabilidades relativas de duas ou mais hipóteses (ver revisão em Young, 2019).

Resultados

Inicialmente, foi realizada a análise das três sessões da Fase 1 (Figura 1 – A) e observou-se que o grupo Ext apresentou em média uma maior taxa de resposta em todas as três sessões (Sessão 1: M = 11,96; SEM = 1,34; Mdn = 11,55; Sessão 2: M = 11,96; SEM = 1,50; Mdn = 11,55 e Sessão 3: M = 11,96; SEM = 1,32; Mdn = 11,55) em comparação ao grupo Ext+JAQ (Sessão 1: M = 9,55; SEM = 1,56; Mdn = 8,84; Sessão 2: M = 10,43; SEM = 0,98; Mdn = 9,87 e Sessão 3: M = 10,27; SEM = 1,01; Mdn = 9,80). A ANOVA bayesiana mostrou apenas evidência anedótica em relação ao grupo (BF₁₀ = 0,96). Nenhuma tendência no comportamento foi observada no desempenho dos grupos, contudo, dois participantes do Grupo Ext e dois do Grupo Ext+JAQ apresentaram taxas de respostas superiores à média dos grupos (EXT2: 17,9; 12,5 e 12,63. EXT3: 12,63; 20,53 e 17,78. JAQ1: 16,75; 14 e 13,6. JAQ4: 9,8; 12,46 e 12,81. Para mais detalhes sobre os desempenhos individuais ver Figura 2).

Figura 1

A- Média das Taxas de Respostas dos Grupos Ext e Ext+JAQ Durante as Três Fases Experimentais. B- Média da Proporção das Taxas de Respostas Durante a Fase 2 em Comparação com a Última Sessão da Fase 1. C- Média Percentual Acumulada das Taxas de Respostas dos Grupos Ext e Ext+JAQ Durante a Fase 2. D- Média da Proporção das Taxas de Respostas Durante a Fase 3 em Comparação com a Última Sessão da Fase 2. As Barras nos Gráficos são Representativas do Erro Padrão. A Sigla LB Indica a Linha de Base Durante a Fase 1 e a Sigla PUN Indica a Sessão em que o Estímulo Aversivo Estava Presente

B-

Ao analisar a primeira sessão da Fase 2 (Figura 1 – B), observamos que ambos os grupos diminuíram a taxa de resposta. O Grupo Ext apresentou em média uma proporção de resposta de 0,33 (SEM = 0,01; Mdn = 0,32), enquanto o grupo Ext+JAQ teve em média uma proporção de 0,13 (SEM = 0,02; Mdn = 0,11), ou seja, o grupo Ext+JAQ apresentou uma supressão da resposta 60,61% maior que o grupo Ext. O teste t bayesiano apontou evidências extremas para a diferença entre os grupos (BF₁₀ = 287,63 para H₁ = Ext > Ext+JAQ).

Figura 2

A- Taxas de Respostas dos Sujeitos do Grupo Ext Durante as Três Fases Experimentais. B- Taxas de Respostas dos Sujeitos do Grupo Ext+JAQ Durante as Três Fases Experimentais. A Sigla PUN Indica a Sessão em que o Estímulo Aversivo Estava Presente

Na segunda sessão da Fase 2, quando o JAQ já não estava presente, o grupo Ext+JAQ apresentou em média uma proporção da resposta de 0,21 (SEM= 0,05; Mdn = 0,18), enquanto o grupo Ext (não punido) apresentou em média uma proporção da resposta de 0,14 (SEM= 0,03; Mdn= 0,13), ou seja, o grupo Ext apresentou uma supressão da resposta 33,34% maior que o grupo Ext+JAQ. A análise intra-sujeitos da segunda sessão em comparação com a primeira sessão da Fase 2 mostrou que o grupo Ext+JAQ teve um aumento de 61,54% na proporção da resposta, enquanto o grupo Ext apresentou uma diminuição de 57,58% na proporção da resposta. Na terceira sessão da Fase 2 (Figura 1 – B), os sujeitos apresentaram um desempenho semelhante entre os grupos (Ext: M= 0,05; SEM= 0,01; Mdn= 0,05. Ext +JAQ M= 0,07; SEM= 0,01; Mdn= 0,06). O teste t bayesiano dessas sessões mostrou apenas evidências anedóticas para a diferença entre os grupos (Sessão 2: BF₁₀ = 1,081; Sessão 3: BF₁₀ = 0,86 para H₁ = Ext < Ext+JAQ).

A ANOVA bayesiana das três primeiras sessões de extinção mostrou que houve efeito anedótico do grupo (BF₁₀ = 0,49) e efeitos extremos da sessão (BF₁₀ = 189,76) e sessão + grupo (BF₁₀ = 106,73), com uma interação sessão * grupo (BF₁₀ = 444394,26), o que sugere que as mudanças da proporção da resposta durante as sessões de extinção foram diferentes para cada um dos grupos. Provavelmente, esse resultado, que coloca em evidência as variáveis grupo e sessão, se deve ao efeito da introdução da punição durante a primeira sessão desta fase.

Em relação ao percentual cumulativo (Figura 1 – C), para as três primeiras sessões da Fase 2, observamos que em geral o grupo Ext apresentou uma média do percentual cumulativo maior que o grupo Ext+JAQ. Na primeira sessão da Fase 2 os grupos apresentaram os mesmos dados da análise de proporção. Na segunda sessão, o grupo Ext apresentou um percentual cumulativo médio de 48,58 (SEM= 4,34; Mdn = 48,12) e o grupo Ext+JAQ apresentou um percentual de 35,10 (SEM= 8,24; Mdn = 25,76). Na terceira sessão, o grupo Ext apresentou percentual cumulativo médio de 54,42 (SEM= 4,98; Mdn = 53,95) e para o grupo Ext+JAQ de 42,74 (SEM= 9,76; Mdn = 31,30). O teste t bayesiano mostrou apenas evidências anedóticas para a diferença entre os grupos (Sessão 2: BF₁₀ = 1,50; Sessão 3: BF₁₀ = 1,05 para H₁ = Ext > Ext+JAQ).

A análise dos dados cumulativos mostra que os grupos finalizaram essa fase com um percentual cumulativo médio de respostas de 68,18 para o grupo Ext e de 60,21 para o grupo Ext+JAQ (Figura 1 – C), ou seja, o grupo Ext+JAQ finalizou a Fase 2 com uma supressão da resposta 11,69% maior que o grupo Ext. O teste t bayesiano dessa sessão mostrou evidências anedóticas para a diferença entre os grupos (BF₁₀ = 0,65 para H₁ = Ext > Ext+JAQ).

Na Fase 3, todos os sujeitos apresentaram aumento da resposta em relação ao responder ao final da Fase 2 (Figura 1 - D). Na primeira sessão de recondicionamento, o Grupo Ext apresentou em média uma proporção de resposta de 188,05 (SEM = 84,18; Mdn = 130,42), enquanto o Grupo Ext+JAQ apresentou em média uma proporção de respostas de 142,47 (SEM = 58,33; Mdn = 72,18), ou seja, o grupo Ext apresentou um recondicionamento da resposta 24,24% maior que o grupo Ext+JAQ. As respostas de ambos os grupos continuaram a aumentar durante as demais sessões, apresentando proporções de 245,46 (SEM = 93,94; Mdn = 177,3) e 176,76 (SEM = 75,34; Mdn = 100,62) na segunda sessão e de 250,00 (SEM = 90,31; Mdn = 197,96) e 178,80 (SEM = 85,93; Mdn = 96,98) na terceira sessão para os grupos Ext e Ext+JAQ, respectivamente. Assim, o grupo Ext finalizou o experimento com um recondicionamento da resposta 28,48% maior que o grupo Ext+JAQ. A ANOVA bayesiana sugere um efeito moderado da sessão (BF₁₀ = 7,06), com um efeito anedótico do grupo (BF₁₀ = 0,82) e um efeito moderado de sessão + grupo (BF₁₀ = 6,00). O teste t para comparações das três sessões apresentou evidências anedóticas na diferença das respostas entre os grupos (Sessão 1: BF₁₀ = 0,63; Sessão 2 e 3: BF₁₀ = 0.69 para H₁ = Ext > Ext+JAQ).

Observamos que durante a Fase 3 houve uma maior variabilidade entre os sujeitos de cada grupo. No grupo Ext os sujeitos EXT4, EXT5 e EXT6 apresentaram uma proporção de respostas de 192; 202,33 e 582 na primeira sessão; 248,5; 326,66 e 661 na segunda sessão e 342,5; 306,33 e 626 na terceira sessão, enquanto no grupo Ext+JAQ os sujeitos JAQ4 e JAQ6 apresentaram uma proporção de 410 e 199,66 na primeira sessão; 544,5 e 177 na segunda sessão e 605; 135,33 na terceira sessão. Essa variabilidade está refletida no erro padrão de cada grupo que se sobrepôs em todas as sessões dessa fase.

Ao comparar o desempenho da Fase 1 com a Fase 3, foi possível observar que o grupo Ext apresentou uma proporção média de 0,77 (SEM = 0,09; Mdn = 0,73); 1,08 (SEM = 0,12; Mdn = 0,95) e 1,13 (SEM = 0,14; Mdn = 1,04) na primeira, segunda e terceira sessão, respectivamente, e o grupo Ext+JAQ apresentou uma proporção média de 1,02 (SEM = 0,17; Mdn = 1,01); 1,30 (SEM = 0,22; Mdn = 1,19) e 1,28 (SEM = 0,25; Mdn = 1,11). Em relação ao desempenho individual, os sujeitos de ambos os grupos mostraram maior variabilidade na proporção da resposta, com destaque para os sujeitos EXT1 (grupo Ext) e JAQ5 (grupo Ext+JAQ) que apresentaram as maiores proporções de respostas em todas as três sessões (1,11; 1,35 e 1,62 para EXT1 e 1,80; 2,30 e 2,38 para JAQ5). A ANOVA bayesiana sugere um efeito extremo da sessão (BF₁₀ = 333,53) e da sessão + grupo (BF₁₀ = 255,15), com um efeito muito forte sessão + grupo com uma interação sessão * grupo (BF₁₀ = 96,12) e um efeito anedótico para grupo (BF₁₀ = 0,73). O teste t bayesiano mostrou apenas evidências anedóticas em relação à diferença entre os grupos (Sessão 1: BF₁₀ = 1,230; Sessão 2: BF₁₀ = 0,87; Sessão 3: BF₁₀ = 0,65 para H₁ = Ext < Ext+JAQ).

Em resumo, os principais resultados observados neste experimento foram: (1) os grupos não apresentaram diferenças significativas na taxa de resposta durante a linha de base; (2) Durante a apresentação contingente do estímulo aversivo, os sujeitos do grupo Ext+JAQ apresentaram uma supressão de resposta maior que os sujeitos que foram submetidos somente à extinção (Grupo Ext); (3) na segunda sessão da Fase 2, após a retirada do estímulo aversivo, o grupo Ext apresentou uma supressão da resposta maior que o grupo Ext+JAQ, contudo, a diferença estatística foi apenas anedótica; (4) A recuperação da resposta para o grupo Ext+JAQ, quando comparada com a primeira sessão da Fase 2, ficou evidente com a análise intra-sujeitos, enquanto o grupo Ext continuou apresentando proporções de resposta mais baixas; (5) a análise cumulativa mostrou que o grupo Ext+JAQ permaneceu com um percentual médio inferior ao grupo Ext, contudo, devido a variabilidade intra-sujeitos observada no dado, a análise estatística mostrou apenas evidências anedóticas para essa diferença; (6) os grupos finalizaram a Fase 2 com proporções de respostas semelhantes, contudo, quando analisado o percentual cumulativo, foi observado que não houve uma igualação no total de respostas emitidas entre os grupos ao final dessa fase; (7) ambos os grupos aumentaram a taxa de resposta na fase de recondicionamento. O grupo Ext apresentou um recondicionamento da resposta maior que o grupo Ext+JAQ, mas, devido a variabilidade nos dados, a diferença entre os grupos foi apenas anedótica e (8) ambos os grupos apresentaram um aumento da proporção da resposta na Fase 3 (recondicionamento) em comparação com a Fase 1 (reforçamento), mas não houve diferenças significativas entre os grupos.

Discussão

O presente estudo teve como objetivo avaliar o efeito da punição no responder durante sessões de extinção e de recondicionamento, utilizando o jato de ar quente como estímulo aversivo, buscando identificar em quais momentos haveria supressão transitória (como observada por Skinner, 1938, por exemplo) em quais momentos ocorreria uma supressão permanente (como observado por Boe & Church, 1967). Especificamente foram analisadas diferentes ocasiões, sendo elas: durante a apresentação do estímulo aversivo, após a remoção do estímulo aversivo, ao final da fase de extinção e na fase recondicionamento da resposta durante a reintrodução do estímulo reforçador. A discussão foi organizada com o intuito de responder as perguntas levantadas na introdução do presente estudo, destacando os momentos que normalmente são utilizados para avaliar os efeitos da punição.

1 - Houve diferença na taxa da resposta entre os grupos durante a Fase 1? Embora o grupo Ext tenha demonstrado uma taxa de resposta superior à do grupo Ext+JAQ durante a linha de base, a análise estatística revelou que essa discrepância não era estatisticamente significativa para influenciar a comparação entre os grupos. Esta abordagem foi adotada devido às limitações do presente estudo em assegurar a equivalência entre os grupos antes da exposição ao JAQ, o que incluiu o tamanho reduzido da amostra e a ausência de critérios de estabilidade da resposta durante a linha de base. Portanto, a análise estatística nessa fase foi crucial para determinar se havia diferenças significativas entre os grupos que não estavam relacionadas ao tratamento experimental. Para uma avaliação mais precisa dos efeitos da punição utilizando o JAQ, estudos futuros poderiam considerar uma amostra maior e garantir a igualdade da taxa da resposta entre os grupos durante a linha de base sem punição. 2 - Houve diferença na proporção da resposta (em comparação com a linha de base) durante apresentação do estímulo aversivo? Um dos principais resultados mostrou que o JAQ foi efetivo em reduzir a taxa de resposta do grupo punido (Ext+JAQ) durante a sua apresentação. A redução do responder na presença do evento aversivo contingente a resposta de pressão a barra, observada durante a Fase 2, corrobora com resultados obtidos por Skinner (1938); Estes (1944); Boe e Church (1967); Mayer e Carvalho Neto (2016); Silva e Carvalho Neto (2022); que demonstraram que o estímulo aversivo aplicado contingente à resposta produz uma diminuição abrupta da frequência, ocasionando uma redução mais rápida do responder quando comparado à apresentação exclusiva da extinção.

Esses resultados também corroboram com outros estudos sobre punição que ao analisar o efeito de uma variedade de estímulos aversivos, como ruído e perda de pontos, observaram que os mesmos produzem uma rápida diminuição da resposta ao qual foi contingente (Herman & Azrin, 1964; Raiff et al., 2008). Inclusive, as pesquisas já atestaram que a punição agiria mais rapidamente e em maior extensão na supressão do comportamento do que outros procedimentos comportamentais, como a extinção, saciedade e reforço diferencial (Lerman & Vorndran, 2002).

3 - Houve diferença entre os grupos na proporção da resposta (em comparação com a linha de base) após a retirada do estímulo aversivo? Apesar da maioria dos estudos terem observado o efeito supressor dos estímulos aversivos contingentes às respostas, as críticas à eficácia da punição questionam a manutenção do mesmo em médio e longo prazo, pois outro fator que é comumente relatado é o aumento da frequência da resposta (recuperação) após a retirada do estímulo aversivo (Boe & Church, 1967; Estes, 1944; Mayer & Carvalho Neto, 2016; Silva & Carvalho Neto, 2022; Skinner, 1938). Contudo, o fenômeno denominado por Estes (1944) de recuperação compensatória, em que, logo após a retirada do estímulo aversivo, ocorre o aumento da frequência do grupo punido ao ponto de ultrapassar a frequência do grupo não punido e, consequentemente, ser observada a igualação dos grupos no total de respostas emitidas ao final da fase de extinção, não foi observado no estudo de Boe e Church (1967).

Os resultados obtidos na Fase 2 corroboram, em parte, com os resultados de Boe e Church (1967). Quando a análise dos dados tem como base a proporção da resposta em comparação com o desempenho na linha de base (Figura 1 - B), foi observado que a frequência dos sujeitos punidos foi maior que as dos sujeitos não punidos durante a segunda sessão da Fase 2, em que o estímulo aversivo não estava presente, evidenciando a recuperação da resposta. Contudo, ao observar o percentual acumulado da resposta na Fase 2 (Figura 1 - C), observa-se que a recuperação do responder do grupo punido após a remoção da punição não foi suficiente a ponto de ultrapassar ou se igualar ao percentual acumulado do grupo controle. Dessa forma, observa-se que se a análise fosse baseada exclusivamente no percentual acumulado, informações cruciais sobre o desempenho dos grupos seriam negligenciadas na avaliação.

Azrin e Holz (1966) mencionaram duas possíveis explicações para a recuperação da resposta observada imediatamente após a retirada da punição. A primeira afirma que a recuperação pode ser resultado de um efeito de contraste na contingência analisada. Esse efeito pode ser observado quando alterações na taxa de reforço e punição são seguidas por uma alta taxa de respostas. Dessa forma, o aumento da frequência da resposta depois da descontinuação da punição seria produto da transição de uma frequência alta de punição para uma frequência mais baixa.

Ao comparar o presente estudo com a pesquisa conduzida por Silva e Carvalho Neto (2022), nota-se uma similaridade significativa nos métodos empregados. Ambos os estudos foram realizados no mesmo ambiente experimental, empregando o mesmo estímulo aversivo e seguindo arranjos experimentais similares. Contudo, Silva e Carvalho Neto (2022) observaram que houve um aumento da resposta imediatamente após a retirada do aversivo e, ao final das sessões de extinção (Fase 2), o grupo punido apresentou um total de resposta mais elevado que o do grupo não punido, diferindo-se do resultado do presente estudo. O estudo de Silva e Carvalho Neto utilizaram o esquema de punição contínua (FR 1) durante 10 minutos, enquanto o presente estudo utilizou um esquema de punição em um FI 30 s durante 15 minutos. Com base na hipótese de contraste proposta por Azrin e Holz (1966), o esquema de punição contínua implicaria em uma maior densidade de eventos aversivos, ocasionando um contraste maior entre o período em que o estímulo aversivo estava presente para o período somente de extinção e, consequentemente, taxas de respostas mais elevadas após a retirada do estímulo aversivo. Como nenhum dos estudos citados (e.g., Boe & Church, 1967; Estes, 1944; Mayer & Carvalho Neto, 2016; Silva & Carvalho Neto, 2022; Skinner, 1938) buscou verificar especificamente essa hipótese, futuros trabalhos poderiam manipular diferentes taxas de punição para avaliar a recuperação da resposta após a retirada do estímulo aversivo.

A segunda explicação apresentada por Azrin e Holz (1966) sugere que o estímulo aversivo pode adquirir propriedades discriminativas através da associação explícita da punição com a presença ou ausência do estímulo reforçador, o que pode interferir nas propriedades supressivas usuais da punição. No estudo de Skinner (1938), os sujeitos passaram por um período somente de reforço e logo em seguida por um período de extinção simultânea à punição. Como na fase de reforçamento nenhuma punição foi programada, a disponibilidade do reforço pode ter sido correlacionada à ausência de punição. Já a segunda parte do procedimento, em que a punição foi aplicada logo no início do período de extinção, pode ter produzido outra correlação entre punição e extinção, tornando o estímulo punitivo um sinal de que o reforço não estava disponível. O término desse período de punição seria similar à fase inicial de reforço, ocasionando o aumento no responder (Azrin & Holz, 1966). Contudo, a interpretação proposta por Skinner (1938) teve como foco de análise apenas as propriedades aversivas do estímulo utilizado, o que fez com que o autor considerasse como temporários os efeitos da punição.

A hipótese do efeito discriminativo foi corroborada com o estudo de Shahan et al. (2023) que, ao replicar o arranjo experimental do estudo de Estes (1944), observou o aumento abrupto da resposta após a retirada do choque elétrico, mas em outros arranjos experimentais em que a punição estava presente durante a fase de reforço, o aumento da resposta ocorreu de forma mais gradual e em menor escala após a retirada do estímulo aversivo. Assim, como o estudo de Boe e Church (1967) e o atual estudo utilizaram arranjos experimentais similares ao de Estes (1944), o aumento da resposta observada em ambos os estudos poderia estar mais relacionado às propriedades discriminativas dos estímulos aversivos empregados do que com a possível ineficácia dos mesmos em suprimir a resposta.

4 - Houve diferença no percentual cumulativo entre os grupos da resposta ao longo das sessões de extinção? A principal divergência entre os estudos citados (Boe & Church, 1967; Estes, 1944; Mayer & Carvalho Neto, 2016; Silva & Carvalho Neto, 2022; Skinner, 1938) se deve ao fato de que, ao longo das sessões de extinção quando o estímulo aversivo não está mais presente, parte dos estudos observaram a recuperação da resposta entre sujeitos punidos ao ponto da média dos grupos se igualarem ao final da fase de extinção (e.g., Estes, 1944; Mayer & Carvalho Neto, 2016; Skinner, 1938). Por outro lado, Boe e Church (1967) observaram que os sujeitos punidos continuaram a responder menos que os sujeitos não punidos ao final da fase de extinção. Os dados do presente estudo, quando analisados a partir do percentual de respostas acumuladas durante a Fase 2 (Figura 1 – C), se aproximam dos resultados de Boe e Church (1967), uma vez que a média do percentual acumulado foi ligeiramente maior para o grupo Ext ao final da Fase 2. Nesse caso, o resultado obtido com o JAQ estaria próximo ao resultado obtido com a intensidade mais baixa do choque elétrico (35 V) do estudo de Boe e Church (1967), em que os grupos apresentaram taxas de respostas aproximadas, mas não iguais.

Boe e Church (1967) sugeriram que as divergências nos resultados podem decorrer da diferença nas intensidades dos estímulos aversivos, visto que em contextos que foram utilizados o choque elétrico em altas voltagens a taxa de resposta continuou baixa. O estudo de Skinner (1938) utilizou um tapa na pata que dependia da intensidade com a qual os sujeitos pressionavam a barra, o que não garantia que o estímulo agisse de forma uniforme para todos ou mesmo para um único sujeito (Mayer & Carvalho Neto, 2016). Já o estudo de Estes (1944) não apresentou a intensidade do choque elétrico utilizado; sendo possível supor, a partir dos níveis supressivos observados, que o valor utilizado foi mais brando que a menor intensidade empregada no experimento de Boe e Church (35 V).

Os estudos de Mayer e Carvalho Neto (2016) e Silva e Carvalho Neto (2022), assim como o presente estudo, utilizaram o JAQ como estímulo aversivo, que possui limitações em relação à manipulação da intensidade, podendo ser utilizado em apenas um nível de aquecimento. Assim, tendo como base o total de respostas emitidas dos grupos punidos que se aproximaram (estudo atual), se igualaram (Mayer & Carvalho Neto, 2016), ou ultrapassaram (Silva & Carvalho Neto, 2022) os grupos controles; supõe-se que a intensidade alcançada nesses estudos pode ser considerada leve ou moderada, pelo menos nesse contexto em que o JAQ foi aplicado, visto que a punição severa é classificada como aquela que reduz a resposta para zero e não mostra recuperação durante a extinção (Azrin & Holz, 1966; Estes, 1944; Shahan et al., 2023).

Outro fator importante na avaliação dos efeitos da punição são as medidas utilizadas nos estudos. O presente estudo adotou medidas semelhantes às de Boe e Church (1967) e observou que quando é considerada apenas a análise visual das medidas de tendência central (média), os dados parecem indicar que existe uma diferença entre os grupos no percentual acumulado das respostas ao longo das sessões de extinção (Figura 1 – C), similar às observações feitas por Boe e Church utilizando a mediana. Contudo, ao realizar a análise estatística paramétrica, análise que mantém a natureza da medida e considera a variabilidade do dado, divergindo-se do estudo de Boe e Church que utilizaram testes estatísticos não paramétricos de postos, que transformam a medida em posições e são menos sensíveis a magnitude da variabilidade do dado, o presente estudo verificou que essa diferença não era significativa a ponto de dizer que as médias dos grupos diferiram ao final da Fase 2. Esse resultado torna-se mais evidente com a análise da proporção da resposta ao final da Fase 2 (Figura 1 – B) que mostra que ambos os grupos suprimiram igualmente a resposta. Uma vez que tanto o procedimento de punição quanto o de extinção resultam em diminuição da taxa da resposta alvo, a supressão observada no grupo punido não pode ser diretamente atribuída à apresentação do estímulo aversivo.

Como o estudo de Boe e Church (1967) não disponibilizou os dados individuais ou informações sobre a variabilidade dos resultados, que permitiria uma inspeção visual mais detalhada, a confiabilidade dos dados apresentados pode ser questionada, principalmente para os dados das intensidades mais baixas de choque elétrico, tento em vista que os testes não paramétricos, por utilizarem posições de observação ao invés de valores reais dos dados (Politi et al., 2021), possuem menor poder estatístico e dificultam a identificação de diferenças significativas entre os grupos analisados (Campbell & Swinscow, 2009).

Portanto, consideramos que a discussão não deve se concentrar em qual medida de análise é a mais apropriada, mas sim na importância da complementaridade dessas medidas. Assim como mencionado anteriormente sobre as discrepâncias entre a análise do percentual acumulado e a proporção da resposta na Fase 2, a análise visual dos dados, quando tomada isoladamente, pode acabar desconsiderando informações significativas sobre os desempenhos dos grupos e, consequentemente, fornecer resultados imprecisos.

Para além da discussão sobre as medidas utilizadas, Rachlin (1966) sugeriu outra interpretação acerca dos efeitos permanentes e temporários da punição. O autor analisou os efeitos da recuperação do responder após uma punição suave e após repetidas exposições a essa punição e concluiu que a punição pode ter dois efeitos: uma supressão forte e repentina que seria resultado de um efeito eliciador/ emocional, sendo independente da relação contingente entre a estimulação aversiva e a resposta; e um efeito instrumental/operante permanente que seria oposto ao efeito do reforçamento. O aparecimento desse último seria gradual, variando conforme a intensidade do estímulo aversivo, além de requerer uma relação contingente entre o estímulo aversivo e a resposta.

Os estudos mencionados anteriormente (Boe & Church, 1967; Estes, 1944; Mayer & Carvalho Neto, 2016; Silva & Carvalho Neto, 2022; Skinner, 1938), assim como o presente estudo, tiveram apenas um breve período de punição e isso pode não ter sido suficiente para observar o efeito supressivo prolongado. Nesse caso, a recuperação da resposta pode ser devido à dissipação dos efeitos emocionais relacionados à curta exposição ao estímulo aversivo. Futuros trabalhos podem avaliar essa variável a partir da inclusão de grupos experimentais expostos a um período prolongado de punição (maior que 15 minutos) ou com a inclusão de mais sessões de punição.

5 - Houve diferença entre os grupos na proporção da resposta (com a fase de punição/extinção) durante o recondicionamento da resposta? Em relação aos resultados obtidos na Fase 3 de recondicionamento, os dados do presente estudo corroboram com os resultados de Boe e Church (1967) e Silva e Carvalho Neto (2022), em que todos os sujeitos aumentaram a taxa de resposta com a reintrodução do estímulo reforçador. Contudo, a análise descritiva dos dados mostrou que a proporção da resposta do grupo punido foi inferior à do grupo não punido, assim como o estudo de Boe e Church (1967). Similar ao que ocorreu durante a Fase 2, a medida adotada para analisar os dados pode levar a diferentes interpretações do efeito da punição. Se for considerada apenas a análise visual dos dados, supõe-se que a história de punição pode afetar as relações comportamentais mesmo quando o estímulo reforçador está presente. Todavia, a análise estatística apresentou apenas evidências anedóticas para a diferença entre os grupos, não sendo possível afirmar que a história prévia de punição afetou a reaquisição da resposta para o grupo punido. Estudos futuros poderiam aprofundar a análise do possível impacto da história prévia de punição nas interações comportamentais dos sujeitos durante reexposições à Fase 2 e Fase 3.

6- Houve diferença entre os grupos na proporção da resposta (em comparação com a linha de base) durante o recondicionamento da resposta? Ao analisar a taxa de resposta da Fase 3 em relação a Fase 1 (reforçamento), observou-se que os dois grupos apresentaram taxas maiores de respostas durante a reintrodução do estímulo reforçador. Esse dado também corrobora com a hipótese do contraste comportamental, visto que o contraste já foi observado tanto na presença de punição (Brethower & Reynolds, 1962) quanto em esquemas de extinção (Terrace, 1963). Coates (1972) discute os resultados do contraste como sendo resultado da manipulação da privação produzida pelos esquemas de punição e extinção, levando a produção de taxas de respostas mais altas nas condições de reforço que os seguem.

Ainda não é possível afirmar se a fase de recondicionamento operante é a melhor opção para medir os efeitos da punição, mas ela se mostra uma opção viável para analisar como a interação entre histórias prévias distintas (reforçamento, punição e extinção) podem afetar a reaquisição da resposta. Estudos sobre ressurgência, renovação e reaquisição da resposta estão buscando compreender melhor a recuperação do responder após extinção. De modo geral, eles interpretam que a extinção resulta em um novo aprendizado que depende diretamente do contexto em que ocorre, logo, mudanças nesses contextos contribuiria para o reaparecimento da resposta (Bouton et al., 2012). Outros estudos também avaliaram a função da punição no reaparecimento da resposta (e.g., Boton & Schepers, 2015; Shahan et al., 2023) e concluíram que ela pode seguir os mesmos princípios da extinção. Pesquisas futuras podem se aprofundar nessa área para identificar os parâmetros que aumentam a probabilidade da recuperação do responder após a punição.

Percebe-se ainda que as teorias simétrica e assimétrica sobre a durabilidade dos efeitos da punição apresentam coerência em suas proposições e dados que as corroboram, logo, uma sugestão seria que a discussão não se concentrasse na questão de qual teoria seria a correta, mas sim na possibilidade da existência de fenômenos comportamentais distintos que são classificados como punição e que poderiam apresentar efeitos supressivos duradouros ou temporários, como sugerido por Carvalho Neto, Mayer e Ferreira (2017). Assim, dependendo do estímulo utilizado, da ocasião da medida e da métrica adotada, a durabilidade da supressão oscilaria entre efeitos breves até efeitos permanentes (e.g., Carvalho Neto et al., 2017; Rachlin, 1966).

Material suplementario

Referências

Azrin, N. H., & Holz, W. C. (1966). Punishment. In: W. K. Honig (Ed.), Operant behavior: Areas of research and application (pp. 380-447). AppletonCentury-Crofts.

Boe, E. E., & Church, R. M. (1967). Permanent effects of punishment during extinction. Journal of Comparative Psychology, 63, 486-492. https://doi. org/10.1037/h0024632

Bouton, M. E., Winterbauer, N. E., & Todd, T. P. (2012). Relapse processes after the extinction of instrumental learning: Renewal, resurgence, and reacquisition. Behavioural Processes, 90(1), 130-141. https://doi.org/10.1016/j.beproc.2012.03.004

Bouton, M. E., & Schepers, S. T. (2015). Renewal after the punishment of free operant behavior. Journal of Experimental Psychology: Animal Learning and Cognition, 41(1), 81-90. https://doi.org/10.1037/xan0000051

Brethower, D.M., & Reynolds, G.S. (1962). A facilitative effect of punishment on unpunished behavior. Journal of the Experimental Analysis of Behavior, 5(2), 191-199. https://doi.org/10.1901/jeab.1962.5-191

Carvalho Neto, M. B., Mayer, P. C. M., & Ferreira, P. A. (2017). Simetrias e assimetrias entre reforçamento e punição: Uma proposta taxonômica. Acta Comportamentalia, 25, 73-84. https://www.revistas.unam.mx/index.php/acom/article/view/58802

Campbell, M. J., & Swinscow, T.D.V. (2009). Statistics at square one. 11th ed. Hoboken, Wiley-Blackwell.

Coates, T. J. (1972). The differential effects of punishment and extinction on behavioral contrast. Psychonomic Science, 27(3), 146-148. https://doi. org/10.3758/BF03328918

Estes, W. K. (1944). An experimental study of punishment. Psychological Monographs, 57, 1-40. https://doi.org/10.1037/h0093550

Herman, R.L., & Azrin, N.H. (1964). Punishment by noise in an alternative response situation. Journal of the Experimental Analysis of Behavior, 7, 185-188. https://doi.org/10.1901/jeab.1964.7-185

Holth, P. (2005). Two definitions of punishment. The Behavior Analyst Today, 6(1), 43-47. https://doi.org/10.1037/h0100049

Lerman, D. C., & Vorndran, C. (2002). On the status of knowledge for using punishment: Implications for treating behavior disorders. Journal of Applied Behavior Analysis, 35, 431-464. https://doi.org/10.1901/jaba.2002.35-431

Mayer, P. C. M., & Carvalho Neto, M. B. (2016). A systematic replication of Skinner (1938) using a hot air blast as the punisher. Revista Brasileira de Análise do Comportamento, 12(2), 126-132. http://dx.doi.org/10.18542/ rebac.v12i2.4405

Mayer, P. C. M., & Gongora, M. A. N. (2011). Duas formulações comportamentais de punição: Definição, explicação e algumas implicações. Acta Comportamentalia, 19 (monográfico), 4-63. https://www.revistas.unam.mx/ index.php/acom/article/view/36938

Politi, M.T., Ferreira, J.C., & Patino, C. M. (2021). Nonparametric statistical tests: friend or foe?. J Bras Pneumol, 47(4), 1-2. https://doi.org/10.36416/18063756/e20210292

Rachlin, H. (1966). Recovery of responses during mild punishment. Journal of the Experimental Analysis of Behavior, 9(3), 251-263. https://doi.org/10.1901/ jeab.1966.9-251

Raiff, B. R., Bullock, C. E., & Hackenberg, T. D. (2008). Response-cost punishment with pigeons: Further evidence of response suppression via token loss. Learning & Behavior, 36(1), 29-41. https://doi.org/10.3758/LB.36.1.29

Santos, B. C. & Carvalho Neto, M. B. (2019). B. F. Skinner’s evolving views of punishment: I. 1930-1940. Revista Mexicana de Análisis de la Conducta, 45(2), 149-172. https://www.revistas.unam.mx/index.php/rmac/article/view/75561

Shahan, T. A., Sutton, G. M., Nist, A. N., & Davison, M. (2023), Aversive control versus stimulus control by punishment. Journal of the Experimental Analysis of Behavior, 119, 104-116. https://doi.org/10.1002/jeab.805

Silva, E. M. N., & Carvalho Neto, M. B. (2022). Efeito de linha de base VI sobre operante em extinção precedida por punição em ratos. Perspectivas em Análise do Comportamento, 12(2), 349-362. https://www.revistaperspectivas. org/perspectivas/article/view/816

Silva, M., Viana, F., Pani, N., Cursiol, J., Foresti, Y., Assis, M., Batista, D., Santos, E., Barbieri, R., Dalri, M. (2022). Análise da efetividade das compressões torácicas externas realizadas por bombeiros durante treinamento na pandemia Covid-19. Research, Society and Development, 11, 1-13. https://doi.

Skinner, B. F. (1938). The behavior of organisms. Appleton-Century-Crofts.

Storms, L. H., Boroczi, G., & Broen, W. E. Jr. (1962). Punishment inhibits an instrumental response in hooded rats. Science, 135(3509), 1133-1134. https:// doi.org/10.1126/science.135.3509.1133

Terrace, H. S. (1963). Errorless transfer of a discrimination across two continua. Journal of the Experimental Analysis of Behavior, 6(2), 223-232. https://doi. org/10.1901/jeab.1963.6-223

Wagenmakers, E. J., Marsman, M., Jamil, T., Ly, A., Verhagen, J., Love, J., Selker, R., Gronau, Q. F., Šmíra, M., Epskamp, S., Matzke, D., Rouder, J. N., & Morey, R. D (2018). Bayesian inference for psychology. Part I: Theoretical advantages and practical ramifications. Psychonomic Bulletin & Review,

Young, M. E. (2019), Bayesian data analysis as a tool for behavior analysts. Journal of the Experimental Analysis of Behavior, 111, 225-238. https://doi. org/10.1002/jeab.512

Notas

Figura 2