Contexto dependiente de una respuesta En un procedimiento de renovación en ratas

Rodrigo Benavides; Rogelio Escobar

Artículos de investigación

Recepción: 24 Junio 2019

Aprobación: 12 Diciembre 2019

DOI: https://doi.org/10.5514/rmac.v45.i2.76137

Financiamiento

Fuente: CONACYT

Nº de contrato: 775974

Beneficiario: Rodrigo Benavides

Financiamiento

Fuente: PAPIIT

Nº de contrato: IN305819

Beneficiario: Rogelio Escobar

Resumen: La renovación contextual ocurre cuando tras reforzar una respuesta en un contexto y extinguirla en otro diferente, se observa la reaparición de la conducta al reintroducir el contexto de reforzamiento. La función que adquieren los estímulos contextuales durante estos procedimientos no es totalmente clara. Existen reportes que indican que dicha estimulación parece tener una función discriminativa o que podría tener una función reforzante pero no existe evidencia directa de estos efectos. Para identificar la función de los estímulos de contexto, se expuso a dos grupos de ratas Wistar a un procedimiento de renovación modificado, en el que durante la última fase se presentó el contexto asociado a reforzamiento dependiente de una respuesta. En un grupo cada respuesta producía el contexto durante 5 s y en el otro durante 20 s. Las respuestas que producían el contexto fueron más frecuentes en el grupo de 20 s que en el de 5 s. A pesar de que el contexto asociado a reforzamiento funcionó como reforzador condicionado en ambos grupos, la renovación de respuestas fue limitada. Los resultados sugieren que las respuestas mantenidas por la presentación del contexto pueden interferir con la función discriminativa del estímulo.

Palabras clave: renovación, función del contexto, reforzamiento condicionado, estímulo discriminativo, ratas.

Abstract: Contextual renewal occurs when after reinforcing a response in one context and extinguishing it in a different one, the response reappears when the context of reinforcement is reintroduced. The role that contextual stimuli acquire under these procedures is not entirely clear. There are reports indicating that such stimuli could have a discriminative or a reinforcing function but there is no direct evidence of these effects. To identify the function of the context stimuli, two groups of Wistar rats were exposed to a modified renewal procedure, in which during the last phase the context associated with reinforcement was presented dependent on a response. In one group, a response produced the context for 5 s and in the other for 20 s. Responses that produced the context were more frequent in the group with 20 s context presentation than in the group with 5 s. Although it was found that the context associated with reinforcement functioned as a conditioned reinforcer in both groups, renewal of responses during the context presentation was infrequent. The results suggest that responses maintained by the presentation of the context could have interfered with the discriminative function of the stimulus.

Keywords: renewal, context function, conditioned reinforcement, discriminative stimulus, rats.

Introducción

La recurrencia de conducta comúnmente se estudia por medio de procedimientos de tres fases (Bouton, 2004). En la primera fase se entrena una conducta. En la segunda fase se presenta un disruptor de dicha conducta. En la tercera fase, comúnmente denominada de prueba, se evalúa la recurrencia de la conducta contingente a un cambio en las condiciones experimentales. La mayoría de la investigación respecto a fenómenos de recurrencia se ha orientado a estudiar las variables responsables del aumento o decremento de la conducta blanco durante la fase de prueba y a estudiar los efectos de procedimientos de extinción como disruptor (Todd, 2013), por lo que se ha prestado poca atención al análisis de la función del contexto. Debido a que los cambios en el contexto han sido importantes en el estudio de la reaparición de conducta después de una fase de extinción, el análisis de la función del contexto podría dar información útil para entender los diferentes fenómenos de recurrencia de la conducta.

Tratando de explicar los hallazgos relacionados al fenómeno de renovación, los autores del aprendizaje asociativo, Bouton y sus colaboradores, han interpretado la función del contexto asociado a reforzamiento como análoga a un estímulo condicional adicional en la preparación experimental (Bouton, 2004). Por ejemplo, Bouton y King (1983) realizaron una prueba de preferencia al contexto con el objetivo de obtener información sobre las propiedades del contexto como estímulo condicional aversivo. Entrenaron ratas en un procedimiento de renovación de supresión condicionada. En los procedimientos de supresión condicionada se mide el nivel de supresión como un decremento en las presiones a la palanca ocasionado por la presentación de un estímulo asociado a la presentación de un estímulo aversivo. En el experimento, Bouton y King asociaron la presentación de un tono o una luz a una descarga eléctrica para posteriormente examinar si tras la extinción de la asociación en un contexto distinto se podía observar un efecto de renovación de la supresión al presentar el tono o luz en presencia del contexto de entrenamiento original. Los autores colocaron a sus sujetos en compartimentos adyacentes a las cámaras de condicionamiento operante, dejando una rejilla abierta para que las ratas pudieran entrar. Por medio de acuerdo entre observadores, se registró el tiempo que las ratas pasaban dentro de la caja anexa o la caja de condicionamiento. Aun cuando el indicador de supresión utilizado en los experimentos no mostró el nivel de renovación esperado, es decir, las presiones a la palanca no se redujeron al grado de la primera fase, encontraron un efecto significativo de aversión al contexto, pues los organismos que ya habían sido expuestos a las descargas eléctricas dentro de las cajas de condicionamiento operante preferían pasar la mayor parte del tiempo en la caja anexa. Con base en este resultado, puede concluirse que el contexto adquirió una función aversiva a partir de su asociación con las descargas eléctricas. A partir de este hallazgo, los autores concluyeron que tomar la medida de supresión condicionada como único dato de evidencia de renovación, podría ocultar datos interesantes sobre la conducta de las ratas y el rol del contexto en la conducta. A pesar de estos resultados, Bouton y sus colaboradores reconocieron que esta interpretación no es del todo precisa, pues la asociación del contexto con un estímulo incondicional no es una cualidad necesaria ni suficiente para que éste module las respuestas que ocurren ante un estímulo condicional (Bouton, Westbrook, Corcoran & Maren, 2006). Todd, Vurbic, y Bouton (2014) también han sugerido que posiblemente el contexto durante reforzamiento adquiera más bien una función discriminativa, pues parece indicar la ocasión para que la conducta ocurra, más que evocarla directamente en términos de estímulo condicional.

Una posible interpretación conductual de las hipótesis de Bouton, es que el contexto de reforzamiento puede adquirir la función de un estímulo discriminativo al señalar la ocasión para que una respuesta sea reforzada. Otra función que podría adquirir el contexto es la de reforzador condicionado. Dado que Bouton y King (1983) demostraron que un contexto puede adquirir la misma función que el estímulo incondicional y al paralelo que existe entre los principios del condicionamiento respondiente y el reforzamiento condicionado (véase Kelleher & Gollub, 1962) es razonable asumir que el estímulo de contexto puede adquirir una función reforzante, de tal manera que la estimulación contextual debería poder utilizarse para establecer y mantener conducta cuando se presenta como consecuencia de esta. Bouton y sus colaboradores reconocieron que aún no se tiene una explicación definitiva sobre el efecto del contexto y señalaron la importancia de continuar la investigación (Todd, Vurbic & Bouton, 2014). Por esto, el propósito del siguiente experimento es examinar si el contexto asociado a reforzamiento en un procedimiento de renovación adquiere una función de estímulo discriminativo, de reforzador condicionado o de ambos.

Si un estímulo de contexto puede adquirir una función de reforzador condicionado, debería poder usarse para establecer y mantener conducta novedosa al presentarse de manera contingente a la conducta. De manera similar, si un estímulo de contexto adquiere una función como estímulo discriminativo, debería ser efectivo señalando la ocasión para que una conducta previamente reforzada en su presencia ocurra.

Con el fin de identificar si los estímulos contextuales adquieren alguna de estas funciones, se les permitió a los sujetos tener control sobre la presencia del estímulo de contexto dentro de la cámara de condicionamiento por medio de presiones a una palanca, (palanca Contexto). A la vez, se registró la presión a la palanca que durante la primera fase del procedimiento estuvo mantenida por un programa de reforzamiento intermitente. Si los sujetos experimentales responden de manera tal que generen los estímulos contextuales asociados a periodos de reforzamiento, y posteriormente se observa un incremento en la respuesta originalmente reforzada en presencia del estímulo, se podría decir que los estímulos están cumpliendo con una doble función de reforzadores condicionados y estímulos discriminativos.

Se utilizó una tercera palanca (palanca Control) dentro de la cámara para distinguir la posible función de los estímulos contextuales como reforzador condicionado de las presiones que podrían deberse a otros efectos como nivel operante o un aumento en la actividad general de las ratas. Otra forma de garantizar que la producción del estímulo de contexto se debe a un efecto de reforzamiento condicionado es variar la duración del estímulo. Un hallazgo común en la literatura sobre reforzamiento condicionado es que la duración del estímulo asociado con el reforzador primario determina su valor como reforzador condicionado (Auge, 1973; Dinsmoor, Mulvaney, y Jwaideh, 1981; Fernández-Sordo, Torres-Ceja, Flores-Aguirre y Escobar, 2015). Por ejemplo, Fernández-Sordo et al. mostraron que la adquisición de una respuesta que producía un estímulo asociado con comida era más rápida y más frecuente cuando la duración del estímulo fue de 10 s que cuando fue de 5 s o 0.5 s. Por lo tanto, en el presente experimento se usaron dos grupos de ratas expuestas a dos duraciones (5 y 20 s) del contexto dependiente de la respuesta. Esta manipulación permitió aportar información sobre si los estímulos utilizados como contexto tienen un efecto similar al de un reforzador condicionado. El uso de un diseño de grupo permitió eliminar un posible efecto de acarreo entre condiciones.

Método

Sujetos

Ocho ratas Wistar macho obtenidas del bioterio de la Facultad de Psicología de la UNAM experimentalmente ingenuas de aproximadamente 3 meses de edad sirvieron como sujetos experimentales. Se les mantuvo al 80% de su peso en alimentación libre por privación de alimento, teniendo acceso libre al agua. Los sujetos fueron divididos en dos grupos de cuatro ratas cada uno; el grupo 5S y el grupo 20S. La exposición al procedimiento fue la misma para ambos grupos excepto durante la tercera fase.

Aparatos

Se construyó una cámara de condicionamiento operante de 30 × 20 × 20 cm por medio de impresión en 3D. Los paneles frontal y trasero, el mecanismo de las palancas y el armazón de la cámara fueron impresos en ácido poliláctico, comúnmente conocido por su abreviación PLA, que es un plástico obtenido a partir del almidón de maíz. Para las palancas se utilizaron láminas de acero inoxidable calibre 16. Para los paneles laterales se utilizaron láminas de acrílico transparente de 3 mm. En el centro del panel frontal se encontraba una apertura de 5 × 5 cm con una charola conectada a un dispensador de alimento. A los lados de la apertura había ranuras de 1 × 5 cm para colocar dos palancas adicionales durante la última fase del procedimiento. La parte superior del panel frontal contaba con dos luces blancas de 3 cm de diámetro, una encima de cada ranura para palanca. En la parte inferior central del panel trasero se encontraba una palanca, mientras que en la parte superior central se localizaba una luz de iluminación general. Para evitar un sesgo entre las dos palancas que se introdujeron en la última fase, estas se colocaron equidistantes a la zona en la que se entregaban los reforzadores. Siguiendo la misma lógica, la palanca de reforzamiento se situó centrada en el panel trasero para mantenerla equidistante de las palancas que se introdujeron en la última fase del procedimiento.

La cámara se situó en el interior de un cubículo sonoamortiguado con bocinas que reproducían ruido blanco durante la sesión, lo que ayudaba a enmascarar ruidos externos. Se utilizaron pellets purificados de precisión marca Bioserv de 45 mg como reforzador. La interfaz de control estuvo a cargo de una tarjeta Arduino UNO y programación en Visual Basic (Escobar & Pérez-Herrera, 2015). Se utilizó una computadora DELL Modelo Inspiron 5420 para manejar la interfaz y recolectar los datos.

Procedimiento

Las sesiones se llevaron a cabo diariamente en el mismo horario, teniendo una duración máxima de 45 minutos.

Preentrenamiento. Previo al inicio de las fases experimentales se entrenó la respuesta de presión a la palanca central del panel trasero por medio del reforzamiento de aproximaciones sucesivas durante una sesión, seguido de cinco sesiones en las que estuvo vigente un programa de intervalo variable (IV) que fue aumentando hasta alcanzar un valor de 30 s. Con el fin de evitar posibles efectos de historia, se entrenaron las presiones a la palanca en un contexto diferente al que estaría vigente durante las sesiones experimentales; las luces de la cámara permanecieron apagadas, no se reprodujo ruido blanco y la puerta del cubículo sonoamortiguado permaneció abierta.

Fase 1 – Entrenamiento en el Contexto A. Se reforzaron las presiones a la palanca del panel trasero conforme a un programa de IV 30 s hasta la entrega de 75 reforzadores o hasta un máximo de 45 min. Los valores del IV se calcularon conforme a la progresión de Fleshler y Hoffman (1962), utilizando 10 iteraciones que se repetían aleatoriamente sin repetición. Como Contexto A, la luz de iluminación general y la luz situada a la izquierda del panel frontal se encendieron y apagaron con una intermitencia de 0.25 s desde el inicio hasta el final de cada sesión. Esta fase se mantuvo vigente durante 30 sesiones.

Fase 2 – Extinción en el Contexto B. Las respuestas en la palanca del panel trasero fueron expuestas a un procedimiento de extinción en el que se eliminó la entrega de alimento. Como Contexto B, la luz de iluminación general y la luz situada a la izquierda del panel frontal se mantuvieron parpadeando con una intermitencia de 3 s desde el inicio hasta el final de cada sesión. Esta fase se mantuvo vigente durante 10 sesiones.

Fase 3 – Prueba. Las respuestas en la palanca del panel trasero continuaron en extinción y la intermitencia de la luz se mantuvo igual que en el Contexto B de la fase previa. Dos nuevas palancas se introdujeron en la cámara, una a la izquierda y otra a la derecha de la charola para alimento. Las presiones a la palanca izquierda, palanca Contexto, cambiaban la intermitencia de las luces a 0.25 s, conforme al Contexto A, durante 5 s para el grupo 5S, y durante 20 s para el grupo 20S, tras los cuales se revertía la intermitencia a 3 s. Las presiones a la palanca Control fueron registradas, pero no tenían consecuencias programadas. Esta fase se mantuvo vigente durante seis sesiones.

Resultados

En los paneles izquierdos de la Figura 1 se muestran las presiones por minuto a la palanca del panel trasero durante las tres fases del procedimiento para las cuatro ratas del grupo 5S. La primera columna de los paneles corresponde a la Fase 1, en la que se reforzaron las presiones a la palanca del panel trasero. Se muestran únicamente los datos de las 6 últimas sesiones de esta fase. Para todas las ratas las respuestas alcanzaron un nivel estable. En la segunda columna se reportan las últimas 6 sesiones de la Fase 2, en la que las respuestas en la palanca del panel trasero se expusieron a extinción. La tasa de respuestas fue cercana a cero para todas las ratas. En la tercera columna se reportan las primeras tres sesiones de la Fase 3, en la que se llevó a cabo la prueba de renovación para las respuestas en la palanca del panel trasero. Similar a la fase previa, la tasa fue cercana a cero para todas las ratas.

Figura 1
Presiones a la palanca del Grupo 5S

Presiones a la palanca de las cuatro ratas del grupo 5S. En los paneles de la izquierda se muestran las presiones por minuto en la palanca de reforzamiento para cada fase. En los paneles de la derecha se muestran las presiones totales de las palancas Contexto y Control durante las sesiones de prueba.

En los paneles derechos de la Figura 1 se muestran las presiones a la palanca totales para las palancas Contexto y Control que fueron introducidas en la cámara operante durante la Fase 3. Las respuestas en la palanca Control fueron más frecuentes que las respuestas en la palanca Contexto para R01, R02 y R04, mientras que para R03 la cantidad de respuestas en la palanca Contexto fue ligeramente mayor que en la palanca Control.

En los paneles izquierdos de la Figura 2 se muestran las presiones por minuto a la palanca del panel trasero durante las tres fases del procedimiento para las cuatro ratas del grupo 20S. La primera columna de los paneles corresponde a la Fase 1. Se muestran únicamente los datos de las 6 últimas sesiones de esta fase. Para todas las ratas las respuestas se mantuvieron en un nivel estable. En la segunda columna se reportan las 6 sesiones de la Fase 2, en la que las respuestas en la palanca del panel trasero se expusieron a extinción. Para R06 y R07 la tasa de respuestas se redujo drásticamente desde la segunda sesión de extinción, mientras que para R05 y R08 la reducción fue menos pronunciada. A pesar de esto, para la sexta sesión la tasa fue cercana a cero para todas las ratas. En la tercera columna se reportan las primeras tres sesiones de la Fase 3, en la que se llevó a cabo la prueba de renovación para las respuestas en la palanca del panel trasero. Para R05 se observó un decremento en la tasa respecto a las respuestas ocurridas en el periodo de extinción. En el resto de las ratas, sin embargo, se observó un aumento en la tasa respecto a las respuestas ocurridas en la fase anterior. Dicho incremento fue ligero para R08 y se dejó de observar rápidamente para R07. Para R06 se mantuvo e incremento durante las dos sesiones posteriores.

Figura 2
Presiones a la palanca del Grupo 20s

Presiones a la palanca de las cuatro ratas del grupo 20S. En los paneles de la izquierda se muestran las presiones por minuto en la palanca de reforzamiento para cada fase. En los paneles de la derecha se muestran las presiones totales de las palancas Contexto y Control durante las sesiones de prueba

En los paneles del lado derecho de la Figura 2 se muestran las presiones a la palanca para las palancas Contexto y Control que fueron introducidas durante la Fase 3. Las respuestas en la palanca Contexto fueron consistentemente más frecuentes que las respuestas en la palanca Control durante las dos primeras sesiones para todas las ratas. En R05 se llegaron a observar hasta 72 presiones en la palanca Contexto durante la primera sesión, las cuales fueron decreciendo, hasta ser superadas por las respuestas en la palanca Control en la tercera sesión. En R06 se observaron hasta 158 respuestas en la palanca Contexto, las cuales nunca fueron superadas por las ocurridas en la palanca Control. En R07 se observaron hasta 58 respuestas que rápidamente decrecieron, y en R08 se llegaron a observar hasta 27 respuestas durante la segunda sesión de prueba, siendo 17 la máxima cantidad de respuestas observadas en la palanca Control.

En el panel superior izquierdo de la Figura 3 se muestra la proporción de respuestas que ocurrieron en la palanca del panel trasero dentro y fuera de la estimulación contextual asociada a reforzamiento durante la primera fase para las ratas del grupo 5S. Para R01, R02 y R04, el 100% de las respuestas ocurrieron en ausencia del estímulo. Es decir, a pesar de que el estímulo se presentó frecuentemente durante las sesiones, no ocurrían respuestas mientras este se encontraba activo. Para R03 cerca del 40% de las respuestas a la palanca del panel trasero ocurrieron en presencia del contexto de reforzamiento.

En el panel superior derecho de la Figura 3 se muestra la proporción de respuestas que ocurrieron en la palanca del panel trasero dentro y fuera de la estimulación contextual asociada a reforzamiento durante la primera fase para las ratas del grupo 20S. Para todas las ratas fue mayor la proporción de respuestas que ocurrieron fuera del estímulo, aunque para R06 se llegó a observar casi un 40% de las respuestas en presencia del estímulo. A pesar de que el estímulo se presentó frecuentemente durante las sesiones, en general la proporción de respuestas que ocurrían mientras el estímulo estaba encendido era relativamente baja. Se realizó un análisis estadístico para determinar si la diferencia entre las medias de las proporciones de respuestas observadas en las palancas Contexto de los dos grupos eran estadísticamente significativas. Se utilizó una prueba . de Student para muestras independientes, la cual mostró una diferencia significativa (. < 0.05, . (6) = −4.680).

Figura 3
Proporciones de respuestas para las ratas de ambos grupos

Proporciones de respuestas para las cuatro ratas de ambos grupos. Proporción de respuestas que ocurrieron dentro y fuera del contexto de reforzamiento durante las sesiones de prueba en los paneles de arriba. Proporción de presiones totales a las palancas Contexto y Control durante las sesiones prueba en los paneles de abajo.

En el panel inferior izquierdo de la Figura 3 se observan la proporción de respuestas totales a las palancas Contexto y Control durante las sesiones de prueba para el grupo 5S. Para R01, R02 y R04 se observó una mayor proporción de respuestas en la palanca Control, con un 50 a 60% de las respuestas. Para la rata R03 ocurrieron más respuestas en la palanca Contexto, un 52% de las respuestas.

El panel inferior derecho de la Figura 3 muestra la proporción de respuestas totales a las palancas Contexto y Control durante las sesiones de prueba para el grupo 20S. Se observó una mayor proporción de respuestas en la palanca Contexto para todas las ratas, con valores que alcanzaron entre el 60 y 70% de las respuestas.

En los paneles del lado izquierdo de la Figura 4 se observan las presiones a las tres palancas durante la primera sesión de prueba a través del tiempo para las ratas del grupo 5S. Se observaron respuestas únicamente durante la primera mitad de la sesión para R01 y R02, mientras que R04 se mantuvo activo durante toda la sesión, particularmente en la palanca Control. A diferencia de los otros sujetos, se observaron respuestas únicamente durante los primeros minutos de la sesión para R03, aunque las presiones a la palanca del panel trasero (Renovación) y la palanca Contexto correlacionan de manera positiva. En los paneles del lado derecho de la Figura 4 se observan las presiones a las tres palancas durante la primera sesión de prueba a través del tiempo para las ratas del grupo 20S. Para R05 se observaron respuestas durante toda la sesión, principalmente en la palanca Contexto, mientras que para R06, R07 y R08 la mayor parte de las respuestas se registró al inicio de la sesión. Para R07 y R08, a diferencia de los otros sujetos, se observó contigüidad temporal entre las presiones a la palanca del panel trasero (Renovación) y las presiones a la palanca Contexto. Para las cuatro ratas, se observó una mayor frecuencia de respuestas en la palanca Contexto en comparación con las demás palancas.

Figura 4
Presiones acumuladas a cada una de las palancas

Presiones acumuladas a cada una de las palancas en bins de un minuto durante la primera sesión de prueba para ambos grupos de ratas. Se muestran las presiones acumuladas para las ratas del grupo 5S a la izquierda, y para las ratas el grupo 20S a la derecha.

Discusión

El propósito del presente experimento fue identificar si los estímulos de contexto en un procedimiento de renovación adquirían una función discriminativa, una reforzante o ambas. Para esto, se les permitió a los sujetos tener control sobre la presencia del estímulo contextual dentro de la cámara de condicionamiento por medio de presiones a una palanca adicional a la de reforzamiento introducida durante la fase de prueba.

Para las ratas del grupo 5S, se observaron respuestas con relativa frecuencia en las palancas Control y Contexto que se introdujeron en la Fase 3 del experimento, pero se observó una marcada preferencia por la palanca Control en tres de las ratas. Solamente para R03 podría afirmarse que el contexto adquirió una función de reforzador condicionado pues ocurrieron más respuestas en la palanca Contexto que en la palanca Control. Es importante señalar que para la misma rata se observó un ligero aumento en la frecuencia de las respuestas a la palanca del panel trasero (Renovación) durante la fase de prueba relativo a la fase de extinción, lo cual podría considerarse un leve efecto de renovación. Los efectos en las ratas del grupo 20S fueron más claros. Para todas las ratas la frecuencia de respuestas en la palanca Contexto fue mayor que en la palanca Control. Lo cual puede interpretarse como resultado del efecto reforzante del estímulo de contexto. Para tres de las cuatro ratas se observó un efecto de renovación en las respuestas a la palanca del panel trasero. La diferencia entre los grupos 5S y 20S fue el tiempo durante el cual se presentaban los estímulos contextuales. El marcado incremento en la cantidad de respuestas que ocurrieron en las palancas Contexto y Control en el grupo 20S respecto al grupo 5S es congruente con los estudios previos en la literatura sobre reforzamiento condicionado (Dinsmoor, Mulvaney, & Jwaideh, 1981), que sostiene que una mayor duración de estímulo aumenta el valor de un reforzador condicionado. En este caso la frecuencia de respuestas en la palanca Contexto sirve como indicador de dicho valor. La menor frecuencia en la palanca Control sirve como referencia, pues las presiones a esa palanca únicamente eran registradas, pero no tuvieron consecuencias programadas.

Una explicación complementaria para el efecto de reforzamiento condicionado del estímulo de contexto es que el estímulo asociado con extinción hubiese adquirido una función aversiva. De esta forma, las presiones a la palanca Contexto pudieron haber estado mantenidas por una contingencia de escape, pues eliminaban momentáneamente la estimulación contextual asociada a extinción. Esta interpretación también es congruente con la literatura sobre reforzamiento condicionado, en la que se plantea que un estímulo asociado a extinción puede adquirir propiedades aversivas, ya que señala la ausencia de entrega del reforzador (véase Gaynor & Shull, 2002). Sin embargo, dicho efecto, aunque podría explicar algunos resultados obtenidos en los estudios de renovación (véase Bouton, 2002) no se ha probado directamente. Por lo tanto, a la fecha no existe evidencia de que el estímulo asociado con la fase de extinción tenga de hecho una función aversiva.

Resulta intrigante que el efecto de renovación, a pesar de ser un hallazgo robusto en estudios previos (Bouton, 2000; 2002; 2004), con el presente procedimiento solamente se observó en una rata en el grupo 5S y en tres ratas en el grupo 20S. Adicionalmente, relativo a las respuestas observadas durante la Fase 1, la frecuencia de las respuestas fue considerablemente menor durante la fase de prueba. Una posible explicación de por qué no se observó un efecto de renovación más marcado en las presiones a la palanca del panel trasero para tres de los cuatro sujetos de este grupo es que los estímulos no adquirieron una función de estímulo discriminativo. Esto, sin embargo, es improbable. Estudios previos mostraron que un reforzador condicionado puede adquirir simultáneamente la función de estímulo discriminativo (Dinsmoor, 1983). Eso llevó a algunos autores a sugerir que la función de los estímulos puede ser intercambiable (véase Keller & Schoenfeld, 1950). A pesar de que es cuestionable si la función es de hecho intercambiable (véase Kelleher & Gollub, 1962) en la mayoría de los casos un reforzador condicionado refuerza la conducta que lo produce y señala la ocasión para que una respuesta (independientemente de si se registra o no) sea reforzada. Siguiendo este razonamiento, en el presente estudio una explicación para la falta de un efecto robusto de renovación es que las respuestas en la palanca de Contexto compitieran con las respuestas en la palanca de renovación en el panel trasero. Esto es, el efecto reforzante de los estímulos pudo limitar que las ratas se alejaran de la palanca de Contexto para responder en la palanca de reforzamiento. A pesar de que se aportó información sobre las condiciones bajo las cuales los estímulos de contexto pueden adquirir propiedades reforzantes, la respuesta a la pregunta central del trabajo sigue siendo difícil de responder; existe una clara necesidad de continuar las manipulaciones experimentales para identificar la función de los estímulos contextuales.

Cançado, Lattal, Carpenter, y Solley (2017) demostraron un efecto similar al observado en el presente experimento utilizando palomas como sujetos experimentales en un procedimiento de resurgimiento. Los procedimientos de resurgimiento se diferencian de los de renovación por el hecho de que, durante la segunda fase, en lugar de introducir una disrupción (extinción), se refuerza una conducta alternativa, es decir, se refuerza alguna conducta distinta a la de la primera fase. En su procedimiento, Cançado et al., expusieron a sus sujetos a dos diferentes frecuencias de reforzamiento independiente de la respuesta, cada una vigente durante una determinada estimulación contextual, la cual variaba en función de picotazos a una tecla. En su primer experimento, una luz de color estaba correlacionada con el 25% de alimento, mientras que una luz blanca estaba correlacionada con el 75%. Los picotazos a una tecla dentro de la cámara de condicionamiento cambiaban los estímulos contextuales de una iluminación a la otra. En una segunda fase, las probabilidades de entrega de reforzadores fueron invertidas para las luces. En la fase de prueba, se descontinuó la entrega de reforzadores independientes a la respuesta, y se observó como a pesar de esto, las palomas preferían pasar el tiempo en presencia de la estimulación contextual que había estado vigente durante la primera fase del procedimiento. Los autores interpretaron estos resultados como resurgimiento de asignación temporal, pues los organismos preferían mantener vigente la estimulación contextual que se encontraba vigente durante la primera fase en lugar de la vigente durante la segunda fase, a pesar de ser equivalentes. En un experimento posterior, se agregó estimulación contextual distinta; si las palomas no picaban ninguna tecla se encendía una iluminación “neutra”, durante la cual no se entregaba alimento. Los sujetos tenían la opción de picar cualquiera de dos teclas distintas, una que generaba la iluminación y el programa relacionado con el 25% de entrega de alimento, mientras que la otra tecla generaba la iluminación y programa relacionado con el 75% de la entrega de alimento. Después de algunos segundos en cualquiera de esas dos condiciones, el programa regresaba a la iluminación en la que no se entregaba alimento. Esta manipulación permitió no solamente identificar en cuál de los contextos los sujetos pasaban un mayor tiempo, sino que permitió establecer una respuesta operante con cierta tasa como indicador de la preferencia de los sujetos. Esto apunta a un posible efecto de reforzamiento condicionado en los estímulos que fungen como contexto durante la tarea experimental, pues los sujetos picoteaban en mayor proporción la tecla que había sido correlacionada con una mayor frecuencia de reforzamiento durante la fase inicial en la fase de prueba. Este hallazgo es congruente con los resultados del presente trabajo y sugiere que los organismos prefieren mantener contacto con el contexto de reforzamiento, lo cual pudo interferir con el control discriminativo del estímulo.

Una explicación alternativa de la falta de un efecto robusto de renovación es que la introducción de las palancas Contexto y Control en sí mismo podría interpretarse como un cambio en el espacio experimental, por lo que el procedimiento actual podría considerarse de renovación ABC. Con los procedimientos de renovación ABC en general se ha reportado un efecto menos robusto que con los procedimientos ABA (Bouton, Winterbauer y Todd, 2012). Aunque la introducción de las palancas produjo un cambio en el contexto, es poco probable que el cambio hubiera alterado el contexto de forma significativa. Es necesario realizar más investigación para descartar que el cambio en la cámara de condicionamiento pudiera atenuar el efecto de renovación. Sin embargo, una analogía con la que se han interpretado los efectos de renovación relativo a ambientes clínicos es que la renovación puede verse como análogo de las recaídas de conducta problema (Balooch, Neumann & Boschen, 2012; Bouton, García-Gutiérrez, Zilski, & Moody, 2006; Bouton, Kenney & Rosengard, 1990). Desde el punto de vista aplicado, podría decirse que el contexto en el que ocurre la renovación no es necesariamente idéntico al contexto de adquisición de la conducta, sino que puede haber elementos nuevos (palancas Contexto y Control), así como elementos habituales (intermitencia de la luz). Relativo a esta analogía, también resulta interesante la diferencia observada en el nivel de renovación entre los grupos de 5 y 20 s; dado que se observó un mayor efecto de renovación para el grupo de 20 s, podría argumentarse que toma un mayor tiempo de exposición a los estímulos desarrollar la sensibilidad a estos. El que la duración de un estímulo module el efecto de renovación es interesante y podría ser atendido en futuras investigaciones.

Por último, cabe mencionar que los hallazgos del presente trabajo podrían parecer tener ciertas implicaciones aplicadas distintas de lo que normalmente se sugiere en la literatura. Por ejemplo, el consumo de sustancias tóxicas podría reaparecer después de extinción si se regresa al contexto en el que la conducta problema ocurrió inicialmente. El atenuado efecto de renovación que se observó en los sujetos del presente trabajo, aunado a la alta tasa de respuestas en la palanca Control, podría verse como análogo a la conducta de un organismo que se dirige al contexto asociado a consumo de sustancias tóxicas, pero no consume en presencia del contexto. Si bien se podría interpretar que volver el acceso al contexto de consumo dependiente de una respuesta tiene un efecto que atenúa la recurrencia de la conducta, es muy probable que en situaciones aplicadas esto no se sostenga, pues por lo general cuando las personas acuden a un contexto asociado al consumo la conducta de consumo es inminente. La interpretación de que el contexto asociado a extinción adquiera propiedades aversivas podría ser más congruente con lo que se observa en ambientes aplicados, aunque sigue sin dar explicación sobre por qué una vez que se presenta el contexto asociado a reforzamiento las respuestas en la palanca de reforzamiento son escasas. Por lo anterior, se sugiere cautela al tratar de extrapolar los hallazgos en condiciones de laboratorio como explicaciones para la conducta humana compleja.

Agradecimientos

El presente manuscrito es resultado de los estudios de doctorado del primer autor, quién se encuentra inscrito en el Programa de Doctorado en Psicología de la Universidad Nacional Autónoma de México (UNAM). El primer autor agradece a CONACYT por el apoyo otorgado por medio de la beca nacional al CVU 775974. El segundo autor recibió apoyo del PAPIIT IN305819. Los autores agradecen a los revisores del presente documento por los comentarios.

Referencias

Auge, R. J. (1973). Effects of stimulus duration on observing behavior maintained by differential reinforcement magnitude. Journal of the Experimental Analysis of Behavior, 20, 429-438.

Balooch, S. B., Neumann, D. L., & Boschen, M. J. (2012). Extinction treatment in multiple contexts attenuates ABC renewal in humans. Behaviour Research and Therapy, 50, 604-609.

Bouton, M. E. (2000). A learning theory perspective on lapse, relapse, and the maintenance of behavior change. Health Psychology, 19, 57-63.

Bouton, M. E. (2002). Context, ambiguity, and unlearning: sources of relapse after behavioral extinction. Biological Psychiatry, 52(10), 976-986.

Bouton, M. E. (2004). Context and behavioral processes in extinction. Learning & Memory, 11(5), 485-494.

Bouton, M. E., García-Gutiérrez, A., Zilski, J., & Moody, E. W. (2006). Extinction in multiple contexts does not necessarily make extinction less vulnerable to relapse. Behaviour Research and Therapy, 44, 983-994.

Bouton, M. E., Kenney, F. A., & Rosengard, C. (1990). State-dependent fear extinction with two benzodiazepine tranquilizers. Behavioral Neuroscience, 104, 44-55.

Bouton, M. E., & King, D. A. (1983). Contextual control of the extinction of conditioned fear: Tests for the associative value of the context. Journal of Experimental Psychology: Animal Behavior Processes, 9(3), 248-265.

Bouton, M. E., Westbrook, Corcoran, K. A., & Maren, S. (2006). Contextual and temporal modulation of extinction: Behavioral and biological mechanisms. Biological Psychiatry, 60(4), 352-360.

Bouton, M. E., Winterbauer, N. E., & Todd, T. P. (2012). Relapse processes after the extinction of instrumental learning: renewal, resurgence, and reacquisition. Behavioural Processes, 90, 130-141.

Cançado, C. X., Lattal, K. A., Carpenter, H. K., & Solley, E. A. (2017). Resurgence of time allocation. Journal of the Experimental Analysis of Behavior, 108(3), 398-413.

Dinsmoor, J. A. (1983). Observing and conditioned reinforcement. Behavioral and Brain Sciences, 6(4), 693-728.

Dinsmoor, J. A., Mulvaney, D. E., & Jwaideh, A. R. (1981). Conditioned reinforcement as a function of duration of stimulus. Journal of the Experimental Analysis of Behavior, 36, 41-49.

Escobar, R., & Pérez-Herrera, C. A. (2015). Low‐cost USB interface for operant research using Arduino and Visual. Journal of the Experimental Analysis of Behavior, 103(2), 427-435.

Fernández-Sordo, G., Torres-Ceja, C., Flores-Aguirre, C., & Escobar, R. (2015). El papel de la duración de los estímulos en la adquisición de la conducta de observación. Revista Mexicana de Análisis de la Conducta, 41(3), 28-47.

Fleshler, M., & Hoffman, H. S. (1962). A progression for generating variable-interval schedules. Journal of the Experimental Analysis of Behavior, 5(4), 529-530.

Gaynor, S. T., & Shull, R. L. (2002). The generality of selective observing. Journal of the Experimental Analysis of Behavior, 77(2), 171-187.

Kelleher, R. T., & Gollub, L. R. (1962). A review of positive conditioned reinforcement. Journal of the Experimental Analysis of Behavior, 5(4), 543-597.

Keller, F. S., & Schoenfeld, W. N. (1950). Principles of psychology: A systematic text in the science of behavior. USA: Appleton-Century-Crofts

Todd, T. P. (2013). Mechanisms of renewal after the extinction of instrumental behavior. Journal of Experimental Psychology, 39(3), 193-207.

Todd, T. P., Vurbic, D., & Bouton, M. E. (2014). Behavioral and neurobiological mechanisms of extinction in Pavlovian and instrumental learning. Neurobiology of Learning and Memory, 108, 52-64.