Análisis del restablecimiento de la respuesta usando reforzadores cualitativamente diferentes

Olga M. Dionisio; Alicia Roca

resúmenes

secciones

referencias

imágenes

Resumen: El restablecimiento ocurre cuando una respuesta previamente eliminada recurre como consecuencia de entregar reforzadores independientes de la conducta. Típicamente los experimentos constan de tres fases; 1) se entrena una respuesta, 2) se extingue la respuesta, y 3) se entregan reforzadores independientemente de la conducta. El propósito del estudio fue comparar los efectos de entregar el mismo reforzador y reforzadores cualitativamente diferentes en las Fases 1 y 3 sobre el restablecimiento de las presiones a la palanca y de los patrones temporales de respuesta en ratas. En la Fase 1, las respuestas se reforzaron conforme a un programa de intervalo fijo 30 s. En la Fase 2, las respuestas se extinguieron. En la Fase 3, se entregaron reforzadores independientemente de la conducta de los sujetos. En condiciones sucesivas, se entregó el mismo reforzador o reforzadores diferentes en las Fases 1 y 3. El restablecimiento de la respuesta ocurrió en las dos condiciones, sin embargo, el grado de restablecimiento fue mayor cuando se empleó el mismo reforzador. Los patrones temporales de respuesta se restablecieron únicamente en la condición del mismo reforzador. El restablecimiento de la conducta al emplear diferentes reforzadores podría constituir un caso de renovación de la respuesta.

Palabras clave:restablecimiento de la respuestarestablecimiento de la respuesta, reforzadores cualitativamente diferentes reforzadores cualitativamente diferentes, patrones de respuesta patrones de respuesta, presiones a la palanca presiones a la palanca, ratas ratas.

Abstract: Reinstatement occurs when previously suppressed responding recurs as a function of the delivery of response-independent reinforcers. Typically, studies use a three-phase procedure: 1) a response is established; 2) the response is extinguished; and 3) response- independent reinforcers are delivered. The purpose of the study was to compare the effects of delivering the same reinforcers and different reinforcers in Phases 1 and 3 on reinstatement of lever presses and reinstatement of temporal patterns of responding. During Phase 1, rats’ lever presses were maintained by a 30-s fixed-interval schedule. During Phase 2, lever pressing was extinguished. During Phase 3, reinforcers were delivered independently of responding. In successive conditions, the reinforcers delivered during Phases 1 and 3 were of the same type or different. Lever presses were reinstated during both conditions; however, the number of reinstated responses was generally higher when the same reinforcer type was used. Scalloped patterns of responding were reinstated only during the condition in which the reinforcers were of the same type. Reinstatement with qualitatively different reinforcers is discussed as a case of response renewal.

Keywords: response reinstatement, qualitatively different reinforcers, scalloped- response patterns, lever pressing, rats.

Carátula del artículo

Artículos

Análisis del restablecimiento de la respuesta usando reforzadores cualitativamente diferentes

Analysis of Response Reinstatement Using Qualitatively Different Reinforcers

Olga M. Dionisio olga.dionisio@outlook.com

Universidad Nacional Autónoma de México, México

Alicia Roca Alicia.Roca@live.com

Universidad Nacional Autónoma de México, México

Acta Comportamentalia: Revista Latina de Análisis de Comportamiento, vol. 26, núm. 2, pp. 143-155, 2018
Universidad Veracruzana

Recepción: 04 Noviembre 2017

Aprobación: 13 Enero 2018

Es común que después de un procedimiento de eliminación o disminución de la conducta, la conducta tienda a recurrir como consecuencia de la reorganización de las condiciones en las que fue entrenada. A este fenómeno se le conoce como recurrencia de la conducta (Lattal & Wacker, 2015). Existen tres tipos principales de recurrencia: resurgimiento, renovación y restablecimiento de la conducta. En los tres tipos de recurrencia de la conducta operante se entrena una respuesta en una primera fase. Posteriormente, en una segunda fase se emplea un procedimiento de eliminación o disminución de la conducta (e.g., extinción, reforzamiento diferencial de otras conductas o castigo negativo). Finalmente, durante una última fase, se reorganizan las condiciones en que la respuesta fue entrenada (e.g., se entregan reforzadores de manera independiente de la respuesta o se cambia el contexto experimental) y se observa un aumento en la frecuencia de ocurrencia de la respuesta previamente eliminada.

El resurgimiento de la conducta ocurre cuando una segunda respuesta operante se expone a un procedimiento de eliminación o disminución de la conducta y otras respuestas topográficamente diferentes, pero con una función similar y que fueron reforzadas en el pasado recurren ante circunstancias similares (Epstein, 1983, 1985; ver Lattal & St. Pipkin, 2009 para una revisión). El resurgimiento de la conducta se ha estudiado principalmente con un procedimiento de tres fases. En la Fase 1 se entrena una respuesta. En la Fase 2, la respuesta se expone a un procedimiento de eliminación de la conducta y se refuerza una segunda respuesta. En la Fase 3, las dos respuestas se exponen a un procedimiento de eliminación de la conducta y resurge la primera respuesta entrenada (e.g., Cançado, Abreu-Rodrigues, & Aló, 2015; Lieving & Lattal, 2003).

La renovación de la conducta ocurre cuando una respuesta previamente entrenada recurre como consecuencia del cambio de contexto asociado con un procedimiento de eliminación o disminución de la conducta (Bouton & Bolles, 1979; Rosas & Bouton, 1997). El procedimiento de renovación ABA es el que se ha estudiado de manera más extensa. En la Fase 1, se entrena una respuesta en un contexto A. En la Fase 2, se extingue la respuesta en un contexto B. En la Fase 3, se expone al sujeto al contexto A y debido al cambio de contexto, la respuesta previamente entrenada se renueva (ver Bouton, 2004 para una revisión).

El restablecimiento de la conducta ocurre cuando una conducta previamente eliminada recurre como consecuencia de la entrega de reforzadores de manera independiente de la respuesta (e.g., Doughty, Reed, & Lattal, 2004; Reid, 1958). Los estudios sobre restablecimiento de la respuesta típicamente constan de tres fases. En la Fase 1, se entrena una respuesta. En la Fase 2, la respuesta entrenada se expone a un procedimiento de extinción. En la Fase 3, se entrega el reforzador de la Fase 1 de manera independiente de la respuesta. El reforzamiento independiente de la respuesta resulta en el restablecimiento de la respuesta previamente eliminada mediante el procedimiento de extinción.

Reid (1958) realizó uno de los primeros estudios sobre el restablecimiento de la conducta operante, usando a ratas como sujetos. En el Experimento 1, el autor entrenó la conducta de presionar la palanca entregando pellets cada vez que ocurría la respuesta. Posteriormente, el autor expuso a los sujetos a un procedimiento de extinción hasta que las respuestas permanecieron a niveles cercanos a cero. En una tercera fase, Reid entregó pellets conforme a un programa de tiempo fijo (TF) 60 s y encontró restablecimiento de al menos una presión a la palanca. El autor reportó que la presentación de otros estímulos novedosos diferentes a la comida (por ejemplo, el destello de una luz, o la presentación de un tono) no resultó confiablemente en el restablecimiento de la conducta de presión a la palanca para todas las ratas.

El procedimiento del restablecimiento de la conducta se ha usado principalmente para estudiar la recurrencia de las respuestas inicialmente establecidas usando drogas como reforzadores (ver Shaham, Shalev, Lu, de Wit, & Stewart, 2003 para una revisión). Debido a que el procedimiento de restablecimiento involucra la recurrencia de respuestas previamente eliminadas al presentar reforzadores no contingentes a la respuesta, se ha usado extensamente como un modelo de laboratorio de la recaída del consumo de drogas. Por ejemplo, de Wit y Stewart (1981) expusieron a ratas a un programa de reforzamiento continuo (RF 1), en el que cada respuesta a una palanca resultaba en la administración de 1 mg de cocaína mediante un catéter intravenoso. Después de emplear un procedimiento de extinción, los autores inyectaron a las ratas 1 mg de cocaína cada 10 min, independientemente de la conducta de los sujetos. Los autores encontraron el restablecimiento de las presiones a la palanca que inicialmente habían sido entrenadas usando cocaína como reforzador. Además del estudio de de Wit y Stewart, en varios estudios se mostró el restablecimiento de conductas inicialmente mantenidas con otras drogas como las anfetaminas, la heroína y el alcohol (véase See, 2002 para una revisión).

Si bien la mayor parte de los estudios sobre el restablecimiento de la conducta se realizaron con animales no humanos y como un modelo para estudiar la recaída del consumo de drogas, en años recientes el fenómeno de la recurrencia ha sido de especial interés para las intervenciones basadas en el análisis conductual aplicado (ver St. Peter, 2015). Particularmente, el restablecimiento de la conducta es un fenómeno que es necesario considerar durante las intervenciones que involucran la eliminación de las conductas problema en humanos. El restablecimiento de la conducta problema se ha reportado en algunos estudios aplicados. Por ejemplo, Falcomata, Hoffman, Gainey, Muething y Fienup (2013) encontraron restablecimiento de las conductas como golpes, pellizcos y patadas en niños diagnosticados con autismo. En la Fase 1, las conductas problema se reforzaron conforme a un programa de reforzamiento continuo, dando acceso a un iPad® por 30 s. En la Fase 2, expusieron a los niños un procedimiento de extinción. En la Fase 3, dieron acceso al iPad 30 s de manera independiente de la respuesta conforme a un programa tándem TF 2 min- reforzamiento diferencial de otras conductas (DRO) 10 s. El restablecimiento de las conductas problema ocurrió al reintroducir los mismos estímulos que inicialmente mantenían estas conductas y a pesar de que la presentación de dichos estímulos ya no era contingente a la ocurrencia de una respuesta particular.

En la mayoría de los estudios sobre restablecimiento de la conducta, el reforzador empleado para entrenar una conducta en la Fase 1 (entrenamiento) fue el mismo estímulo que se entregó independientemente de la respuesta durante la Fase 3 (restablecimiento). No obstante, existe evidencia de que la presentación de los estímulos asociados con la entrega del reforzador en la Fase 1, resulta en el restablecimiento de la conducta (e.g., Campbell, Phillips, Fixsen, & Crumbaugh, 1968; Reid, 1958; Spradlin, Girardeau, & Hom, 1966). Por ejemplo, Campbell et al. (1968) reforzaron las respuestas a una palanca conforme a un programa de razón variable (RV) 20. Cada vez que se cumplió el requisito de respuesta, los autores entregaron un pellet seguido de la presentación de un click del comedero. Después de usar un procedimiento de extinción, los autores encontraron el restablecimiento de las presiones a la palanca al presentar únicamente el click del comedero durante la tercera fase del experimento. Es importante destacar que el grado de restablecimiento es mayor al emplear el mismo reforzador en las Fases 1 y 3 (e.g., comida) relativo al grado de restablecimiento que se observa al presentar reforzadores condicionados en la Fase 3 (e.g., el click del comedero; ver Campbell et al., 1968, Experimento 3).

En resumen, los estudios sobre restablecimiento de la conducta sugieren que después de implementar un procedimiento de eliminación de la conducta, ésta tiende a recurrir si se reintroducen los mismos estímulos que inicialmente mantuvieron la conducta o bien al presentar estímulos que estuvieron asociados con la entrega del reforzador en la Fase 1 (Campbell et al., 1968; Spradlin et al., 1966). El restablecimiento de la conducta no ocurre confiablemente al presentar estímulos novedosos, que en principio constituyen estímulos neutrales, tales como luces o sonidos (e.g., Campbell et al., 1968; Reid, 1958). Surge la pregunta de si el restablecimiento ocurre al entregar reforzadores potenciales que no son los mismos que inicialmente mantuvieron la conducta problema, esto es, al entregar un reforzador primario diferente al que se emplea en la Fase 1 de entrenamiento. Una primera pregunta que surge es si el restablecimiento de la conducta ocurre únicamente al entregar los mismos reforzadores que mantenían la conducta antes de implementar el procedimiento de extinción, o bien si el restablecimiento de la conducta ocurría al presentar un reforzador diferente al que inicialmente mantenía la conducta.

En la literatura sobre el resurgimiento de la conducta, se ha demostrado la recurrencia de la distribución temporal de las respuestas previamente entrenadas. Por ejemplo, Cançado y Lattal (2011) observaron resurgimiento de la distribución temporal de las respuestas en palomas como sujetos. En la Fase 1, los picotazos a una tecla se reforzaron conforme a un programa múltiple intervalo fijo (IF) 5 s intervalo variable (IV) 15 s. En la Fase 2, las presiones a la tecla se expusieron a un procedimiento de extinción y las presiones a una segunda tecla se reforzaron conforme a un programa múltiple IF 5 s IV 15 s. En la Fase 3, las respuestas en ambas teclas se expusieron a extinción. Los autores observaron que las respuestas, así como las dos distribuciones temporales de las respuestas entrenadas en la Fase 1 resurgieron en la primera tecla. Los autores sugirieron que la respuesta que recurre es similar a la respuesta previamente entrenada en frecuencia, topografía y características temporales. Una segunda pregunta que surge es si la distribución temporal de las respuestas se restablece al usar reforzadores cualitativamente diferentes, o bien al usar el mismo reforzador en la Fase 1 y Fase 3.

En la Fase 1 de un procedimiento típico de restablecimiento se entrena una respuesta empleando un programa de reforzamiento, se refuerza una respuesta y también la distribución temporal de la respuesta característica del programa de reforzamiento empleado. Es posible que la distribución temporal de las respuestas entrenadas en la Fase 1 recurra al emplear un procedimiento de restablecimiento. El presente estudio tuvo dos propósitos. El primer propósito fue comparar los efectos de la entrega de reforzadores diferentes y del mismo reforzador en la Fase 1 y en la Fase 3 sobre el grado de restablecimiento de la respuesta de presiones a la palanca empleando a ratas como sujetos. El segundo propósito del estudio fue determinar si la distribución temporal de las respuestas obtenida durante la Fase 1 (patrones de festón) se restablecía al usar reforzadores cualitativamente diferentes, o bien al usar el mismo reforzador en la Fase 1 y en la Fase 3.

Método

Sujetos

Se utilizaron tres ratas macho Wistar, experimentalmente ingenuas, de siete meses de edad al inicio del experimento. Se mantuvo a las ratas al 80% de su peso ad libitum durante todo el experimento, limitando la cantidad de comida que se colocaba en su caja habitación al final de cada sesión experimental. Las ratas tuvieron acceso libre a agua durante todo el experimento.

Aparatos

Se utilizó una cámara experimental marca TAC-3D de 30 cm de largo, 23.5 cm de alto y 20.5 cm de ancho. El panel frontal y el panel trasero estaban fabricados con filamento de ácido poliláctico (PLA). Las paredes laterales y el techo estaban hechos de acrílico. En el panel trasero, a 17 cm del piso de la cámara y a 9 cm de las paredes laterales había un foco, que proporcionó iluminación general durante las sesiones. En el panel frontal de la cámara, a 2 cm del piso, había una abertura de 5 cm por 5 cm detrás de la cual había una charola para pellets y leche condensada. Se utilizó un dispensador de pellets TAC-3D. El comedero entregaba pellets de 35 mg, elaborados remoldeando polvo de comida para ratas de la marca Rodent Laboratory Chow ®. Se utilizó una bomba peristáltica marca TAC-3D, conectada a una manguera que dispensaba 0.10 ml de una solución de leche condensada y agua en cada operación. La solución de leche condensada consistía de una mezcla de 60% de leche condensada marca Corina® y 40% de agua. A la izquierda del panel frontal, a 7.5 cm del piso de la cámara, había una palanca de 4 cm que sobresalía 2 cm de la pared y que requirió de una fuerza mínima de 0.15 N para operar. A 5 cm de la palanca y a 2.5 cm de las paredes laterales había un foco de 28 V.

Se fabricó un cubículo de madera sonoamortiguado en el cual se colocó la cámara experimental. Dentro del cubículo se colocó una bocina marca Logitech® por medio de la cual se emitió ruido blanco de 70 dB para enmascarar sonidos externos y un ventilador Steren® de 6”, modelo VN6-117M. Todos los eventos experimentales se controlaron y se registraron en una computadora portátil por medio de la interfaz Arduino-Visual Basic descrita por Escobar y Pérez-Herrera (2015).

Procedimiento

Fase 1: Entrenamiento. Con el propósito de adquirir la respuesta de presión a la palanca, se reforzaron las respuestas conforme a un programa de IF 1 s. El valor del programa de IF se aumentó gradualmente a través de sesiones consecutivas hasta llegar a un IF 30 s para las Ratas 1 y 3 y un IF 15 s para la Rata 2 (debido a que para la Rata 2 se observó una tasa baja de respuesta). Estas duraciones del programa de IF permanecieron vigentes durante el resto de la Fase 1. El criterio para finalizar cada sesión fue la entrega de 40 reforzadores o que transcurrieran 40 minutos. El criterio para finalizar la Fase 1 fue que la tasa de respuesta de las últimas tres sesiones no variara más del 5% de las tres penúltimas sesiones (ver Schoenfeld, Cumming, & Hearst, 1956). Se utilizó el programa Stability Check para realizar el cálculo de la estabilidad de la respuesta (Costa & Cançado, 2012).

El tipo de reforzador fue el mismo o diferente en la Fase 1 y en la Fase 3 en dos condiciones sucesivas. En la condición del mismo reforzador; el reforzador entregado fue el mismo (e.g., pellets) en la Fase 1 y en la Fase 3 y en la condición diferentes reforzadores; el reforzador entregado en la Fase 1 (e.g., pellets) fue diferente al reforzador entregado de la Fase 3 (e.g., leche). Las ratas 1 y 2 fueron expuestas primero a la condición del mismo reforzador y después a la condición diferentes reforzadores, mientras que la rata 3 fue expuesta primero a la condición diferentes reforzadores y después a la condición del mismo reforzador. En la Tabla 1, se muestra el orden de exposición a las condiciones, así como los reforzadores específicos empleados en cada condición para cada sujeto

Fase 2: Extinción. Se expuso a los sujetos a un procedimiento de extinción en el que las presiones a la palanca no tuvieron consecuencias programadas. El criterio para finalizar la fase fue que en dos sesiones consecutivas el sujeto emitiera el 5% de respuestas o menos respecto a la media de las últimas seis sesiones de la Fase 1 (Podlesnik & Shahan, 2009).

Fase 3: Restablecimiento. Se entregó un reforzador de manera independiente de la respuesta conforme un programa tándem TF 30 s- RDO 3 s para las Ratas 1 y 3 y un TF 15 s RDO 3 s para la Rata 2. Se añadió el RDO 3 s al final del programa TF 30 s con la finalidad de minimizar la ocurrencia del reforzamiento accidental de las presiones a la palanca. La fase finalizó hasta que los sujetos emitieran el 5% de respuestas respecto a la media de las últimas seis sesiones de la Fase 1 (Podlesnik & Shahan, 2009). Durante todo el experimento, las sesiones se llevaron a cabo seis días a la semana, a la misma hora.

Tabla 1.
Tabla 1.

Orden de exposición a las condiciones y reforzadores empleados en cada condición para cada sujeto

Resultados

En la Figura 1 se muestra la tasa de respuesta (presiones a la palanca por minuto) durante las dos condiciones del estudio para cada sujeto.

Figura 1
Figura 1

Tasa de respuesta (presiones a la palanca / minuto) durante las Fases 1, 2 y 3 para cada una de las tres ratas. En los páneles izquierdos se muestra la condición en que se entregaron reforzadores cualitativamente diferentes en la Fase 1 y Fase 3. En los páneles derechos se muestra la condición donde en que se entregó el mismo reforzador en la Fase 1 y Fase 3.

Al comparar las dos condiciones del estudio (condición de diferentes reforzadores y condición del mismo reforzador) se observó que en la Fase 1 (entrenamiento), las tasas de respuesta más altas para todos los sujetos se observaron cuando se reforzó la respuesta de presionar la palanca con leche relativo a cuando se reforzó la respuesta con pellets. En la Fase 2 (extinción), se observó una disminución en la tasa de respuesta respecto a la Fase 1 durante las dos condiciones del estudio. En la Fase 3 (restablecimiento), hubo restablecimiento de la respuesta para todos los sujetos en las dos condiciones del estudio.

Para las Ratas 1 y 3, el grado de restablecimiento de la respuesta fue mayor en la condición del mismo reforzador que en la condición diferentes reforzadores. Específicamente, la tasa de respuesta durante las primeras sesiones de la Fase 3 fue mayor en la condición del mismo reforzador que en la condición diferentes reforzadores. Para la Rata 1, la exposición repetida a la entrega de comida independiente de la respuesta resultó en una disminución de las respuestas a niveles cercanos a cero en las dos condiciones del estudio. No obstante, para la Rata 3 durante la condición del mismo reforzador, la exposición repetida a la entrega de comida independiente de la respuesta resultó en una tasa alta de respuesta la cual no disminuyó después de 37 sesiones, posiblemente por el efecto del reforzamiento accidental.

Para la Rata 2, el grado de restablecimiento de la respuesta en la primera sesión fue mayor en la condición del mismo reforzador que en la condición de diferentes reforzadores. No obstante, para la segunda sesión el grado de restablecimiento de la respuesta fue mayor en la condición de diferentes reforzadores que en la condición del mismo reforzador. En otras palabras, la tasa de respuesta durante la primera sesión de la Fase 3 fue mayor en la condición del mismo reforzador que en la condición de diferentes reforzadores, mientras que la tasa de respuesta durante la segunda sesión de la Fase 3 fue mayor en la condición de diferentes reforzadores que en la condición del mismo reforzador. Posteriormente, la exposición repetida a la entrega de comida independiente de la respuesta resultó en una disminución de las respuestas a niveles cercanos a cero en las dos condiciones del estudio.

Con el propósito de analizar la distribución temporal de las respuestas a través de todas las fases del estudio, en la Figura 2 se muestra el número acumulado de respuestas en cada subintervalo de 1 s del IF de la última sesión en la Fase 1, así como el número acumulado de respuestas en cada subintervalo de 1 s del TF de la primera sesión de la Fase 3 en las dos condiciones del estudio. Los datos están basados en la media de las respuestas en subintervalos de 1 s de todos los intervalos fijos de cada sesión.

Figura 2
Figura 2

Número acumulado de presiones a la palanca a través de cada uno de los subintervalos de 1 s para cada una de las tres ratas. En los páneles izquierdos se muestra la distribución temporal de las respuestas en subintervalos de 1 s del IF durante la última sesión en la Fase 1. En los páneles derechos se muestra la distribución temporal de las respuestas en subintervalos de 1 s del TF durante la primera sesión de la Fase 3.

Para las Ratas 1 y 3, en la última sesión de la Fase 1, en las dos condiciones del estudio, se observó que durante el intervalo entre reforzadores el número de respuestas permaneció a niveles cercanos a cero después de la entrega del reforzador y aumentó gradualmente conforme se acercaba el final de intervalo fijo. Para la Rata 2, los patrones de respuestas fueron positivamente acelerados en ambas condiciones del estudio.

En la Fase 3 (restablecimiento), se entregaron reforzadores de manera independiente de la respuesta conforme a un programa tándem IF 30 s (o 15 s) RDO 3 s. Para las Ratas 1 y 3, en la primera sesión en la Fase 3 durante la condición del mismo reforzador (círculos blancos) se observó restablecimiento de un patrón similar al de un festón; las respuestas permanecieron a niveles cercanos a cero después de la entrega del reforzador y aumentó gradualmente conforme se acercaba la entrega del siguiente reforzador (i.e., se observaron patrones similares a un festón). Durante la condición de reforzadores diferentes (círculos negros) las respuestas a través del intervalo aumentaron de manera relativamente lineal. Para la Rata 2, en la primera sesión de la Fase 3 durante ambas condiciones, se observó que ocurrieron algunas respuestas durante aproximadamente el primer tercio del intervalo, posteriormente hubo una pausa en la mitad del intervalo y posteriormente ocurrieron respuestas durante los últimos subintervalos del TF. Para la Rata 2 no se observó el restablecimiento de la distribución temporal de las respuestas entrenadas en la Fase 1.

Discusión

El primer propósito del presente estudio fue comparar los efectos de la entrega de reforzadores cualitativamente diferentes y del mismo reforzador en la Fase 1 y en la Fase 3, sobre el restablecimiento de la respuesta de presiones a la palanca. El restablecimiento de la respuesta de palanqueo ocurrió en las dos condiciones del estudio, sin embargo, en la condición del mismo reforzador el restablecimiento de la respuesta fue mayor que el restablecimiento en la condición diferentes reforzadores. El restablecimiento de los patrones similares a los observados en la Fase 1 (patrones de festón) sólo ocurrió en la condición del mismo reforzador para dos de los tres sujetos.

Los resultados de la tasa de respuesta en la condición del mismo reforzador son consistentes con las investigaciones sobre el restablecimiento de la conducta (Campbell et al., 1968; Falcomata et al., 2013; Reid, 1958); después de un procedimiento de eliminación de la conducta, la entrega del reforzador de manera independiente de la respuesta resulta en la recurrencia de la conducta. Una explicación sobre la ocurrencia del restablecimiento es que el estímulo reforzante funciona a su vez como un estímulo discriminativo que controla y establece la ocasión para que recurra la respuesta operante previamente entrenada durante la Fase 1 (Franks & Lattal, 1976; Ostlund & Balleine, 2007; Reid, 1958).

En la condición diferentes reforzadores el restablecimiento de la respuesta fue menor que el restablecimiento de la respuesta en la condición del mismo reforzador. Una posible explicación de la ocurrencia del restablecimiento de la respuesta es que al entregar un reforzador diferente al empleado en la Fase 1 hubo un cambio de contexto que difirió al de la Fase 1 y al de la Fase 2. El contexto es definido de manera general como las claves táctiles, visuales y olfativas que constituyen el ambiente en el cual ocurre el aprendizaje (Trask, Schepers, & Bouton, 2015). Al entregar un reforzador diferente en la Fase 3, se generó un contexto diferente al de la Fase 1 debido a un cambio de claves auditivas como el sonido del comedero al entregar pellets o el sonido de la bomba peristáltica al entregar leche condensada. Asimismo, hubo un cambio de claves olfativas y visuales como la forma, el olor y textura, las cuales fueron diferentes al entregar pellets y al entregar leche condensada. Posiblemente el hallazgo del restablecimiento de la conducta empleando reforzadores diferentes se deban al cambio de contexto entre las Fases 1 y 3. Es posible que el restablecimiento de la conducta al emplear reforzadores diferentes sea un caso especial de renovación contextual de la conducta.

Un tipo de recurrencia que también podría reinterpretarse como un caso especial de renovación de la conducta es el resurgimiento de la conducta debido a las propiedades discriminativas del reforzador. En la Fase 2 de un procedimiento de resurgimiento de la conducta, la primera respuesta entrenada se expone a extinción y una segunda respuesta se refuerza, creándose un contexto en el cual los reforzadores entregados para reforzar la segunda respuesta resultan en una disminución de la primera respuesta. En la Fase 3, las dos respuestas son expuestas a un procedimiento de extinción, creándose un nuevo contexto en el cual la eliminación de los reforzadores resulta en el resurgimiento de la primera respuesta entrenada. Este fenómeno se ha interpretado también como un caso especial de renovación de la conducta (Bouton & Trask, 2016; Bouton, Winterbauer, & Todd, 2012; Trask et al., 2015). Debido a que los reforzadores empleados en los procedimientos de recurrencia funcionan como estímulos discriminativos, los cuales constituyen un contexto particular en el cual ocurre la conducta previamente entrenada, posiblemente las instancias de recurrencia de la conducta: resurgimiento, restablecimiento y renovación conformen parte de un mismo fenómeno conductual (véase Bouton et al., 2012).

Para todos los sujetos, en la Fase 1, las tasas de respuestas mantenidas con leche fueron más altas que las tasas de respuestas mantenidas con pellets. No obstante, el restablecimiento de la respuesta no fue mayor cuando se generaron tasas altas de respuesta en la Fase 1. Este hallazgo es inconsistente con los hallazgos de Doughty et al. (2004) y de Franks y Lattal (1976), quienes encontraron que generar tasas altas de respuesta en la Fase 1 resultó en un mayor restablecimiento de la respuesta relativo al restablecimiento que se observó al generar tasas relativamente bajas de respuesta durante la Fase 1. Los resultados del presente estudio sugieren que la función del reforzador como estímulo discriminativo se sobreimpone al efecto de las tasas de respuesta obtenidas en la Fase 1 sobre el grado de restablecimiento de la respuesta. Siguiendo con la hipótesis de que el restablecimiento de la conducta conforma parte de un mismo continuo de recurrencia de la conducta, los resultados descritos anteriormente son consistentes con el hallazgo de que la renovación de la conducta ABA genera mayor recurrencia de la conducta que la renovación de la conducta ABC (Bouton et al., 2012; Bouton, Todd, Vurbic, & Winterbauer, 2011).

La presente investigación constituye una primera aproximación para el estudio del restablecimiento de patrones de respuesta similares a los entrenados en la Fase 1. Para dos de los tres sujetos los patrones temporales de respuesta se restablecieron únicamente en la condición del mismo reforzador, observándose un patrón similar al de un festón. Los resultados sugieren que la función discriminativa del reforzador tiene mayor control sobre el restablecimiento de la respuesta que la entrega de un reforzador cualitativamente diferente. Los hallazgos sobre la distribución temporal apoyan la noción de que la entrega del mismo reforzador establece la ocasión para que la respuesta previamente entrenada recurra en frecuencia, topografía y características temporales (Cançado & Lattal, 2011). Para la Rata 2, no se observaron patrones de festón en la Fase 1; los patrones de respuesta fueron positivamente acelerados. Durante la Fase 3, los patrones de respuestas para esta rata fueron irregulares. Es necesario destacar que para esta rata, el IF fue de 15 s (no de 30 s) debido a que se observó una tasa de respuesta muy baja durante la condición de entrenamiento. No es posible determinar si la ausencia del restablecimiento de los patrones temporales de respuestas se debe a la baja tasa de respuesta durante la Fase 1 o bien a la duración relativamente corta del IF. Este hecho constituye una limitación del presente estudio.

Las investigaciones sobre restablecimiento de la conducta muestran que después de implementar un procedimiento de eliminación de la conducta, ésta tiende a recurrir si se reintroducen los mismos estímulos que inicialmente mantuvieron la conducta o bien al presentar estímulos que estuvieron asociados con la entrega del reforzador en la Fase 1 (Campbell et al., 1968; Spradlin et al., 1966). El presente estudio extiende los hallazgos de estos estudios al mostrar que el restablecimiento ocurre incluso al entregar un reforzador primario cualitativamente diferente al que se emplea en la Fase 1 para entrenar una respuesta. En futuras investigaciones podría compararse sistemáticamente el grado de restablecimiento al emplear estímulos novedosos, reforzadores condicionados y reforzadores cualitativamente diferentes a los de la Fase 1.

Durante las intervenciones, las recaídas son comunes como consecuencia de la reorganización de las condiciones en las que se adquirió la conducta, por lo cual se ha sugerido que los analistas de la conducta deben conocer acerca del fenómeno de la recurrencia de la conducta y considerarlo al momento de implementar un tratamiento para conductas problema (St. Peter, 2015). Los hallazgos de la presente investigación sugieren que es posible que la entrega de reforzadores diferentes que no necesariamente mantuvieron la conducta problema inicialmente, resulte en el restablecimiento de las conductas problema, aunque en un menor grado que si se entregan los mismos reforzadores que inicialmente mantuvieron la conducta problema. Es necesario realizar investigación básica y aplicada adicional sobre el restablecimiento de conductas usando reforzadores variados.

Material suplementario

Referencias

Bouton, M. E. (2004). Context and behavioral processes in extinction. Learning & Memory, 11, 485-494. doi: 10.1101/lm.78804

Bouton, M. E., & Bolles, R. C. (1979). Role of conditioned contextual stimuli in reinstatement of extinguished fear. Journal of Experimental Psychology: Animal Behavior Processes, 5, 368-378. doi: 10.1037/0097-7403.5.4.368

Bouton, M. E., Todd, T. P., Vurbic, D., & Winterbauer, N. E. (2011). Renewal after the extinction of free operant behavior. Learning & Behavior, 39, 57-67. doi: 10.3758/s13420-011-0018-6

Bouton, M. E., & Trask, S. (2016). Role of the discriminative properties of the reinforcer in resurgence. Learning & Behavior, 44, 137-150. doi: 10.3758/s13420-015-0197-7

Bouton, M. E., Winterbauer, N. E., & Todd, T. P. (2012). Relapse processes after the extinction of instrumental learning: Renewal, resurgence and reacquisition. Behavioral Processes, 90, 130-141. doi: 10.1016/j.beproc.2012.03.004

Cançado, C. R. X., Abreu-Rodrigues, J., & Aló, R. M. (2015). Reinforcement rate and resurgence: A parametric analysis. Revista Mexicana del Análisis de la Conducta, 41(2), 84-115. Recuperado de http://rmac-mx.org/reinforcement-rate-and-resurgence-a-parametric-analysis/

Cançado, C. R. X., & Lattal, K. A. (2011). Resurgence of temporal patterns of responding. Journal of the Experimental Analysis of Behavior, 95, 271-287. doi: 10.1901/jeab.2011.95-271

Campbell, P. A., Phillips, E., Fixsen, D., & Crumbaugh, C. (1968). Free operant response reinstatement during extinction and time-contingent (DRO) reward. Psychological Reports, 22, 563-569. doi: 10.2466/pr0.1968.22.2.563

Costa, C. E., & Cançado, C. R. X. (2012). Stability check: A program for calculating the stability of behavior. Revista Mexicana del Análisis de la Conducta, 38(1), 61-71. Recuperado de http://rmac-mx.org/stability-check-a-program-for-calculating-the-stability-of-behavior/

De Wit, H., & Stewart, J. (1981). Reinstatement of cocaine-reinforced responding in the rat. Psychopharmacology, 75, 134-143. doi: 10.1007/BF00432175

Doughty, A. H., Reed, P., & Lattal, K. A. (2004). Differential reinstatement predicted by pre-extinction response rate. Psychonomic Bulletin & Review, 11, 1118-1123. doi: 10.3758/BF03196746

Epstein, R. (1983). Resurgence of previously reinforced behavior during extinction. Behavior Analysis Letters, 3(6), 391-397. Recuperado de http://psycnet.apa.org/record/1984-30645-001

Epstein, R. (1985). Extinction-induced resurgence: Preliminary investigations and possible applications. The Psychological Record, 35, 143-153. doi: 10.1007/BF03394918

Escobar, R., & Pérez-Herrera, C. A. (2015). Low-cost USB interface for operant research using Arduino and Visual Basic. Journal of the Experimental Analysis of Behavior, 103, 427-435. doi: 10.1002/jeab.135

Falcomata, T. S., Hoffman, K. J., Gainey, S., Muething, C. S., & Fienup, D. M. (2013). A preliminary evaluation of reinstatement of destructive behavior displayed by individuals with autism. The Psychological Record, 63, 453-466. doi: 10.11133/j.tpr.2013.63.3.004

Franks, G. J., & Lattal, K. A. (1976). Antecedent reinforcement schedule training and operant response reinstatement in rats. Animal Learning & Behavior, 4, 374-378. doi: 10.3758/BF03214424

Lattal, K. A., & St. Peter Pipkin, C. (2009). Resurgence of previously reinforced respon-ding: research and application. The Behavior Analyst Today, 10, 254–266. doi: 10.1037/h0100669

Lattal, K. A., & Wacker, D. (2015). Some dimensions of recurrent operant behavior. Revista Mexicana del Análisis de la Conducta, 41(2), 1-13. Recuperado de http://rmac-mx.org/some-dimensions-of-recurrent-operant-behavior/

Lieving, G. A., & Lattal, K. A. (2003). Recency, repeatability, and reinforcer retrenchment: An experimental analysis of resurgence. Journal of the Experimental Analysis of Behavior, 80, 217-233. doi: 10.1901/jeab.2003.80-217

Ostlund, S. B., & Balleine, B. W. (2007). Selective reinstatement of instrumental performance depends on the discriminative stimulus properties of the mediating outcome. Learning & Behavior, 35, 43-52. doi: 10.3758/BF03196073

Podlesnik, C. A., & Shahan, T. A. (2009). Behavioral momentum and relapse of extinguished operant responding. Learning & Behavior, 37, 357-364. doi: 10.3758/LB.37.4.357

Reid, R. L. (1958). The role of the reinforcer as a stimulus. British Journal of Psychology, 49, 202–209. doi: 10.1111/j.2044-8295.1958.tb00658.x

Rosas, J. M., & Bouton, M. E. (1997). Additivity of the effects of retention interval and context change on latent inhibition: Toward resolution of the context forgetting paradox. Journal of Experimental Psychology: Animal Behavior Processes, 23, 283-294. doi: 10.1037/0097-7403.23.3.283

Schoenfeld, W. N., Cumming, W. W., & Hearst, E. (1956). On the classification of reinforcement schedules. Proceedings of the National Academy of Sciences of the United States of America, 42(8), 563-570. Recuperado de https://www.ncbi.nlm.nih.gov/pmc/articles/PMC528315/?page=4

See, R. E. (2002). Neural substrates of conditioned-cue relapse to drug-seeking behavior. Pharmacology, Biochemistry, & Behavior, 71, 517–529. doi: 10.1016/S0091-3057(01)00682-7

Shaham, Y., Shalev, U., Lu, L., de Wit, H., & Stewart, J. (2003). The reinstatement model of drug relapse: History, methodology, and major findings. Psychopharmacology. 168, 3–20. doi: 10.1007/s00213-002-1224-x

Spradlin, J. E., Girardeau, F. L., & Hom, G. L. (1966). Stimulus properties of reinforcement during extinction of a free operant response. Journal of Experimental Child Psychology, 4, 369–380. doi: 10.1016/0022-0965(66)90038-5

St. Peter, C. (2015). Six reasons why applied behavior analysts should know about resurgence. Revista Mexicana del Análisis de la Conducta, 41(2), 252-268. Recuperado de http://rmac-mx.org/six-reasons-why-applied-behavior-analysts-should-know-about-resurgence/

Trask, S., Schepers, S., & Bouton, M. E. (2015). Context change explains resurgence after the extinction of operant behavior. Revista Mexicana del Análisis de la Conducta, 41(2), 187-210. Recuperado de http://rmac-mx.org/context-change-explains-resurgence-after-the-extinction-of-operant-behavior/

Notas

Tabla 1.
Tabla 1.

Orden de exposición a las condiciones y reforzadores empleados en cada condición para cada sujeto

Figura 1
Figura 1

Figura 2
Figura 2