Resumen: En estudios sobre demora de reforzamiento se ha reportado que la tasa de respuesta es una función inversa de alargar el intervalo respuesta-reforzador. En un estudio previo, se encontró que variar la proporción de reforzamiento inmediato y reforzamiento demorado en la misma sesión moduló la disminución en la tasa de respuesta. Sin embargo, es posible que dichos resultados se deban al alargamiento del intervalo entre reforzadores (IER). El objetivo del presente estudio fue evaluar los efectos de variar la proporción de reforzamiento inmediato/ demorado sobre la tasa de respuesta manteniendo constante el IER. Se usaron tres grupos de ratas a las que se les expuso a un programa múltiple de dos componentes manteniendo constante la proporción de reforzamiento inmediato/demorado para cada grupo (25/75, 50/50, 75/25, respectivamente) y en condiciones sucesivas se alargó la demora (2, 4, 8 y 16 s). Se replicó el hallazgo del gradiente de demora durante el componente demorado mientras que, en el componente inmediato la tasa de respuesta varió en función de la proporción de reforzamiento. Controlar el IER permitió descartar que el decremento en la tasa se deba a dicha variable, confirmando que los efectos de la demora de reforzamiento sobre la tasa de respuesta son modulados por la proporción de reforzamiento inmediato/demorado.
Palabras clave: Reforzamiento inmediato/demorado, intervalo entre reforzadores, programa múltiple, ratas.
Abstract: In studies of delay of reinforcement, it has been reported that the response rate is an inverse function of lengthening the response-reinforcer interval. In a previous study, it was found 1) La información relacionada con este trabajo se puede dirigir a cualquiera de los autores a: Francisco de Quevedo No. 180, Arcos Vallarta, Guadalajara, Jalisco, México, 44130. feregrinonu.edithm@gmail.com o carlos.faguirre@academicos.udg.mx that varying the proportion of immediate/delayed reinforcement modulated the decrease in the response rate. However, it is possible that these results are due to the lengthening of the inter reinforcer interval (IRI). The objective of the present study was to evaluate the effects of varying the proportion of immediate/delayed reinforcement on the response rate while maintaining the IRI constant. Three groups of rats were used to which they were exposed to a two component-multiple schedule of reinforcement keeping constant the proportion of immediate/delayed reinforcement for each group (25/75, 50/50, 75/25, respectively) and in successive conditions the delay was increased (2, 4, 8 and 16 s). A delay of reinforcement gradient was replicated in delay component while, in the immediate component, the response rate varied according to the reinforcement ratio. Controlling the IRI allowed discarding that the decrease in the rate is due to IRI lengthening, confirming that the effect of the delay is modulated by the proportion of immediate/delayed reinforcement.
Keywords: Immediate/delayed reinforcement, inter-reinforcers interval, multiple schedule, rats.
Proporciones de reforzamiento inmediato y demorado sobre la tasa de respuesta en programas múltiples
Proportions of immediate and delayed reinforcement on response rate in multiple schedules
Recepción: 13 Julio 2018
Aprobación: 05 Diciembre 2018
Uno de los parámetros de reforzamiento que ha sido ampliamente estudiado en distintas situaciones experimentales es la demora de reforzamiento (Lattal, 1987, 2010; Renner, 1964; Tarpi & Sawabini, 1974). En estos estudios, la manipulación básica utilizada ha sido presentar reforzamiento inmediato y posteriormente reforzamiento demorado que se alarga en condiciones sucesivas. Se ha reportado consistentemente que dicha manipulación resulta en que la tasa de respuesta es una función inversa de alargar la demora, a mayor duración de la demora menor tasa de respuesta (Lattal, 2010). Se ha sugerido que este método solo permite comparar dos límites de una posible relación sin tomar en cuenta valores intermedios (Lattal, 1974).
Atendiendo a este señalamiento, recientemente, Feregrino y Bruner (2018) evaluaron los efectos de variar la proporción de reforzamiento inmediato en combinación con diferentes proporciones de reforzamiento demorado. A seis grupos de ratas se les presentó una demora de reforzamiento que se mantuvo constante a lo largo del experimento (1, 2, 4, 8, 16 y 32 s) para cada grupo; mientras que en condiciones sucesivas se varió la proporción de reforzamiento inmediato/demorado (100/0, 25/75, 50/50, 75/25 y 100/0, respectivamente). Los autores reportaron que la tasa de respuesta se redujo para todos los grupos conforme disminuyó la proporción de reforzamiento inmediato y aumentó la proporción de reforzamiento demorado; sin embargo, esta disminución en la tasa de respuesta fue más acentuada en los grupos con demoras de reforzamiento más largas (16 y 32s).
A pesar de que los autores sugirieron que sus datos muestran cómo la combinación de reforzamiento inmediato y demorado permite controlar el decaimiento en la tasa de respuesta, una característica del estudio de Feregrino y Bruner (2018) es que el intervalo entre reforzadores (IER) aumentó de manera concomitante para cada grupo de ratas en función del valor de la demora, es decir, los grupos con demoras cortas también tuvieron intervalos entre reforzadores más cortos que los sujetos de los grupos con demoras más largas. Por lo tanto, haber observado que la tasa de respuesta fue menor en los grupos con demoras largas no necesariamente puede ser atribuido al efecto de la demora. Es probable que sus resultados se hayan debido a que, en cada grupo, los sujetos experimentaron diferentes duraciones del IER.
Se ha reconocido que la manipulación de la demora de reforzamiento puede involucrar un alargamiento del IER concomitante al alargamiento de la demora (Schaal & Branch, 1988; Weil, 1984). Un ejemplo claro de este efecto se ha identificado en estudios con demora reiniciable, donde cada respuesta durante la demora regresa a cero el reloj que controla la demora resultando en el alargamiento del IER con cada reinicio (van Haaren, 1992; Williams & Lattal, 1999). No obstante, es posible que en situaciones con demora fija introducir la demora de reforzamiento, sumada a la duración del programa que precede a la demora resulte en un IER cada vez más largo a medida que se incrementa la duración de la demora. Debido a que se ha encontrado que el alargamiento del IER por sí mismo resulta en una disminución gradual de la tasa de respuesta (Catania & Reynolds, 1968; Clark, 1958; Findley, 1958; Shull, 2005; Wilson, 1954) es posible que en buena parte de los estudios sobre demora de reforzamiento sea difícil diferenciar si la disminución en la tasa de respuesta fue resultado de la manipulación directa de la demora o de la manipulación implícita del IER (Baum, 1995)
Con base en esta posible confusión entre variables, una estrategia que se ha implementado exitosamente para mantener constante el IER al incrementar la demora, es reducir la duración del programa de reforzamiento (e.g. un programa intervalo variable IV 60 s) para que al sumarle la duración de la demora (e.g. IV 55 s más 5 s de demora) el intervalo míni- mo entre reforzadores sea similar al intervalo presentado con reforzamiento inmediato (e.g. Ruiz, Bruner, & Balderrama, 2007; Shaal, Shahan, Kovera & Reilly, 1998; Schaal, Schuh, & Branch, 1992). Un ejemplo de ello es el estudio de Ruiz, Bruner y Balderrama (2007), estos autores utilizaron un programa múltiple de cuatro componentes en el que correlacionaron una señal diferente para cada valor de demora (0, 2, 4 y 8 s). El programa de reforzamiento vigente (intervalo al azar - IA) para cada señal fue el complemento de la duración de la demora (e.g. IA 30s + 2s de demora = IER 32s; IA 28s + 4 s de demora = IER 32s), para mantener constante el intervalo entre reforzadores en 32 o 128 s. Esta estrategia permitió diferenciar las tasas de respuesta correlacionadas a cada uno de los componentes de demora sin afectar la duración del IER.
Tener confundidos los efectos de demora y del IER en estudios sobre demora de reforzamiento no permite asegurar si introducir una cierta proporción de reforzamiento inmediato en una situación de reforzamiento demorado permite modular el decremento en la tasa de respuesta, como lo sugieren Feregrino y Bruner (2018). De tal forma que resulta necesario controlar la duración del IER a fin de poder aislar los efectos de esta variable respecto de la demora de reforzamiento.
Se ha mostrado que emplear programas múltiples permite evaluar por separado los efectos de distintas demoras al correlacionarlas con un estímulo particular (Reilly & Lattal, 2004; Ruiz, et. al. 2007). Por lo que usar dichos programas parece ser un método que permite evaluar el control que ejerce cierta proporción de reforzamiento inmediato sobre la tasa de respuesta aun cuando se alarga la demora de reforzamiento. Con base en lo anterior, el presente estudio se diseñó con el propósito de evaluar los efectos de diferentes proporciones de reforzamiento inmediato/demorado sobre la tasa de respuesta, manteniendo constante el intervalo entre reforzadores.
Sujetos
Se utilizaron nueve ratas Wistar macho experimentalmente ingenuas de cinco meses de edad al inicio del experimento. Alojadas en cajas habitación individuales con acceso libre al agua.
Se controló su ingesta de comida para mantenerlas al 80% de su peso ad libitum. El cuidado y mantenimiento de los sujetos se realizó con base en lo establecido por las especificaciones técnicas para la producción, cuidado y uso de animales de laboratorio, NOM-062-ZOO-1999.
Aparatos
Se emplearon tres cámaras experimentales MED Associates Inc. ® (ENV 2042 A) equipadas con un comedero de metal ubicado en el centro del panel operativo. El comedero se conectó a través de una manguera de plástico a un dispensador de comida (ENV 203 M-45), cuya activación entregaba un pellet de azúcar de 25 mg. Al lado izquierdo de la charola se ubicó una palanca retráctil (ENV 112-CM) a 7 cm por encima del piso de la cámara experimental. La palanca fue operada por una fuerza de aproximadamente .18 N. Un foco de 28 volts (ENV 215-M) sirvió como iluminación general de la cámara. Cada cámara experimental se encontraba dentro de un cubículo sonoamortiguado (ENV 022-MD) equipado con un generador de ruido blanco (ENV 225-SM) que se utilizó como estímulo durante el experimento. También contaban con un ventilador para permitir el flujo de aire durante la sesión. Los eventos que ocurrieron en cada cámara fueron controlados y registrados a través de una interface MED (SG 6080D) conectada a una computadora con el software Med PC-IV ®.
Entrenamiento. Con el objetivo de conseguir un nivel sustancial de respuesta, inicialmente se presentó un programa adjuntivo Razón Fija (RF)1-Tiempo Variable (TV) 30 s, que terminaba al entregarse 50 pellets. Cuando el 75% de los pellets entregados fueron dependientes de la respuesta, se presentó una sesión bajo el programa RF1. Posteriormente, en sesiones consecutivas se presentó un programa IV que aumentó progresivamente cada día (5, 15, 25 y 30 s).
Fase experimental. Concluido el entrenamiento, se asignaron aleatoriamente tres sujetos a cada uno de tres grupos. Para cada grupo se mantuvo constante la proporción de reforzamiento inmediato/demorado (i.e. 25/75, 50/50, 75/25, respectivamente) a lo largo de todo el experimento y en fases sucesivas se alargó la duración de la demora. Durante la Fase 1 la demora fue de 2s, para la Fase 2 fue de 4s, para la Fase 3 fue de 8s y finalmente para la Fase 4 la demora fue de 16s. Únicamente para el componente demorado. A todos los sujetos se les presentó un programa múltiple IV t s -TF t s. A medida que se alargó la demora se adecuó la duración del IV para que en todas las condiciones el IER programado se mantuviera en 30 s. El programa IV se construyó con base en 18 intervalos derivados de la distribución de Fleshler y Hoffman (1962) seleccionados aleatoriamente sin remplazo. Al finalizar todas las condiciones, se redeterminó la Fase 1 de demora 2 s. Cada fase estuvo en efecto durante 30 sesiones, dichas sesiones se condujeron diariamente.
Cada componente tuvo una duración de dos minutos con un intervalo entre componentes de 30 s. Los componentes con reforzamiento inmediato fueron señalados por el encendido continuo del ruido blanco, mientras que los componentes con reforzamiento demorado fueron señalados por el encendido intermitente del ruido blanco (1 s encendido y 1 s apagado). El número de componentes inmediatos y demorados durante una sesión se programó con base en la proporción de reforzamiento inmediato/demorado, dichos componentes se presentaron de manera semialeatoria. La sesión experimental terminó después de 20 componentes.
En la Figura 1 se presentan las tasas de respuesta promedio de cada grupo en cada una de las fases de demora de reforzamiento. De manera general, para los tres grupos se observó una tasa de respuesta más alta durante el componente inmediato comparado con el componente demorado, en las cuatro fases. La tasa de respuesta en el componente demorado mostró una tendencia decremental a lo largo de las fases para en los tres grupos. Este efecto también se observó en el componente inmediato para el grupo 25/75; para el grupo 50/50 la tasa de respuesta en el componente inmediato se mantuvo relativamente constante entre fases; mientras que para el grupo 75/25 se observó una tendencia incremental en dicho componente.

En el panel superior de la Figura 2 se muestra la tasa de reforzamiento promedio para cada grupo durante cada una de las fases. Se observó que la tasa de reforzamiento en el componente inmediato se mantuvo relativamente constante a lo largo de todo el experimento para todos los grupos; mientras que durante el componente demorado disminuyeron gradualmente conforme incrementó la demora a largo de las fases. Cabe destacar que la tasa de reforzamiento fue relativamente más alta durante el componente inmediato que durante el componente demorado a lo largo de todo el experimento.
En el panel inferior de la Figura 2 se presentan los intervalos promedio entre reforzadores para cada grupo en las fases sucesivas. Los resultados muestran que el intervalo entre reforzadores obtenido durante el componente inmediato se mantuvo relativamente constante a lo largo de todo el experimento, mientras que durante el componente demorado mostró una tendencia incremental para los tres grupos.
Existe evidencia de que la demora obtenida se relaciona directamente con la demora programada y ésta a su vez con la tasa de respuesta (e.g., Feregrino & Bruner, 2018; Sizemore & Lattal, 1977, 1978). Por esta razón, en la Figura 3 se muestra la demora obtenida en función de la demora programada para cada grupo. Se encontró que para todos los grupos alargar la demora programada resultó en incrementos de la demora obtenida; sin embargo, las duraciones de la demora obtenida fueron sistemáticamente más cortas que las programadas.


En el presente estudio se evaluaron los efectos de diferentes proporciones de reforzamiento inmediato y reforzamiento demorado sobre la tasa de respuesta, manteniendo constante el intervalo entre reforzadores. Se tiene registro que usar programas de reforzamiento múltiples permiten analizar los efectos de distintas demoras sobre la tasa de respuesta economizando recursos de tiempo y animales (e.g., Ruiz et al., 2007; Reilly & Lattal, 2004). A diferencia del estudio de Feregrino y Bruner (2018) en que en una misma sesión se presentaba tanto reforzamiento inmediato como demorado sin ninguna señal asociada, en el presente estudio, señalar el reforzamiento inmediato y demorado como componentes de un programa múltiple permitió identificar los efectos de cada tipo de reforzamiento (i.e. inmediato o demorado) sobre la tasa de respuesta.
El efecto más reportado en los estudios sobre demora de reforzamiento, independientemente del tipo de demora utilizada, es que la tasa de respuesta es una función inversa del alargamiento de la demora (Lattal, 1987, 2010; Renner, 1964; Tarpy & Sawabini, 1974). En el presente estudio se pudo observar que este resultado fue consistente para todos los grupos únicamente en el componente demorado. Particularmente en el grupo 75/25 se observó un ligero aumento en la tasa de respuesta al pasar de la condición de demora 2 a demora 4 y que posteriormente disminuyó como en los otros grupos.
Por otra parte, las tasas de respuesta observadas en el componente inmediato fueron moduladas por la proporción de reforzamiento inmediato/demorado. Por ejemplo, para el grupo 25/75 se observó una disminución en el responder conforme se alargó la demora. Sin embargo, a diferencia del clásico gradiente de demora, se observó que inicialmente hubo un aumento en la tasa de respuesta que posteriormente decrementó. En el grupo 50/50 se observó que la tasa de respuesta se mantuvo relativamente constante a lo largo del experimento. En el grupo 75/25 la tasa de respuesta aumentó conforme se alargó la demora. Con base en estos resultados se puede argumentar que al igual que en el estudio de Feregrino y Bruner (2018) programar una alta proporción de reforzamiento inmediato controló el mantenimiento de la tasa de respuesta a pesar del alargamiento de la demora. A medida que disminuyó la proporción de reforzamiento inmediato, se pudo observar un efecto similar al encontrado en los estudios clásicos de demora (Lattal, 1987, 2010; Renner, 1964; Tarpy & Sawabiny, 1974). Con base en la propuesta de Lachter (1973) es posible que el nivel de respuesta sea determinado por la relación temporal entre la respuesta y la entrega del reforzador. En el presente estudio se encontró que reducir el intervalo respuesta-reforzador al mínimo (i.e. con reforzamiento inmediato) resulta en el mantenimiento e incluso aumento en la tasa de respuesta. Mientras que alargar el tiempo mínimo entre la respuesta y el reforzador (i.e. al menos 16 s) resulta en un decremento en la tasa de respuesta para todos los sujetos. Estos hallazgos son evidencia de que la tasa de respuesta además de estar controlada por la relación respuesta-reforzador también se encuentra modulada por algunos parámetros que deben ser tomados en consideración al evaluar los efectos de la demora de reforzamiento, en este caso, la proporción de reforzamiento inmediato o demorado.
Una variable que se ha sugerido da cuenta de la relación temporal entre la respuesta y el reforzador, es la demora obtenida. Diversos estudios reportan que el alargamiento de la demora programada puede resultar en el alargamiento de la demora obtenida y que ésta a su vez se relaciona con la disminución en la tasa de respuesta (Feregrino & Bruner, 2018; Sizemore & Lattal, 1977, 1978). Por esta razón, en el presente estudio se analizó la relación entre la demo-
ra obtenida y la demora programada. Al igual que en el estudio de Feregrino y Bruner (2018) se encontró que alargar la demora programada resultó en aumentos de la demora obtenida; siendo sistemáticamente más corta que la programada. No obstante, al no haber observado marcadas diferencias en las demoras obtenidas entre grupos, se puede inferir que a diferencia de cómo sugieren Feregrino y Bruner, (2018) la duración de la demora obtenida no determinó el nivel de respuesta, sino que fue la proporción de reforzamiento inmediato/demorado.
Debido a que existe evidencia de que alargar el intervalo entre reforzadores (IER) resulta en decrementos en la tasa de respuesta (e.g., Catania & Reynolds, 1968; Clark, 1958), en el presente estudio se controló esta variable a fin de descartarla como causa de un posible decremento en la tasa de respuesta. Se pudo observar que, el IER programado en el componente inmediato se mantuvo relativamente constante para todos los grupos, no fue así en el componente demorado. Este efecto pudo deberse a que el decremento en la tasa de respuesta con reforzamiento demorado resultó en que los sujetos tardaran en responder y con ello alargar el IER programado (i.e. 30 s).
Es preciso señalar que debido a que los IER para todos los grupos, independientemente de las proporciones de reforzamiento inmediato/demorado, mostró una tendencia creciente a través de las fases en el componente demorado y se mantuvo relativamente constante en el componente inmediato, no se puede argumentar que las diferencias en las tasas de respuestas en cada grupo se hayan debido al alargamiento dicha variable. Lo que permite apoyar la idea de que los resultados del presente estudio y los reportados por Feregrino y Bruner (2018) se debieron a la manipulación de la proporción de reforzamiento inmediato/demorado.
A pesar de las posibles ventajas que ofrece usar un programa múltiple con respecto a un programa tándem para analizar los efectos del reforzamiento inmediato claramente diferenciado del reforzamiento demorado, diversos estudios han mostrado que cambiar la frecuencia de reforzamiento en un componente del programa múltiple mientras se mantiene constante en el otro componente, resulta en un fenómeno conocido como de contraste conductual (véase Williams, 1983 para una revisión). Por ejemplo, Richards y Hittesdorf (1976) reportaron que alargar la duración de la demora en un componente de un programa múltiple resultó en la disminución gradual de la tasa de respuesta en el componente demorado y el concomitante aumento gradual de la tasa en el componente inmediato.
Dicho resultado puede ser comparable a lo observado en el grupo 75/25 del presente estudio, por lo que podría clasificarse como un efecto de contraste conductual. Sin embargo, clasificar así este resultado no sería del todo correcto, debido a que el hallazgo reportado por Richards y Hittesdorf (1976) provienen de una manipulación entre grupos y de acuerdo con la literatura sobre contraste conductual, este efecto es observado principalmente en diseños intrasujeto y no como resultado de contrastar condiciones en grupo independientes en los que se varía la densidad de reforzamiento (Williams, 1983).
Los hallazgos del presente estudio no pueden atribuirse exclusivamente al cambio en la densidad de reforzamiento. En primer lugar, como se discutió previamente la tasa de reforzamiento disminuyó de manera similar para los tres grupos, por lo que, en caso de ser la variable determinante de la tasa de respuesta, sus efectos habrían sido los mismos para los tres grupos. En segundo lugar, si se clasificara los hallazgos del presente estudio como efectos de contraste conductual estos darían cuenta de que observar ya sea contraste conductual negativo (e.g. grupo 25/75) o contraste positivo (e.g. grupo 75/25) estaría modulado por la proporción de reforzamiento inmediato/demorado. No obstante, dichos efectos comúnmente son reportados con respecto a una proporción 50/50. De tal forma que los resultados del presente estudio no replican las condiciones necesarias para ser clasificados como efectos del contraste conductual.
presente estudio no replican las condiciones necesarias para ser clasificados como efectos del
Por último, resulta necesario resaltar que los hallazgos del presente estudio aportan evidencia de que los efectos de la demora sobre la tasa de respuesta pueden ser modulados por algunos parámetros (i.e., la proporción de reforzamiento inmediato/demorado). No obstante, este hallazgo no contradice al efecto consistenmente reportado como gradiente de demora, sino que permite dar un paso hacia un mayor entendimiento de la demora de reforzamiento y sus efectos sobre la conducta.
Los resultados del presente trabajo permiten avanzar en el estudio de la demora, en el sentido de cambiar la forma de conceptualizar los efectos de esta variable; ya que en la mayoría de los estudios sobre demora de reforzamiento en una condición solo se entrega reforzamiento inmediato y posteriormente, solo reforzamiento demorado. Los resultados de estos estudios han llevado a pensar que los efectos producidos por la demora son cualitativamente diferentes a los efectos producidos por reforzamiento inmediato (Neuringer, 1969) derivando así una concepción dicotomica. No obstante, los resultados del presente estudio en conjunto con los de Feregrino y Bruner (2018) muestran que la manipulación de las proporciones de reforzamiento inmediato/demorado permiten analizar un posible continuo, en el que en un extremo se encuentra el reforzamiento inmediato y en el otro se encuentra el reforzamiento demorado, identificando entre estos dos puntos la manipulación los dos “tipos” de reforzamiento.


