Efectos de la demora sobre la respuesta de procuración u obtención en la acumulación de reforzadores

Carlos A. Pérez-Herrera; Carlos A. Bruner

Effects of reinforcement delay on earning and collecting responses in food accumulation

Carlos A. Pérez-Herrera mnbaxs@hotmail.com

Laboratorio de Condicionamiento Operante, Facultad de Psicología de la Universidad Nacional Autónoma de México, México

Carlos A. Bruner ₁ cbruner@unam.mx

Laboratorio de Condicionamiento Operante, Facultad de Psicología de la Universidad Nacional Autónoma de México, México

Efectos de la demora sobre la respuesta de procuración u obtención en la acumulación de reforzadores

Acta Comportamentalia: Revista Latina de Análisis de Comportamiento, vol. 27, núm. 4, pp. 407-422, 2019

Universidad Veracruzana

Recepción: 26 Noviembre 2018

Aprobación: 15 Mayo 2019

Resumen: En una situación de acumulación, usualmente existen dos clases de respuesta: procuración y obtención. Sin embargo, en la mayoría de los estudios se ha descrito únicamente los efectos de alargar la demora sobre la respuesta de procuración. El presente estudio describe los efectos de incrementar la demora contingente a la respuesta ya sea de procuración o de obtención sobre la tasa de ambas clases de respuesta. El procedimiento consistió en ensayos compuestos por tres componentes sucesivos; un componente de procuración en el cual las respuestas aumentaban la cantidad de comida acumulada, un componente de obtención en el cual las respuestas programaban la entrega de los reforzadores acumulados y un componente de demora que se alargó de acuerdo con la progresión 0, 2, 4, 8, 16, 32 s. El experimento comparó dos condiciones experimentales las cuales diferían únicamente de la posición del componente de demora. Los resultados muestran que alargar la demora produce gradientes crecientes para la respuesta de procuración y decrecientes para la respuesta de obtención cuando la demora sigue a la respuesta de procuración, no así cuando sigue a la respuesta de obtención. Aun cuando en ambas condiciones la cantidad de comida acumulada aumenta concomitantemente, la demora de reforzamiento tiene un efecto diferente en cada clase de respuesta.

Palabras clave: demora de reforzamiento, acumulación de reforzadores, respuesta de procuración, respuesta de obtención, ratas.

Abstract: Most studies on food accumulation by rats involve two different response classes: earn and collect. However, in the majority of experiments accumulated food has only been delayed from the earn response. By contrast, the present study compared the effects of delayed reinforcement on both earn and collect responses. The procedure involved three successive components; an earn component in which earn responses increased the number of foods accumulated, a collect component where collect responses programmed the delivery of the reinforcers and a delay component the duration of which was lengthened to 0, 2, 4, 8, 16 and 32 s. The study compared two experimental conditions that differed only in the location of the delay component. For the earn condition, three rats each were exposed to a chained FI 30 s FT t FR1 while for the collect condition three different rats were each exposed to a chained FI 30 s FR1 FT t. For both conditions t was either 0, 2, 4, 8, 16, or 32. During the FI component, each lever press on the earn response increased the number of food pellets to be delivered at the end of the trial. Lengthening reinforcement delay in both conditions increased the number of accumulated food. Also, food accumulated per trial diminished along the session suggesting that rats could have satiated during the first trials thus decreasing the response rate of later trials. Results showed that delay of reinforcement have different effects on response rate depending on which response class is contingent to. If the delay follows the earn response, increasing delay gradients are obtained for the earn response while decreasing delay gradients are obtained for the collect response thus having two different delay gradients on the same subject. However, when the delay follows the collect response a decreasing delay gradient is obtained for the earn response. These findings replicate the results of other researchers showing that accumulated food increases as a function of the delay of reinforcement. However, even though the food accumulated increased in both conditions, response rate for the earn response only increased when the delay of reinforcement followed the earn component.

Keywords: delay of reinforcement, food accumulation, earn response, collect response, rats.

El reforzamiento de una operante ocurre cuando a consecuencia de la emisión de una respuesta se entrega un estímulo que aumenta la probabilidad de que la respuesta vuelva a ocurrir. Comúnmente el estímulo o reforzador se presenta en contigüidad a la emisión de la respuesta, sin embargo, el tiempo que ocurre entre una respuesta y su reforzador puede manipularse como una variable que controla la frecuencia con la que ocurre la respuesta. El tiempo que existe entre una respuesta y la entrega de su reforzador se conoce como demora de reforzamiento (Lattal, 2010; Skinner, 1938; Sizemore & Lattal, 1978) y diversos estudios han mostrado que alargar la demora de reforzamiento conlleva una disminución en la tasa de respuesta (Jarmolowicz & Lattal, 2013; Richards, 1981; Shahan & Lattal 2005; Sizemore & Lattal, 1978). Sin embargo, existen estudios en los que, cuando se alarga la demora de reforzamiento de manera incidental al aumentar el esfuerzo necesario para acceder al reforzador, se incrementa el número de respuestas emitidas (e.g. Killeen 1974), este fenómeno se conoce como acumulación de reforzadores.

Uno de los pioneros en la investigación sobre acumulación de reforzadores fue Killeen (1974) quien realizó un experimento empleando ratas como sujetos. Primero entrenó a los sujetos bajo un programa de razón fija 1 (RF1) en el cual el comedero se encontraba a 30 cm del comedero. Posteriormente, aumentó la distancia entre la palanca y el comedero a 60, 120, 180 y 240 cm. Los resultados mostraron que la cantidad de respuestas emitidas antes de visitar el comedero aumentaron en función de alargar la distancia entre la palanca y el comedero. Killeen propuso que existe una relación entre esfuerzo requerido para recorrer la distancia que separa el operando del comedero y el número de respuestas emitidas. Este hallazgo fue replicado posteriormente por McFarland y Lattal (2001) quienes mostraron que las respuestas aumentan conforme aumenta el esfuerzo requerido para recorrer una distancia incluso cuando se añaden barreras físicas entre el operando y el comedero.

En 1981, Killeen, Smith y Hanson incluyeron el uso de una segunda palanca que permitió estandarizar, registrar y manipular directamente el esfuerzo requerido para obtener los reforzadores. Al emplear dos palancas con diferentes funciones, Killeen et al. establecieron que los procedimientos de acumulación cuentan con dos diferentes clases de respuesta: una respuesta de procuración que aumenta la cantidad de comida a obtener (e.g. presionar una palanca) y una respuesta de obtención que da acceso a los reforzadores procurados (e.g. el desplazamiento desde la palanca hacia el comedero).

La mayoría de los estudios sobre acumulación de reforzadores se centraron en manipular los parámetros de la respuesta de obtención: ya sea incrementando la fuerza requerida para activar la palanca de obtención (Killeen et al., 1981, Experimento 3), incrementando el requisito de respuesta en la respuesta de obtención (Killeen et al., 1981, Experimento 1), o variando la pendiente del camino entre la respuesta y el reforzador (Killeen & Rigsford, 1989). Estas manipulaciones se basaron en la premisa de que, similar a la distancia, el incremento del esfuerzo requerido para obtener la comida aumenta la cantidad de reforzadores acumulados antes de consumirlos. Sin embargo, incrementar el esfuerzo incrementa concomitantemente el tiempo que existe entre una respuesta y su reforzador por lo que Killeen et al. (1981) sugirieron que podría ser la demora una variable que afecta la acumulación de reforzadores.

No fue sino hasta el 2014 cuando Cruz y Bruner demostraron empíricamente que la demora es, en efecto, una variable confundida en los experimentos de acumulación. Para ello, usando ratas como sujetos, realizaron un experimento con palancas retráctiles, en el que cada ensayo inició al extenderse una primera palanca con lo cual iniciaba un componente de procuración de 20 s, durante el cual las presiones a la palanca de procuración aumentaron el número de bolitas de comida que podía ganar el sujeto. Posteriormente se retrajo la palanca de procuración y se presentó un periodo de demora. La duración del componente de demora incrementó durante las diferentes fases a 0, 1, 2, 4, 8, 16, 32, 64 s y una posterior redeterminación con 8 y 0 s. Al terminar el periodo de demora se extendió la palanca de obtención iniciando el componente de obtención con una duración de 20 s en el que cada respuesta entregó un reforzador de manera inmediata, teniendo como cantidad máxima de reforzadores la misma cantidad de respuestas emitidas durante el componente de procuración. Cruz y Bruner encontraron un aumento en el número de respuestas, tanto en la palanca de procuración como en la de obtención, conforme alargaron la duración del componente de demora, por lo que concluyeron que, cuando el número de respuestas de procuración determina la magnitud de reforzamiento, alargar la demora aumenta el número de respuestas de procuración.

Flores, Mateos y Bruner (2015) mediante una replicación sistemática del procedimiento de Cruz y Bruner (2014) demostraron que además de la duración del componente de demora la duración del componente de procuración tiene un efecto sobre la cantidad de comida acumulada. Similar al procedimiento de Cruz y Bruner, Flores et al. (2015) iniciaron cada ensayo con la extensión de la palanca de procuración, posteriormente se presentó un componente de demora y finalmente un componente de obtención en el que cada respuesta entregaba inmediatamente una bolita de comida hasta un máximo de la cantidad de comida acumulada durante el componente de procuración. La duración tanto del componente de procuración como de obtención varió de acuerdo a la condición experimental: para cuatro sujetos la duración de ambos componentes fue de 40 s, mientras para otros 4 sujetos la duración fue de 60 s. Mediante las diferentes duraciones de los componentes, Flores et al. pudieron comparar el efecto de que tienen diferentes intervalos entre reforzadores (IEER) sobre la acumulación de reforzadores. Los resultados mostraron que cuando el componente de procuración tuvo una duración de 40 o 60 s, los sujetos emitieron una mayor cantidad de respuestas que durante las duraciones de 20 s empleados por Cruz y Bruner. Además, cuando la duración del componente de procuración fue de 40 s los sujetos presentaron una mayor acumulación de comida con respecto a cuando la duración del componente de procuración fue de 60 s. Por lo que los autores concluyeron que variar el IEER mediante el incremento de la duración de los componentes de procuración y obtención tiene un efecto sobre la cantidad de comida acumulada.

El experimento de Cruz y Bruner (2014) así como la replicación sistemática realizada por Flores, et al. (2015) mostraron que la demora entre la respuesta que acumula la comida y la oportunidad de consumir una cantidad substancial de comida acumulada es una variable fundamental en la acumulación de reforzadores. Estudios previos sobre acumulación como el de Killeen et al. (1981) habían incrementado las demoras de manera incidental al incrementar el esfuerzo requerido para acceder a la comida, pues todo incremento en la fuerza, distancia e incluso requisito de respuesta conlleva un incremento en el tiempo que separa la respuesta de su reforzador. Los resultados obtenidos por Cruz y Bruner, así como Flores et al. cimientan un puente entre la literatura de demora de reforzamiento y la acumulación de reforzadores. Es importante señalar que en ambos experimentos se empleó una demora entre la respuesta de procuración y la entrega de comida con la finalidad de replicar lo más cercano posible los procedimientos clásicos de acumulación (e.g. Killeen et al., 1981). Sin embargo, se entregó reforzamiento inmediato a la respuesta de obtención.

En un estudio reciente French y Reilly (2017) analizaron el efecto de alargar la demora entre la respuesta de obtención y el reforzador, así como alargar la duración del intervalo entre ensayos (IEE) sobre la acumulación de reforzadores. Usando un procedimiento similar al de Killeen (1971) los sujetos podían acumular comida respondiendo en la palanca de procuración, sin embargo, la primera presión a la respuesta de obtención desactivó la palanca de procuración y programó la entrega de comida. French y Reilly en diferentes condiciones aumentaron ya sea el tiempo entre la respuesta de obtención y la entrega de comida o el tiempo entre la entrega de comida y el inicio del siguiente ensayo, los valores de demora e IEE fueron de 5, 10 y 20 s. Los resultados mostraron que alargar la demora de reforzamiento incrementó la cantidad de reforzadores acumulados en mayor medida que incrementar la duración del IEE. Aplicar la demora sobre la respuesta de obtención fue un procedimiento novedoso pues comúnmente sólo se emplean demoras sobre la respuesta de procuración, sin embargo, debido a las diferencias de procedimiento con otros estudios de demora en acumulación (e.g. Cruz y Bruner, 2014; Flores et al, 2015) no se puede comparar los efectos de alargar la demora posterior a la respuesta de obtención con respecto a la respuesta de procuración.

Los estudios de Cruz y Bruner (2014), Flores et al. (2015) así como French y Reilly (2017) establecen los cimientos que permiten realizar comparaciones entre la literatura de demora de reforzamiento y acumulación de reforzadores. Sin embargo, la unidad de análisis varía entre los procedimientos. Por un lado, los experimentos de acumulación de reforzadores (e.g. Killeen, 1974; Killeen et al., 1981) emplean la cantidad de reforzadores acumulados, los cuales están determinados por el número de respuestas de procuración. Por otro lado, los experimentos de demora (véase Lattal, 2010) emplean la tasa de la respuesta debido a que al alargar la base de tiempo incrementa la cantidad de respuestas que pueden emitirse. Hacen falta experimentos que describan tanto la cantidad de reforzadores acumulados como la tasa de respuesta al alargar demoras de reforzamiento contingentes a la conducta del sujeto para establecer con mayor claridad la relación entre la acumulación de reforzadores y la demora de reforzamiento.

French y Reilly (2017) proponen que en los procedimientos de acumulación de reforzadores existen al menos tres componentes: a) un componente de procuración, en el cual las respuestas aumentan la magnitud de reforzamiento, b) un componente de obtención, en el cual el sujeto obtiene acceso a los reforzadores y c) un componente de consumo de los reforzadores. Por tanto, la demora de reforzamiento puede ocurrir en diferentes momentos: ya sea entre el componente de procuración y el componente de obtención como lo hicieron Cruz y Bruner (2014), o entre el componente de obtención y el consumo de reforzadores como lo hicieron French y Reilly. Debido a las diferencias de procedimiento en los estudios previos de demora en acumulación se desconoce si la demora tiene el mismo efecto sobre la tasa de respuesta cuando se presenta después del periodo de procuración a cuando se presenta después del periodo de obtención. Por lo tanto, el objetivo de este estudio fue comparar los efectos de alargar la demora de reforzamiento sobre la tasa de respuesta cuando la demora es contingente ya sea a la respuesta de procuración o a la de obtención en un procedimiento de acumulación de reforzadores.

MÉTODO

Sujetos

Seis ratas Wistar macho experimentalmente ingenuas de aproximadamente seis meses de edad, al inicio del experimento. Los sujetos se mantuvieron en cajas habitación individuales con acceso irrestricto a un bebedero. Se limitó la cantidad de comida proporcionada fuera de la cámara experimental buscando mantener a los sujetos al 80% de su peso ad libitum.

Aparatos

Se utilizaron seis cámaras experimentales (Med Associates Inc. Modelo ENV-001) equipadas con dos palancas (Med Associates Inc. Modelo ENV-110RM, sensibles a 0.15 N) separadas 12 cm entre sí. Entre las dos palancas, se colocó un comedero conectado a un dispensador de bolitas de comida (Med Associates Inc. Modelo ENV-203) el cual entregó bolitas de comida de aproximadamente 18 mg remoldeadas a partir de comida para ratas (Rodent Laboratory Chow, PMI Nutrition International). Por encima de cada palanca, se encontró un foco cubierto por un domo de plástico que produjo una luz difusa (Modelo ENV-221M). En el panel opuesto a las palancas, hubo un foco de iluminación general de 28 v (Modelo ENV-215M). Cada cámara se colocó en el interior de un cubículo sonoamortiguado (Med Associates Inc. Mo- delo ENV-022SM) equipado con un generador de ruido blanco (Med Associates Inc. Modelo ENV-225SM) y un ventilador para facilitar la circulación de aire. Los eventos experimentales se controlaron mediante una interface (Med Associates Inc. Modelo SG-503), conectada a una computadora equipada con Software Med- PC IV ubicada en un cuarto adyacente.

PROCEDIMIENTO

Entrenamiento preliminar. Con la finalidad de asegurar una distribución equitativa de respuestas en cada una de las dos palancas presentes durante el experimento se realizó un preentrenamiento durante 20 días consecutivos realizando una sesión por día. Cada sesión del preentrenamiento consistió en la entrega de 60 reforzadores bajo un programa de RF 1. Pese a que ambas palancas estuvieron presentes durante toda la sesión, cada reforzador fue asignado aleatoriamente a una de las dos palancas por lo que responder en una palanca entregaba de manera inmediata el reforzador mientras que responder en la otra palanca no tenía consecuencias programadas. La palanca asociada con la entrega del reforzador cambió constantemente pues cada uno de los 60 reforzadores tenía una probabilidad de 50% de ser asignado a la palanca derecha y 50% de ser asignado a la palanca izquierda.

Al finalizar las 20 sesiones de preentrenamiento, con base en la tasa de respuesta de cada sujeto, se formaron parejas de ratas con tasas de respuesta similar y se asignó a los miembros de cada pareja a una condición experimental diferente, asegurando que en cada condición experimental hubiera una rata con una tasa de respuesta alta, una rata con una tasa de respuesta mediana y una rata con una tasa de respuesta baja.

Generalidades. Las sesiones experimentales ocurrieron una vez por día aproximadamente a la misma hora durante los siete días de la semana. Cada sesión experimental tenía una duración de 30 ensayos y durante toda la duración de la sesión las dos palancas se encontraban disponibles. Los ensayos estaban conformados por 3 componentes: un componente de procuración, un componente de obtención y un componente de demora. Cada ensayo inició con el componente de procuración y finalizó con la entrega de los reforzadores acumulados.

Mientras que la duración de los componentes de procuración y obtención fue una variable dependiente regulada por la conducta del sujeto, la duración del componente de demora fungió como variable independiente pues se presentaron duraciones fijas. Ambas condiciones iniciaron el experimento con una demora de 0 s la cual fue incrementando cada 25 sesiones de acuerdo con la progresión 0, 2, 4, 8, 16 y 32 s. Al finalizar, se realizó una redeterminación con los valores de demora 8 y 0 s.

Condiciones experimentales. El orden en el que se presentaron los componentes de procuración, obtención y demora varió dependiendo de la condición experimental. Cada condición difirió únicamente en la ubicación de la demora de reforzamiento, para la condición de Demora en Procuración (DP) la demora ocurrió después del componente de procuración y antes del de obtención, mientras que para la condición de Demora en Obtención (DO) la demora ocurrió después del componente de obtención y antes de la entrega de los reforzadores. La Figura 1 muestra un diagrama del procedimiento en la que se compara la ubicación de la demora.

Figura 1.
Diagrama del procedimiento.

Las condiciones experimentales son muy similares a excepción de la ubicación de la demora, mientras que en una condición la demora inició al concluir el componente de procuración en la otra condición la demora inició posterior al componente de obtención.

Componente de procuración. Inició con una respuesta de procuración que encendió una luz blanca encima de la palanca de procuración. La luz duró encendida un mínimo de 30 s durante los cuales cada respuesta en la palanca de procuración aumentó en uno la cantidad de reforzadores a entregarse al finalizar el ensayo. Durante este componente, las respuestas de obtención no tuvieron consecuencias programadas. Al finalizar los 30 s, la primera respuesta de procuración apagó la luz que se encontraba encima de la palanca de procuración.

Componente de obtención. El componente de obtención inició al encender una luz blanca encima de la palanca de obtención. La luz duró encendida hasta que ocurrió la primera respuesta de obtención la cual inmediatamente concluyó el componente de obtención. Durante este componente las respuestas de procuración no tuvieron consecuencias programadas. Componente de demora. Durante este componente, ninguna respuesta tuvo consecuencias programadas y las luces por encima de las palancas se encontraban apagadas.

Cada ensayo inició con el componente de procuración cuando el sujeto emitió la primera respuesta de procuración después de que se entregaba el reforzador por lo que la duración del IEE fue controlado por la conducta del sujeto.

RESULTADOS

El propósito del presente experimento fue comparar los efectos de la demora de reforzamiento sobre la tasa de la respuesta. Para tal objetivo ambas palancas se encontraron siempre presentes incluso durante el componente de demora donde ninguna respuesta tenía consecuencias programadas. Sin embargo, al ser un procedimiento de acumulación de reforzadores, la cantidad de bolitas de comida obtenidas funge como una variable dependiente de particular importancia, pues la magnitud de reforzamiento se encuentra correlacionada con la tasa de respuesta debido a que cada respuesta de procuración incrementa en uno la cantidad de bolitas obtenidas.

Promedio de la cantidad de comida obtenida durante las últimas cinco sesiones en cada valor de demora, los símbolos vacíos (¸) muestran las redeterminaciones.

Figura 2.
Promedio de la cantidad de comida obtenida durante las últimas cinco sesiones en cada valor de demora, los símbolos vacíos (¸) muestran las redeterminaciones.

Del lado izquierdo se observan los datos individuales de los sujetos del grupo demora en Procuración y del lado derecho del grupo demora en Obtención.

La Figura 2 muestra la media de la cantidad de comida acumulada durante las últimas cinco sesiones para cada valor de demora. Con la excepción de la rata P3 que disminuyó la cantidad de comida acumulada sólo durante la demora de 32 s, todos los sujetos incrementaron la cantidad de comida acumulada conforme incrementaba la demora, sin embargo, existe una mayor cantidad de incremento para la condición DP que para la condición DO. En la Figura 2 los sujetos en una misma condición se presentan en la misma columna, además, los paneles están organizados horizontalmente acorde con la tasa de respuesta de los sujetos durante el preentrenamiento. Los paneles superiores muestran los sujetos con mayor tasa de respuesta, mientras que los paneles inferiores muestran a los sujetos con la tasa de respuesta más baja.

La máxima cantidad de bolitas acumuladas durante la sesión ocurrió durante la demora en 32 s donde la rata P1 acumuló hasta 1422 bolitas de comida en contraste con la condición de reforzamiento inmediato cuando su menor registro fue de 219 bolitas de comida acumuladas. Sin embargo, la distribución de bolitas de comida acumuladas por ensayo no fue uniforme en ningún sujeto pues la mayor cantidad de bolitas de comida ocurrió durante los primeros ensayos.

Promedio de la cantidad de bolitas de comida obtenidas por ensayo durante las últimas 5 sesiones de cada valor de demora en el grupo de Demora en procuración.

Figura 3.
Promedio de la cantidad de bolitas de comida obtenidas por ensayo durante las últimas 5 sesiones de cada valor de demora en el grupo de Demora en procuración.

Cada celda muestra diferente valor de demora con los datos individuales de P1 (+), P2 (à) y P3 (×). La línea continua (♦) muestra el promedio de los 3 sujetos, los símbolos vacíos (¸) muestran el promedio de los 3 sujetos en la redeterminación.

Promedio de la cantidad de bolitas de comida obtenidas por ensayo durante las últimas 5 sesiones de cada valor de demora en el grupo de Demora en obtención.

Figura 4.
Promedio de la cantidad de bolitas de comida obtenidas por ensayo durante las últimas 5 sesiones de cada valor de demora en el grupo de Demora en obtención.

Cada celda muestra diferente valor de demora con los datos individuales de O1 (à) y O2 (×). O3 (+). La línea continua (♦) muestra el promedio de los 3 sujetos, los símbolos vacíos (¸) muestran el promedio de los 3 sujetos en la redeterminación.

Las Figuras 3 y 4 muestran la media de bolitas de comida acumuladas por cada ensayo durante las últimas cinco sesiones de cada valor de demora. Se muestra que para los seis sujetos la cantidad de comida obtenida durante toda la sesión incrementó conforme se alargó la demora de reforzamiento.

La cantidad de reforzadores obtenidos en un ensayo se correlaciona con la cantidad de respuestas de procuración emitidas durante el componente de procuración, por lo que, de manera similar a la cantidad de bolitas de comida obtenidas por ensayo, la tasa de respuesta disminuyó conforme aumentaron los ensayos concluidos, lo cual sugiere un efecto de sacie- dad, pues hubo sujetos que consumían hasta dos terceras partes del total de reforzadores de la sesión en menos de 15 ensayos. Debido a que el objetivo de esta investigación es comparar la tasa de respuesta entre las dos condiciones, la disminución de la tasa de respuesta como resultado de la saciedad podría funcionar como una variable extraña que afecta los resultados globales. Para reducir el efecto que la saciedad pudo tener sobre los resultados, se decidió utilizar únicamente los primeros 15 ensayos para realizar los demás análisis.

Similar a los experimentos de demora se optó por tomar la tasa de respuesta como variable dependiente en lugar de la cantidad de respuestas emitidas pues permite realizar comparaciones entre condiciones en las cuales varía la base de tiempo por lo que permite comparar apropiadamente la frecuencia de la respuesta mientras que se alarga la duración de la demora. Debido a que ambas palancas tanto la de procuración como de obtención se encontraron siempre presentes durante todo el experimento, se calculó la tasa global de cada clase de respuesta al dividir la cantidad total de respuestas emitidas en cada operando durante la sesión sobre la duración de los 30 ensayos incluyendo los 3 componentes procuración, obtención y demora. Para calcular la tasa de respuesta se decidió excluir del cálculo el IEE pues acorde con el procedimiento sólo fungían como pausas post reforzamiento donde el sujeto podía consumir la comida acumulada, ya que la primera respuesta de procuración iniciaba inmediatamente el siguiente ensayo.

Promedio de la tasa de respuesta global de la sesión durante las últimas cinco sesiones en cada valor de demora para la respuesta de procuración (♦), y la respuesta de obtención (●).

Figura 5.
Promedio de la tasa de respuesta global de la sesión durante las últimas cinco sesiones en cada valor de demora para la respuesta de procuración (♦), y la respuesta de obtención (●).

Del lado izquierdo se observan los datos individuales de los sujetos del grupo demora en Procuración y del lado derecho del grupo demora en Obtención.

De manera específica la tasa de la respuesta de procuración incluye las respuestas de procuración tanto durante el componente de procuración, donde cada respuesta incrementaba la cantidad de reforzadores acumulados, como las respuestas en la palanca de procuración ocurridas durante los componentes de demora y obtención. Del mismo modo la tasa global de la respuesta de obtención incluye todas las respuestas de obtención ocurridas durante la sesión, no sólo las respuestas durante el componente de obtención sino también las respuestas durante los componentes de procuración y demora donde las presiones a la palanca de obtención no tenían consecuencias programadas.

La Figura 5 muestra la media de la tasa global de respuesta de ambas clases de respuesta durante los primeros 15 ensayos para las últimas cinco sesiones de cada valor de demora. Para dos de los tres sujetos en la condición DP (P1 y P2) la tasa de respuesta de procuración aumenta conforme se alarga la demora de reforzamiento; esto no sucede cuando la demora sigue a la respuesta de obtención, pues los resultados de la condición DO muestran que alargar la demora de reforzamiento disminuye la tasa de respuesta para todas las demoras mayores a 4 segundos. Con respecto a la respuesta de obtención, la tasa de respuesta de obtención es mayor en la condición de DP con respecto a la condición de DO, también se muestra una disminución de la tasa de respuesta de obtención conforme se alarga la demora de reforzamiento en todos los sujetos.

Es importante señalar la tasa de respuesta de la respuesta de procuración disminuyó para todos los sujetos de la condición DO pese a que incrementó la cantidad de reforzadores acumulados. Este efecto se debió a que la base de tiempo incrementó pues al alargar la demora de reforzamiento disminuyó la tasa global de respuesta que incluye en el cálculo los tres componentes de cada ensayo, por lo que presentar un incremento del número de respuestas durante el componente de procuración no conlleva un incremento en la frecuencia de la respuesta durante los demás componentes. Los sujetos en la condición DP incrementaron tanto la cantidad de reforzadores acumulados como la tasa global de respuesta puesto a que se mantuvo un patrón similar de respuesta durante el componente de demora y durante el componente de procuración.

DISCUSIÓN

El propósito del presente experimento fue comparar los efectos de alargar la demora de reforzamiento sobre la tasa de respuesta en una situación de acumulación de reforzadores. Los resultados muestran que, al alargar la demora de reforzamiento, se incrementa la tasa de la respuesta que procura la comida sólo cuando la demora es contingente a la respuesta de procuración. Cuando la demora es contingente a la respuesta de obtención alargar la demora disminuye la tasa de respuesta tanto de procuración como de obtención.

Una de las aportaciones de este experimento fue mostrar tanto la tasa de respuesta de ambas clases de respuesta como la cantidad de comida acumulada. Pues usar la tasa de respuesta como variable dependiente permite comparar la frecuencia de la respuesta del sujeto bajo diferentes condiciones donde la base de tiempo varía. Los resultados de este experimento mostraron que incrementar la demora puede afectar diferencialmente la comida obtenida y la frecuencia con la que se emiten las respuestas acumulan la comida. Por ejemplo, los resultados mostraron que en ambas condiciones incrementó la comida obtenida pero la frecuencia de respuesta disminuyó para la condición DO y aumentó para la condición DP.

El estudio realizado por French y Reilly (2017) mostró que la cantidad de reforzadores acumulados aumenta conforme se alarga la demora entre la respuesta de obtención y la entrega de reforzadores. Nuestro procedimiento replica este hallazgo pues para todos los sujetos en la condición donde la demora seguía a la respuesta de obtención se encontró un aumento en la cantidad de reforzadores acumulados en función de la duración de la demora de reforzamiento. Sin embargo, al analizar la tasa de respuesta encontramos que la frecuencia de la respuesta que acumula la comida disminuye conforme se alarga la demora, por lo que cuando la demora sigue a la respuesta de obtención se encuentran gradientes decrecientes de demora similares los reportados en procedimientos de clásicos de demora (cf. Lattal, 2010).

Cuando la demora sigue a la respuesta de procuración como en los experimentos de Cruz y Bruner (2014) y Flores et al. (2015), alargar la demora de reforzamiento aumenta concomitantemente la cantidad de reforzadores acumulados, al mismo tiempo que aumenta la tasa de la respuesta de procuración. Cabe destacar que si bien el gradiente creciente en la tasa de respuesta ocurrió claramente en dos de los tres sujetos de la condición DP el tercer sujeto P3 mostró también un incremento en la tasa de respuesta en demoras menores a 32 s con respecto a reforzamiento inmediato. Estudios anteriores como el de Cruz y Bruner, así como Flores et al. ya habían mostrado resultados similares pues no todos sus sujetos incrementaron el número de respuestas en demoras mayores o iguales a 32 s. Estudios posteriores podrían indagar en los parámetros que modulan el decremento de la tasa de respuesta en demoras mayores a 32 s con procedimientos de acumulación.

Lattal (2010) define la demora de reforzamiento como el periodo de tiempo que existe entre una respuesta y su reforzador. Esta definición puede resultar difícil de conciliar con los experimentos de acumulación pues al existir dos diferentes respuestas con diferentes funciones asociadas al mismo estímulo físico como lo es la bolita de comida se dificulta determinar cuál procedimiento representa de manera más apropiada la definición de demora propuesta por Lattal. ¿Es la demora el tiempo que existe entre la respuesta que aumenta la comida acumulada y la oportunidad de consumirla, pese a que exista reforzamiento inmediato entre la respuesta de obtención y el acceso a la comida acumulada como sucede en el procedimiento de Cruz y Bruner (2014) y la condición de DP del presente experimento; o es la demora el tiempo que existe entre la respuesta que da acceso a la comida y la entrega de comida, pese a que la cantidad de comida es determinada por una respuesta completamente diferente como en el procedimiento de French y Reilly (2017) y la condición DO del presente experimento? El presente estudio explora ambas posibilidades pues compara una condición de demora posterior a la respuesta de procuración con respecto a una condición de demora posterior a la respuesta de obtención.

Los resultados de este estudio muestran que alargar la demora de reforzamiento incrementa la cantidad de reforzadores acumulados sin importar la respuesta con la que sea contingente la demora. Sin embargo, existen diferencias en los gradientes de demora dependiendo de a qué respuesta sea contingente la demora. El hallazgo de diferentes gradientes de demora dependientes de la clase de respuesta con la que sean contingentes en una situación de acumulación de reforzadores no había sido reportado previamente en la literatura. Es importante señalar que los diferentes gradientes de demora no dependen de la tasa de respuesta inicial de cada sujeto pues se encontró tanto para el par de ratas con mayor tasa de respuesta como para el par con menor tasa de respuesta durante el preentrenamiento.

Usualmente los procedimientos de acumulación de reforzadores se distinguen debido a la correlación que existe entre el número de respuestas y la magnitud de reforzamiento, pues en un experimento de acumulación las respuestas del sujeto aumentan la cantidad de comida que recibirá al final del ensayo. El efecto que tiene la magnitud de reforzamiento correlacionada con la frecuencia de respuesta ha sido estudiado en otra parte (e.g. Bruner, Feregrino & Flores, 2017; Flores, 2017), por lo que usualmente los experimentos de acumulación no emplean grupos control de reforzamiento no correlacionado (e.g. Killeen, 1974; Killeen et al 1981). Siguiendo esa vena el presente procedimiento no utilizó grupos control pues los efectos de incrementar la demora de reforzamiento con magnitudes fijas de reforzamiento han sido ampliamente estudiados (e.g. Jarmolowicz & Lattal, 2013; Richards, 1981; Shahan & Lattal 2005; Sizemore & Lattal, 1978). En su defecto optamos por un procedimiento de criterio cambiante (Sidman, 1960) en el cual cada sujeto fungía como su propio control y contrastamos los resultados en cada valor de demora. No obstante, reconocemos que, al emplear demoras en diferentes clases de respuesta, en especial al comparar una condición donde la demora separa la respuesta de procuración de la de obtención y no del reforzador per se, como lo fue la condición DP, la información adicional que los grupos control pudiesen proporcionar podrían fungir como ayuda para explicar porque pese a que en ambas condiciones aumentó la cantidad de comida acumulada la tasa de respuesta sólo incrementó durante la condición DP.

Otra contribución novedosa del presente experimento es la disminución de la tasa de la respuesta de obtención en función de la duración de la demora de reforzamiento, pues la mayoría de los estudios de acumulación (e.g. French & Reilly, 2017; Killeen et al., 1981) se enfocan en describir únicamente la respuesta de procuración, dejando de lado la respuesta de obtención. Incluso en algunos experimentos no se reporta de manera explícita la existencia de una respuesta que da acceso a la comida acumulada un ejemplo es el experimento de Killeen (1974) en el cual, si bien se reporta que los sujetos tenían que caminar una distancia para consumir los reforzadores, no se clasifica como una clase de respuesta diferente de la que procura la comida.

La mayoría de los resultados reportados en este experimento fueron de la primera mitad de cada sesión debido al efecto de saciedad que encontrado principalmente en la condición de DP por el cual disminuía la tasa global de respuesta en función de la cantidad de comida consumida. La disminución en la cantidad de reforzadores acumulados por ensayo conforme se incrementa la cantidad total de reforzadores entregados no había sido reportada en ningún experimento de acumulación.

Algunos estudios han limitado la cantidad máxima de reforzadores que se pueden acumular por ensayo ya sea directamente como French y Reilly (2017) quienes establecieron un máximo de 12 reforzadores por ensayo, o indirectamente al limitar el tiempo en el que se puede acumular comida como Flores et al. (2015) quienes exploraron el efecto que tienen diferentes duraciones del componente de procuración sobre la acumulación de reforzadores. Los sujetos en la condición DP del presente experimento llegaron a acumular hasta 60 reforzadores durante los primeros ensayos lo que indica que en promedio respondieron al menos dos veces por segundo durante el componente de procuración. Sin embargo, conforme avanzaba la sesión disminuyó la cantidad de reforzadores acumulados, posiblemente una mayor duración del componente de procuración podría requerir de una menor cantidad de ensayos requeridos para empezar a disminuir la tasa de respuesta debido a la saciedad por lo que duraciones mas largas del componente de procuración resultarían en menor cantidad de reforzadores acumulados como en el experimento de Flores et al (2015).

Es difícil determinar si la saciedad podría ser una variable extraña en la literatura de acumulación puesto que en la mayoría de los procedimientos es la conducta del sujeto la que determina la cantidad total de comida consumida. Sin embargo, es importante tomarlo en cuenta para futuras investigaciones pues dependiendo del número de ensayos y la cantidad de comida entregada por ensayos podrían observarse diferentes efectos de incrementar la demora de reforzamiento.

Concluimos que el efecto de la demora de reforzamiento sobre la tasa de respuesta en una situación de acumulación de reforzadores varía dependiendo de la clase de respuesta a la que sea contingente la demora de reforzamiento. Los resultados muestran que, cuando la demora sigue a la respuesta que acumula la comida, alargar la demora incrementa la tasa de respuesta, mientras que, cuando la demora sigue a la respuesta que da acceso a los reforzadores acumulados alargar la demora disminuye la tasa de respuesta.

REFERENCIAS

Bruner, C. A., Feregrino, E., & Flores, R. A. (2017). La magnitud del reforzamiento cor- relacionado con la respuesta determina la inclinación del gradiente de demora. Acta Comportamentalia, 25(4), 427-441.

Cruz, L. & Bruner, C. A. (2014). La demora de reforzamiento controla la acumulación de reforzadores en ratas. Acta Comportamentalia, 22(4), 383-393.

Ferster, C.B., & Skinner B.F. (1957). Schedules of reinforcement. New York: Appleton Century Crofts. https://doi.org/10.1037/10627-000

Flores Aguirre, C. J., Mateos Morfín, L. R., & Bruner, C. A. (2015). Efectos de la duración de los componentes de procuración y obtención sobre la acumulación de comida. Acta Comportamentalia, 23 (3), 233-242.

Flores, R. A. (2017). Gradientes crecientes o decrecientes de demora en función de la magnitud del reforzamiento usando una operante libre. Tesis de Licenciatura

French, E. J., & Reilly, M. P. (2017). The role of temporal intervals on reinforcer accumulation. Journal of the Experimental Analysis of Behavior, 108(3), 351-366. https://doi. org/10.1002/jeab.283

Jarmolowicz, D. P., & Lattal, K. A. (2013). Delayed reinforcement and fixed-ratio performance. Journal of the Experimental Analysis of Behavior, 100(3), 370-395. https://doi. org/10.1002/jeab.48

Killeen, P. (1974) Psychophysical distance functions for hooded rats. The Psychological Record, 24, (229-235). https://doi.org/10.1007/BF03394238

Killeen, P., Smith, J., & Hanson, S. (1981). Central place foraging in rattus norvegicus. Animal Behavior, 29(1), 64-70. https://doi.org/10.1016/S0003-3472(81)80152-2

Killeen, P. & Riggsford, M. (1989). Foraging by Rats: Intuitions, Models, Data. Behavioural Processes, 19, 95-105. https://doi.org/10.1016/0376-6357(89)90033-8

Lattal, K. A. (2010). Delayed reinforcement of operant behavior. Journal of the Experimental Analysis of Behavior, 93, 129–139. https://doi.org/10.1901/jeab.2010.93-129

McFarland, J., & Lattal, A. (2001). Determinants of reinforcer accumulation during an operant task. Journal of Experimental Psychology, 76, 321-338. https://10.1901/jeab.2001.76- 321

Richards, R.W. (1981). A comparison of signaled and unsignaled delay of reinforcement. Journal of the Experimental Analysis of Behavior, 35(1), 145–152. https://doi. org/10.1901/jeab.1981.35-145

Shahan, T., & Lattal, K. A. (2005). Unsignaled delay of reinforcement, relative time, and resistance to change. Journal of the Experimental Analysis of Behavior, 83(2), 201-219. https://doi.org/10.1901/jeab.2005.62-04

Sidman, M. (1960). Tactics of scientific research. Oxford, England: Basic Books.

Sizemore, O. J., & Lattal, K. A. (1978). Unsignaled delay of reinforcement in variable-interval schedules. Journal of the Experimental Analysis of Behavior, 30(1), 169-175. https://doi.org/10.1901/jeab.2005.62-04

Skinner, B. F. (1938). The behavior of organisms: An experimental analysis. New York: Ap- pleton Century Crofts.

Notas de autor

₁ El experimento descrito en este trabajo forma parte de la tesis doctoral del primer autor, dirigida por el segundo. Este trabajo fue financiado gracias al apoyo del Consejo Nacional de Ciencia y tecnología (CO- NACYT) por medio de una beca para estudios de doctorado otorgada al primer autor. Dirigir correspondencia a cualquiera de los autores: Laboratorio de Condicionamiento Operante, Facultad de Psicología de la Universidad Nacional Autónoma de México. Av. Universidad 3004, Cd. de México, 04510. Correos electrónicos mnbaxs@ hotmail.com, cbruner@unam.mx