La magnitud del reforzamiento correlacionado con la respuesta determina la inclinación del gradiente de demora

Carlos A. Bruner; Edith Feregrino; Andrea Flores

resúmenes

secciones

referencias

imágenes

Resumen: En un estudio anterior mostramos que la acumulación de comida en ratas es una función creciente de alargar la demora entre las respuestas de procuración y de obtención de comida. En el Experimento 1 de este trabajo se eliminó la respuesta de obtención y la comida acumulada se entregó en una sola emisión con una demora de 0, 1, 4, 16 y 32 s tras las respuestas de procuración. Eliminar la respuesta de obtención no afectó la función de acumulación, mostrando que este procedimiento sólo difiere de una situación típica de demora en la alta magnitud de reforzamiento correlacionado con la respuesta. En el Experimento 2 se intentó relacionar el procedimiento de acumulación con el clásico de demora, con baja magnitud de reforzamiento. Usando las mismas demoras, la magnitud de reforzamiento se disminuyó gradualmente con programas de razón al azar (RA) de 2, 4, 8 y 16. Manteniendo constante la correlación entre respuestas y reforzadores, aumentar la RA cambió gradualmente la inclinación del gradiente de uno creciente a uno decreciente. Estos resultados muestran que la acumulación de comida en ratas se reduce a un caso de demora con una alta magnitud de reforzamiento correlacionado con la respuesta.

Palabras clave:acumulación de comidaacumulación de comida, demora de reforzamiento demora de reforzamiento, respuestas de procuración y de obtención respuestas de procuración y de obtención, gradiente de demora gradiente de demora, magnitud de reforzamiento magnitud de reforzamiento, ratas ratas.

Abstract: In a previous study we showed that food accumulation by rats is an increasing function of lengthening the delay between the food-procuring and the food-obtaining responses. In Experiment 1 of this paper the food-obtaining response was eliminated and accumulated food was delivered at once with a delay of 0, 1, 4, 16 and 32 s after the procuring responses. Eliminating the obtaining response had no effect on the accumulation function, showing that this procedure only differs from a typical delay-of-reinforcement situation in the high-magnitude of response-correlated reinforcement. In Experiment 2 an attempt was made to relate the food accumulation procedure with the classic used in the study of delay of reinforcement, with a low magnitude of reinforcement. Using the same delays, the magnitude of reinforcement was decreased gradually with random-ratio schedules (RR) of either 2, 4, 8 or 16 responses per reinforcement. Holding constant the correlation between responses and reinforcement, increasing RR changed gradually the tilt of the gradient from increasing to decreasing. These results show that food accumulation by rats reduces to a case of delay with a high magnitude of response-correlated reinforcement.

Keywords: Food accumulation, delay of reinforcement, procuring and obtaining responses, delay gradient, magnitude of reinforcement, rats.

Carátula del artículo

La magnitud del reforzamiento correlacionado con la respuesta determina la inclinación del gradiente de demora

Magnitude of response-correlated reinforcement determines the tilt of the delay-gradient

Carlos A. Bruner cbruner@unam.mx

Universidad Nacional Autónoma de México, México

Edith Feregrino feregrinonu.edithm@gmail.com

Universidad Nacional Autónoma de México, México

Andrea Flores r.andrea.flores@gmail.com

Universidad Nacional Autónoma de México, México

Acta Comportamentalia: Revista Latina de Análisis de Comportamiento, vol. 25, núm. 4, pp. 427-441, 2017
Universidad Veracruzana

Recepción: 13 Mayo 2017

Aprobación: 28 Julio 2017

Killeen (1974) mostró que separar la palanca que produce la comida (conforme un programa de razón fija 1; RF1) y el comedero donde se entrega, resulta en que las ratas presionen la palanca repetidamente hasta acumular una cantidad sustancial de bolitas. Posteriormente dejan de presionar la palanca y viajan al comedero a consumir la comida acumulada. Es más, alargar la distancia entre la palanca y el comedero a 60, 120, 180 y 240 cm resulta en aumentos concomitantes en la acumulación de comida. Killeen interpretó este hallazgo como evidencia de que aumentar el esfuerzo para obtener la comida (el “costo de la respuesta”) fue la variable responsable del efecto. Desde luego que esta explicación se basa en sentido común dado que consumir cada bolita cuando se entrega involucra un mayor esfuerzo que acumular una cantidad sustancial de bolitas y comérselas todas juntas después de un solo viaje. En un estudio posterior, Killeen y Riggsford (1989; Experimento 1) mostraron que el nivel de acumulación con la distancia de 240 cm no cambia cuando se alarga la distancia entre la palanca y el comedero tanto como 488 cm.

En estudios subsecuentes al de Killeen (1974) la acumulación de comida también se explicó en términos del “costo de la respuesta”. Killeen, Smith y Hanson (1981) usaron una cámara experimental estándar con un comedero al centro del panel y una palanca a cada lado. Una de las palancas (en nuestro vocabulario llamada de procuración) entregaba una bolita de comida conforme a un programa de RF1. Sin embargo, la comida no era inmediatamente accesible porque una cubierta de plástico cubría el comedero. Para acceder a la comida era necesario presionar la segunda palanca (en nuestro vocabulario llamada de obtención) que en su Experimento 1 retiraba la cubierta conforme programas de RF 16, 32, 64 o 128. Encontraron que el número de bolitas acumuladas aumentó en función de aumentar la RF en la palanca de obtención. Usando la misma situación, en su Experimento 3 mantuvieron constante la fuerza necesaria para presionar la palanca de procuración en 0.25 N pero variaron la fuerza para presionar la palanca de obtención y acceder a la comida, de 0.25 a 3.1 N. Con un programa de RF 1 en la palanca de obtención encontraron que hubo más acumulación de comida conforme aumentó la fuerza para operar la palanca.

McFarland y Lattal (2001; Experimento 1) variaron la distancia entre la palanca de procuración y la de obtención en 31, 124 y 248 cm. Además, probaron el efecto de mantener constante un programa de RF1 en la palanca de procuración o en la de obtención y uno de RF 1, 15 o 20 en la otra palanca. Respecto al alargamiento de la distancia entre la palanca de procuración y la de obtención encontraron una función creciente de acumulación. Sin embargo, la manipulación de las razones fijas en ambas palancas mostró una interacción con la variable de distancia. Hubo más acumulación cuando la RF fue más baja en cualquiera de las dos palancas en combinación con la distancia más larga pero también cuando el RF fue más alta en cualquier palanca en combinación con la distancia más corta. En su Experimento 3, McFarland y Lattal probaron combinaciones entre las mismas distancias y además el efecto de un programa de razón progresiva (RP) N+1 en la palanca de procuración que se reiniciaba a 1 en cada ensayo. Encontraron que alargar la distancia entre las palancas de procuración y de obtención replicó la función creciente de acumulación. Las razones progresivas en la palanca de procuración resultaron en aumentos en la acumulación de comida. Como en estudios anteriores, McFarland y Lattal explicaron sus resultados en términos del “costo de la respuesta”.

Usar diferentes respuestas de obtención en estudios anteriores se ha justificado como una forma de variar el “costo de la respuesta”. Sin embargo, es claro que cualquier concepto que se usa de una manera generalizada es poco útil porque incluye un gran número de manipulaciones diferentes. Además, distrae la atención de un hecho potencialmente importante: que cualquier forma de manipular el “costo de la respuesta” necesariamente alarga la demora de reforzamiento entre la respuesta de procuración y la entrega de reforzamiento, lo que plantea la pregunta de si la demora no es el ingrediente activo de la acumulación. De hecho existe evidencia que la demora de reforzamiento controla la acumulación de comida en ratas. En su Experimento 2, Killeen et al. (1981) usaron una sola palanca de procuración que con cada presión programaba un periodo de demora reiniciable de 10, 20, 40 y 80 s. Al finalizar la demora se elevó automáticamente una puerta que cubría la charola de comida. Encontraron que alargar la demora resultó en un aumento en la acumulación de comida. Es interesante notar que aunque los resultados de este estudio sugieren que la demora de reforzamiento es una variable confundida con el “costo de la respuesta”, en trabajos posteriores se siguió investigando la acumulación en función del “costo de la respuesta.

En este punto es necesario señalar que con algunas variaciones todos los trabajos sobre acumulación han empleado un procedimiento de elección con ensayos discretos. Cada ensayo comienza con la oportunidad de presionar una palanca de procuración durante un tiempo indefinido. Las respuestas de procuración programan la posterior entrega de comida acumulada pero no permiten su consumo inmediato. En algún momento durante el ensayo las respuestas de procuración dejan de ocurrir y se emite alguna respuesta de obtención para acceder a la comida acumulada. Como puede verse, este procedimiento general no se presta fácilmente a variaciones paramétricas. El permitir el acceso a la palanca de procuración por un tiempo indefinido permite una latitud grande en el número de respuestas de procuración que pueden emitirse. En la misma vena, emplear una variedad de respuestas de obtención diferentes y también diferentes formas de acceder a la comida acumulada dificulta la comparación de los resultados. Por estas razones en nuestro primer trabajo sobre este tema (Cruz & Bruner, 2014) eliminamos el procedimiento de elección usando una duración constante de acceso a las palancas de procuración y de obtención. El tener una secuencia fija de condiciones experimentales nos ha permitido probar diferentes variaciones paramétricas del mismo procedimiento.

Cruz y Bruner (2014) investigaron la acumulación de comida en ratas en función de la demora de reforzamiento. Usaron una cámara experimental con dos palancas retráctiles, cada una al lado de un comedero centrado en el panel. Como en estudios anteriores usaron un procedimiento de ensayos discretos. Cada ensayo iniciaba con la extensión de la palanca izquierda durante 20 s. Las presiones a la palanca no tenían consecuencias pero se contaban. Tras la retracción de la palanca iniciaba un periodo de demora de reforzamiento de 0, 1, 2, 4, 8, 16 o 32 s en condiciones sucesivas del experimento. Después de la demora programada se extendía la palanca derecha por otros 20 s y cada presión a esta palanca resultaba en la entrega de una bolita de comida hasta completar el número de veces que presionó la palanca izquierda. Encontraron que alargar la demora de reforzamiento resultó en un aumento en la acumulación de comida (y en el número de veces que se presionó la palanca de obtención) para las tres ratas en el experimento. Este resultado sugiere que efectivamente la demora de reforzamiento y no el “costo de la respuesta” fue la variable responsable de la acumulación de comida en ratas.

El propósito general de los dos experimentos siguientes fue tratar de relacionar la acumulación de comida en ratas con el conocimiento establecido sobre demora de reforzamiento.

Experimento 1

Los resultados del experimento de Cruz y Bruner (2014) son importantes al tema de la acumulación de comida en ratas porque muestran que las diferentes manipulaciones del “costo de la respuesta” pueden reducirse a la manipulación de la demora de reforzamiento, que es una variable común en los diversos estudios sobre acumulación. Sin embargo, aparte de esta contribución, este experimento plantea otras preguntas. Una de estas es que posiblemente las presiones a la palanca de obtención de comida, reforzadas inmediatamente, resulten en la inducción de las presiones en la palanca de procuración. Escobar y Bruner (2007) mostraron que reforzar las presiones a una palanca tiende a inducir presiones en otras palancas inoperativas en función de su cercanía y ciertamente que en el experimento de Cruz y Bruner las palancas se encontraban relativamente cercanas. La segunda pregunta de este experimento fue si podría demostrarse el efecto de acumulación eliminando la respuesta de obtención y entregando las bolitas de comida juntas después del periodo de demora, dispensando de un requisito explícito de respuesta. El propósito de este experimento fue responder a estas dos preguntas.

Método

Sujetos. Se emplearon tres ratas Wistar macho, de aproximadamente tres meses de edad al inicio del estudio y privadas al 80 % de su peso ad libitum. Se mantuvo a las ratas en cajas habitación individuales con libre acceso al agua.

Aparatos. Se usaron tres cámaras experimentales (Med Associates Inc. Modelo ENV-007) equipadas con una palanca retráctil (Med Associates Inc. Modelo ENV-1128) sensible a 0.15 N y separada 6 cm a la izquierda de un comedero al centro del panel frontal. Un dispensador de bolitas de comida (Med Asociates Inc. Modelo ENV-203) entregó en cada operación una bolita de 27 mg fabricada en nuestro laboratorio re-moldeando polvo de comida para ratas (Rodent Laboratory Chow, PMI Nutrition International). En el panel opuesto a la palanca había un foco de iluminación general de 28 v. Cada cámara se introdujo en un cubículo sonoamortiguado (Med Associates Inc. Modelo ENV-018) que atenuaba el ruido del ambiente con ayuda de un generador de ruido blanco (Med Associates Inc. Modelo ENV-225 SM). Un ventilador permitió la circulación del aire. Los eventos experimentales y el registro de los datos se controlaron con una interfase (Med Associates Inc. Modelo SG-503) conectada a una computadora equipada con Software Med-PC IV, ubicada en un cuarto separado.

Procedimiento. Sin entrenamiento preliminar, las tres ratas fueron expuestas directamente a la situación experimental. Las sesiones experimentales iniciaron con el encendido de la luz general y consistieron en 30 ensayos. Cada ensayo comenzó con la extensión de la palanca de procuración durante 20 s. Las presiones a la palanca no tenían consecuencias inmediatas y solamente se contaban. Tras la retracción de la palanca iniciaba un periodo de demora reforzamiento. Después del periodo de demora se entregaron en rápida sucesión tantas bolitas de comida como el número de veces que se presionó la palanca al inicio del ensayo. El tiempo entre ensayos sucesivos fue de 20 s para permitir el consumo de las bolitas entregadas. Las demoras fueron de 0, 1, 4, 16 y 32 s, en ese orden en condiciones sucesivas de 30 sesiones cada una. Al final de la serie completa de demoras se redeterminaron los efectos de 4 y 0s.

Resultados

Figura 1
Número de respuestas individuales en sesiones consecutivas de las demoras de reforzamiento. Los símbolos oscuros corresponden a la serie creciente de demoras mientras que los puntos claros corresponden a las replicaciones en orden decreciente.

La Figura 1 muestra para cada rata el número de presiones a la palanca (y por lo tanto de bolitas de comida acumuladas) en cada sesión consecutiva del experimento. Dado que se expuso a las ratas directamente a la situación experimental, en la condición de demora 0 s el número de respuestas comenzó en niveles cercanos a cero en las tres ratas. Conforme transcurrieron las sesiones aumentó para las Ratas 2 y 3. La Rata 1 terminó esta condición con un número muy bajo de respuestas. En contraste, en la condición de demora 1 s el número de respuestas aumentó con el paso de las sesiones para las Ratas 1 y 3 y en condiciones sucesivas siguió aumentando moderadamente pero de manera constante para las tres ratas. La excepción a esta descripción fue la Rata 1 al bajar ligeramente el número de respuestas con la demora de 32 s. Esta figura también muestra las replicaciones de las demoras de 4 y 0 s, obtenidas en ese orden. Para las Ratas 1 y 3 el número de respuestas por sesión disminuyó de la demora 32 s a la reinstalación de la demora de 4 s y para la Rata 2 aumentó ligeramente durante las últimas sesiones de esta condición. Durante la replicación de la demora de 0 s, el número de respuestas fue ligeramente más baja que la de 4 s para las tres ratas. Los resultados de las replicaciones en 4 y 0 s sugieren que en este rango de demoras el número de respuestas no es sensible a variaciones pequeñas en la variable independiente.

Figura 2
Número de respuestas promedio en función de cada demora de reforzamiento. Estos datos representan la media de los tres sujetos durante las últimas 10 sesiones de cada condición de demora. Los símbolos oscuros corresponden a la serie creciente de demoras mientras que los símbolos claros corresponden a las replicaciones en orden decreciente.

Para las tres ratas, la variabilidad en el número de respuestas por sesión fue mayor con demoras de 0, 1 y 4 s que en las condiciones de 16 y 32 s. Con el propósito de atenuar la variabilidad intra y entre sujetos, en la Figura 2 se muestra el número promedio de respuestas por sesión para las tres ratas durante las últimas 10 sesiones de cada demora. El número de respuestas aumentó gradualmente conforme se alargó la demora de reforzamiento. El número de respuestas promedio durante las replicaciones en orden inverso en 4 y 0 s fueron ligeramente más altas que las determinaciones originales, sin embargo, siguieron la tendencia de la función en el mismo orden de magnitud.

Discusión

Los resultados del Experimento 1 mostraron que alargar la demora resultó en un aumento en el número de veces que se presionó la palanca de procuración (y por lo tanto la cantidad de bolitas acumuladas). Estos datos son muy similares a los obtenidos en el experimento de Cruz y Bruner (2014) y por lo tanto muestran que es improbable que haya ocurrido la inducción de respuestas de la palanca de obtención a la de procuración en ese experimento. Respecto a la pregunta relativa a la necesidad de usar una respuesta de obtención en estudios sobre acumulación los resultados mostraron que en comparación con los resultados de Cruz y Bruner, es indiferente si se utiliza una respuesta de obtención para entregar una a una las bolitas acumuladas o si simplemente se entregan juntas en rápida sucesión al final de la demora, sin un requisito explícito de respuesta. Este resultado es congruente con el obtenido en el Experimento 2 de Killeen et al. (1981) y en el Experimento 4 de Cole (1990, que se discutirá más adelante) quienes tampoco utilizaron una respuesta de obtención. En el estudio de Cruz y Bruner la palanca de obtención se encontraba adyacente al comedero y sólo requería una respuesta para entregar una bolita de comida. Por lo tanto, en este último estudio el “costo de la respuesta” de obtención fue insignificante y además si acaso se mantuvo constante durante todo el experimento. En contraste, en el presente experimento el “costo de la respuesta” se eliminó por completo al no usar una respuesta de obtención y entregando las bolitas de comida juntas al finalizar la demora. Eliminar la respuesta de obtención es una manipulación importante porque equivale a eliminar el origen del “costo de la respuesta”. En los estudios de Killeen (1974), de Killeen y Riggsford (1989) y de McFarland y Lattal (2001) el “costo de la respuesta” de obtención se manipuló alargando la distancia entre la palanca de procuración y el comedero. En el Experimento 1 del trabajo de Killeen et al. (1981) el “costo de la respuesta” de obtención se manipuló aumentando el número de presiones necesarias para retraer una lámina de plástico que cubría el comedero. En el Experimento 3 de Killeen et al. (1981) el “costo de la respuesta” se manipuló aumentando la fuerza para presionar la palanca de obtención. En el estudio de McFarland y Lattal, el “costo de la respuesta” se manipuló variando la RF que regulaba la entrega de una bolita de comida en ambas palancas. En contraste, los datos del presente estudio muestran que la respuesta de obtención es innecesaria en experimentos sobre acumulación de comida.

Experimento 2

Como menciona Sidman (1960), el estudio intensivo de un fenómeno puede dar pábulo al estudio de otro fenómeno, aún más importante que el primero. En el estudio de la acumulación de comida, usar una sola palanca que resulta en la entrega de comida tras una demora replica el procedimiento más usado en los estudios clásicos sobre demora de reforzamiento en situaciones de ensayo discreto (e.g. Renner, 1964; Tarpy & Sawabini, 1974).

En contraste con el aumento en la frecuencia de la respuesta de procuración que se obtiene en los experimentos sobre acumulación de comida, múltiples estudios sobre demora han mostrado que invariablemente, alargar la demora resulta en disminuciones concomitantes en la frecuencia de la respuesta (i.e. el gradiente de demora; Kimble, 1978). La razón de esta discrepancia no es clara. Una posibilidad es que mientras que en los estudios sobre acumulación se entregan múltiples bolitas de comida (una por cada respuesta de procuración), en la inmensa mayoría de los estudios sobre demora de reforzamiento sólo se entrega una bolita de comida al finalizar la demora. Este hecho sugiere que es posible que la inclinación del gradiente de demora sea creciente con una magnitud de reforzamiento alta y que sea decreciente con una magnitud de reforzamiento baja. Otra posibilidad es que en los estudios sobre acumulación el gradiente creciente se deba a que el número de respuestas de procuración determina el número de bolitas que se entregan al final de la demora. De hecho, existen numerosos estudios que muestran que la correlación entre el número de respuestas y de reforzadores es un poderoso determinante de la frecuencia de la respuesta (e.g. Baum, 1973; Herrnstein, 1970). En cambio, en los estudios sobre demora de reforzamiento no existe correlación entre el número de respuestas y el número de reforzadores que se entrega al final de la demora (generalmente una sola bolita).

Es posible analizar la contribución de la magnitud de reforzamiento o el efecto de la correlación entre el número de respuestas y reforzadores en un experimento sobre acumulación. Una forma de aislar el efecto de la magnitud y de la correlación consiste en mantener constante una de estas variables mientras se varía la otra. En el presente Experimento 2 se mantuvo constante la correlación entre el número de respuestas y reforzadores usando programas de razón al azar (RA; Schoenfeld & Cole, 1972). Los programas RA aplican una probabilidad fija de reforzamiento a cada respuesta, lo que permite disminuir la magnitud de reforzamiento al finalizar la demora sin alterar la correlación entre respuestas y reforzadores. Así, se intentó responder la pregunta de si reducir gradualmente la magnitud de reforzamiento resultaría en un cambio también gradual en la inclinación del gradiente creciente de los estudios sobre acumulación a uno decreciente, típico de los estudios sobre demora. Un hallazgo positivo permitiría relacionar el fenómeno de acumulación de comida con los estudios sobre demora de reforzamiento.

Un experimento sobre acumulación hecho por Cole (1990) le presta plausibilidad a esta idea. En su experimento las presiones a la palanca con un intervalo menor a 1 s (tiempo entre respuestas; TER 1s) no tenían consecuencias inmediatas pero programaban la posterior entrega de una bolita de comida. Al ocurrir un TER más largo que 1 s se entregaban las bolitas acumuladas en rápida sucesión durante un tiempo fuera de 10 s. Cole comparó esta situación llamada de “ahorro” con otra en la que las respuestas sucesivas con un TER menor a 1 s programaban la entrega de una bolita además de otras adicionales (una para la primera respuesta, dos para la segunda y así sucesivamente). Cole llamó a esta condición de “intereses”. Encontró que cuando los sujetos permanecían en la cámara experimental 24 hrs diarias, emitieron más respuestas bajo la condición de “intereses” que bajo la condición de “ahorro”. Concluyó que aumentar la magnitud de reforzamiento aumenta el número de respuestas de acumulación.

Método

Sujetos. Se usaron 12 ratas Wistar macho, de aproximadamente tres meses de edad al inicio del estudio. Se mantuvo a las ratas en cajas habitación individuales con libre acceso al agua. Durante todo el experimento se les mantuvo privadas de alimento al 80 % de su peso ad libitum.

Aparatos. Se usaron los mismos que en el Experimento 1.

Procedimiento. Se siguió el mismo procedimiento que en el Experimento 1. Se expuso a todas las ratas a las mismas demoras de reforzamiento en condiciones sucesivas. Sin embargo a diferencia del Experimento 1, para cada tres ratas se mantuvo constante un diferente programa de reforzamiento de razón al azar (RA; Schoenfeld & Cole, 1972). Un programa de RA asigna una probabilidad de reforzamiento (p) constante a cada respuesta. Por ejemplo, un programa de RA 2 asigna una p = 0.50 a cada respuesta, de tal manera que una de cada dos respuestas resulta (en promedio) en una bolita de comida. Un programa de RA 8 asigna una p = 0.125 a cada respuesta por lo que una de cada ocho respuestas recibe una bolita. Los programas de RA del presente estudio fueron 2, 4, 8 o 16 respuestas por reforzador. El tiempo entre ensayos sucesivos fue de 20 s para permitir el consumo de las bolitas entregadas. Al final de la serie completa de demoras se redeterminaron los efectos de 4 y 0 s.

Aquí es importante aclarar que en la mayoría de los estudios anteriores sobre acumulación (incluyendo el de Cruz & Bruner, 2014 y el Experimento 1 del presente trabajo), cada presión de la palanca de procuración resultó en la entrega de una bolita de comida, por lo que tal programa puede verse como uno de RA 1 (i.e. p = 1.00). Dado que las funciones de acumulación que se han obtenido en los estudios anteriores empleando una RA 1 ya se conocen, para el presente Experimento 2 se decidió iniciar con un programa RA 2, que entregaba solamente la mitad de los reforzadores que los estudios anteriores. Emplear programas de RA para disminuir gradualmente la magnitud de reforzamiento permitió mantener constante la correlación entre el número de respuestas y bolitas de comida, lo cual es una característica de los estudios sobre acumulación de comida. Resultados

Tabla 1
El número de respuestas (R) y de reforzadores (E^R) obtenidos para cada sujeto en cada condición de demora bajo un diferente programa de RA. Estos datos se basan en las últimas 10 sesiones de cada condición de demora.

La Tabla 1 muestra el número de presiones a la palanca y de bolitas de comida para cada sujeto como el promedio de las últimas 10 sesiones en cada demora y con cada programa de RA. Estos datos muestran que para cada programa de RA el número de reforzadores obtenidos disminuyó como una proporción del número de respuestas. Es decir, que se mantuvo constante la correlación entre el número de respuestas y de reforzadores tal como ocurre en otros experimentos sobre acumulación.

Figura 3
Número de respuestas individuales como el promedio de las últimas 10 sesiones de cada condición de demora. Cada panel corresponde a un diferente programa de RA como parámetro de las funciones. Los símbolos oscuros corresponden a la serie creciente de demoras mientras que los puntos claros corresponden a las replicaciones en orden decreciente.

Los paneles de la Figura 3 muestran para cada rata el número medio de respuestas por sesión en función de las demoras de reforzamiento con cada programa RA como parámetro. Estos datos se basan en las últimas 10 sesiones en cada condición de demora.

Las medias individuales fueron muy variables tanto intra como entre sujetos. Una instancia notable de variabilidad fue que el haber expuesto a todas las ratas directamente a la demora 0 s resultó en frecuencias de respuesta muy bajas para algunas ratas (e.g. R3, R5, R6, R8). El sujeto R12 presionó la palanca muy infrecuentemente a lo largo de todas las demoras. A excepción de este último sujeto, el número de respuestas de los sujetos que respondieron poco al inicio del estudio aumentaron en la condición de demoras 1 y 4 s y en adelante el número de respuestas siguió un curso más o menos definido. Con RA 2, R2 y R3 aumentaron gradualmente el número de respuestas con demoras en el rango entre 4 a 32 s. El número de respuestas de R1 no varió sistemáticamente con la demora de reforzamiento. Con RA 4 el número de respuestas de R6 disminuyó gradualmente en el rango de demoras entre 1 y 32 s. El número de respuestas de R5 no varió sistemáticamente con el alargamiento de la demora entre 0 y 32 s. Para R4 el número de respuestas aumentó gradualmente en el rango entre 0 y 16 s para luego disminuir ligeramente con la demora de 32 s. Con RA 8 para R8 y R9 las respuestas no siguieron un curso sistemático en el rango entre 1 y 16 s. Para R7 el número de respuestas disminuyó gradualmente en el rango entre 0 y 32 s. Con RA 16 el número de respuestas disminuyó gradualmente para R10 y R11. Para R12 el número de presiones a la palanca fue muy bajo a través de todas las demoras. Los símbolos claros en la Figura 3 muestran las redeterminaciones de las demoras obtenidas en orden inverso, 4 y 0 s. Como en el Experimento 1, los resultados de las replicaciones en 4 y 0 s no siguieron una tendencia uniforme, lo que apoya la idea de que en este rango de demoras el número de respuestas no es sensible a variaciones pequeñas en la variable independiente.

Con el propósito de atenuar la variabilidad intra y entre sujetos, en cada panel de la Figura 4 se muestra el promedio de las tres ratas para cada demora con el programa de RA como parámetro de la función. Los datos muestran que con el RA 2, el número de respuestas por sesión aumentó moderadamente conforme se alargó la demora de reforzamiento. Con el RA 4 las respuestas por sesión se mantuvieron más o menos constantes en función de alargar la demora. Con el RA 8 el número de respuestas disminuyó gradualmente en el rango de demoras entre 1 y 32 s. Con el RA 16 el número de respuestas por sesión disminuyó progresivamente de manera más pronunciada que con RA 8 conforme se alargó la demora de reforzamiento.

Figura 4
Número de respuestas como el promedio de los tres sujetos en función de cada demora de reforzamiento. Estos datos se basan en las últimas 10 sesiones de cada condición de demora. Cada panel corresponde a un diferente programa de RA como parámetro de las funciones.

La Figura 4 también muestra las redeterminaciones obtenidas en orden inverso al final de la serie de alargamientos de la demora. Para RA 2 y 4 las determinaciones en 4 y 0 s fueron casi iguales entre sí y aproximadamente en el mismo nivel de respuesta que la serie de demoras originales. Para RA 8 y 16 s, las determinaciones fueron más bajas con la demora de 4 s y más altas con la demora de 0 s, siguiendo la tendencia de las funciones originales.

Discusión

En este estudio se intentó averiguar si disminuir gradualmente la magnitud de reforzamiento al finalizar demoras cada vez más largas cambiaría gradualmente la inclinación del gradiente, de uno creciente como el de acumulación a uno decreciente como el de los estudios sobre demora. Con el objeto de mantener constante la correlación entre el número de respuestas y el número de bolitas de comida entregadas se emplearon programas de RA que aumentaron gradualmente el requisito de reforzamiento como una proporción del número de respuestas de procuración. El número medio de respuestas por sesión de cada rata fue la variable dependiente. Este dato varió considerablemente intra y entre sujetos, lo que sugiere un conflicto entre una tendencia de respuesta creciente y uno decreciente. Sin embargo, concuerda con la tendencia de la media de los tres sujetos a través de las demoras de reforzamiento con cada programa de RA. En base a las medias de los tres sujetos, los datos muestran que con un programa de RA 2 el número de respuestas aumentó gradualmente conforme se alargó la demora de reforzamiento. Sin embargo, a diferencia de otros estudios sobre acumulación, en los que se entrega una bolita de comida por cada respuesta de procuración, el programa de RA 2 de este estudio entregó (en promedio) solamente la mitad de las bolitas de comida que se habrían entregado usando el programa más común de RF 1. En comparación con el estudio de Cruz y Bruner (2014) y del Experimento 1 del presente trabajo, en los que se usó un programa RF 1 (equivalente a uno de RA 1), la pendiente de la función de acumulación con RA 2 en el presente estudio fue notablemente más plana. Este resultado en si mismo es congruente con la idea de que la magnitud de reforzamiento determina el grado de acumulación (c.f. Cole, 1990).

Alargar la demora con RA 4 resultó en una función sin tendencia definida, mientras que alargar la demora con RA 8 resultó en una función moderadamente decreciente. Alargar la demora de reforzamiento con RA 16 resultó en un gradiente de demora con una pendiente decreciente pronunciada, muy similar por su forma cóncava a los gradientes de demora clásicos (e.g. Perin, 1943, Renner, 1964; Tarpy & Sawabini, 1974), obtenidos con procedimientos de ensayo por ensayo y con operantes libres (Lattal, 2010).

El cambio gradual en la pendiente del gradiente en función de disminuir gradualmente la magnitud de reforzamiento al finalizar las demoras muestra que la magnitud de reforzamiento es un parámetro de la función de acumulación de comida. También muestra que efectivamente los gradientes crecientes y los decrecientes de acumulación se relacionan. Específicamente, los gradientes crecientes y los decrecientes parecen encontrarse en los extremos de un continuo definido por la magnitud de reforzamiento. De hecho, el gradiente decreciente que resultó de alargar la demora con RA 16 parece indistinguible de un gradiente decreciente de demora obtenido al entregar una sola bolita de comida al finalizar la demora (c.f. Kimble, 1978).

Discusión General

Los dos experimentos del presente trabajo se presentan como experimentos separados porque se efectuaron por razones diferentes y los resultados el Experimento 1 sirvieron como base para el Experimento 2. La evolución de esta línea de investigación puede resumirse de la siguiente manera.

Como se mencionó en la introducción del presente trabajo, los trabajos anteriores sobre acumulación de comida en ratas trataron de explicar este fenómeno en términos del esfuerzo por obtener la comida. Esto es paradójico si se considera que los resultados del Experimento 2 del trabajo de Killeen et al. (1981) habían mostrado que la acumulación ocurre al alargar la demora entre la respuesta de procuración y la obtención de la comida acumulada. Sin embargo, estudios posteriores al de Killeen et al. siguieron estudiando la acumulación en función del “costo de la respuesta”. Ahora parece evidente que cualquier forma de aumentar el esfuerzo por consumir la comida disponible necesariamente involucra un alargamiento en la demora de reforzamiento. En este sentido, el trabajo de Cruz y Bruner (2014) contribuyó al conocimiento establecido mostrando que la acumulación de comida ocurre confiablemente al alargar la demora de reforzamiento. Este trabajo mostró que las diferentes maneras de aumentar el esfuerzo podían reducirse a la variable de demora de reforzamiento, lo cual simplificó considerablemente el entendimiento del fenómeno. Como menciona Sidman (1960), la reducción de varias variables a una que las incluye a todas, representa una forma de sistematizar el conocimiento en análisis de la conducta.

El Experimento 1 de presente trabajo fue particularmente importante porque mostró que en una situación de demora, la respuesta de obtención utilizada en la mayoría de los estudios anteriores era innecesaria para obtener acumulación de comida. Más importante aún fue que resaltó la semejanza entre los estudios sobre acumulación y los estudios clásicos sobre demora de reforzamiento, los cuales no incluyen una respuesta de obtención explícita. En ambos tipos de experimento ocurre conducta que procura reforzamiento que se entrega al finalizar el periodo de demora. En el Experimento 2 se mostró que disminuir gradualmente la magnitud de reforzamiento al finalizar la demora resultó en un gradiente de demora decreciente, indistinguible de los clásicos en la literatura (c.f. Kimble, 1978).

Hay que notar que mientras que en el procedimiento de acumulación el número de respuestas de procuración y de bolitas de comida que se entregan al término de la demora están correlacionadas, entregar una sola bolita en un procedimiento común de demora excluye tal correlación. Por esta razón el parecido entre los gradientes de demora decrecientes de acumulación puede deberse a razones diferentes de las que controlan los gradientes de demora decrecientes con una sola bolita de comida. Sin embargo, es concebible que ambos tipos de gradientes se deban únicamente a la magnitud de reforzamiento porque después de todo es improbable que las ratas puedan contar. Es claro que la investigación posterior responderá esta pregunta. Sin embargo, haciendo a un lado este dilema es importante notar que en el presente trabajo la correlación entre el número de respuestas y reforzadores se mantuvo constante y por lo tanto no se confundió con la manipulación de la magnitud de reforzamiento. Por último, es importante notar que desde la primera demostración por Killeen (1974) la acumulación de comida en ratas había permanecido como una curiosidad de laboratorio, sin integrarse al conocimiento establecido. Sin embargo, la investigación intensiva de este fenómeno ahora muestra que representa un caso especial de demora de reforzamiento (c.f. Cabrer, Daza & Ribes, 1999; Sidman, 1960).

Material suplementario

Referencias

Baum, W. M. (1973). The correlation-based law of effect. Journal of the Experimental

Cabrer, F., Daza, B. C., & Ribes, E. (1999). Teoría de la conducta: ¿Nuevos conceptos o nuevos parámetros? Revista Mexicana de Análisis de la Conducta, 25(2), 161-184. http://dx.doi.org/10.5514/rmac.v1.i2.27164 (Trabajo original publicado en 1975).

Cole, M. R. (1990). Operant hoarding: A new paradigm for the study of self-control. Journal of the Experimental Analysis of Behavior, 52(2), 247–261. http://dx.doi.org/10.1901/jeab.1990.53-24

Cruz, L. & Bruner, C. A. (2014). La demora de reforzamiento controla la acumulación de comida en ratas. Acta Comportamentalia, 22(4), 383-393.

Escobar, R., & Bruner, C. A. (2007). Response induction during the acquisition and maintenance of lever pressing with delayed reinforcement. Journal of the Experimental Analysis of Behavior, 88(1), 29-49. http://dx.doi.org/10.1901/jeab.2007.122-04

Herrnstein, R. J. (1970). On the law of effect. Journal of the Experimental Analysis of Behavior, 13(2), 243-266. http://dx.doi.org/10.1901/jeab.1970.13-243

Killeen, P. R. (1974). Psychophysical distance functions for hooded rats. The Psychological Record, 24(2), 229-235.

Killeen, P. R., & Riggsford, M. (1989). Foraging by rats: Intuitions, models, data. Behavioural Processes, 19(1), 95-105. http://doi.org/10.1016/0376-6357(89)90033-8

Killeen, P. R., Smith, J. P., & Hanson, S. J. (1981). Central place foraging in Rattus Norvegicus. Animal Behavior, 29(1), 64-70. http://dx.doi.org/10.1016/S0003-3472(81)80152-2

Kimble, G. A. (1978). Hilgard & Marquis condicionamiento y aprendizaje. México: Trillas.

Lattal, K. A. (2010). Delayed reinforcement of operant behavior. Journal of the Experimental Analysis of Behavior, 93(1), 129-139. http://dx.doi.org/10.1901/jeab.2010.93-129

McFarland, J. M., & Lattal, K. A. (2001). Determinants of reinforcer accumulation during an operant task. Journal of the Experimental Analysis of Behavior, 76(3), 321-338. https://doi.org/10.1901/jeab.2001.76-321

Perin, C. T. (1943). A quantitative investigation of the delay-of-reinforcement gradient. Journal of Experimental Psychology, 32(2), 95-107. http://psycnet.apa.org/doi/10.1037/h0056738

Renner, K. E. (1964). Delay of reinforcement: A historical review. Psychological Bulletin, 61(5), 341-361. http://dx.doi.org/10.1037/h0048335

Sidman, M. (1960). Tactics of Scientific Research. Nueva York, E. U.: Basic Books Publishers Inc.

Schoenfeld, W. N., & Cole, B. K. (1972) Stimulus Schedules: The t-Tau Systems. Nueva York, E. U.: Harper & Row Publishers.

Tarpy, R. M., & Sawabini, F. L. (1974). Reinforcement delay: Selective review of the past decade. Psychological Bulletin, 81(12), 984–997. http://dx.doi.org/10.1037/h0037428

Notas