Comunicación Breve: Observaciones sobre una cadena  conductual heterogénea1

Juan A. Díaz; Carlos A. Bruner

Comunicación Breve: Observaciones sobre una cadena conductual heterogénea¹

Brief Communication: Observations on an heterogeneous behavior chain

Juan A. Díaz ps_diazdiaz@hotmail.com

Universidad Nacional Autónoma de México, México

Carlos A. Bruner cbruner@unam.mx

Universidad Nacional Autónoma de México, México

Comunicación Breve: Observaciones sobre una cadena conductual heterogénea¹

Acta Comportamentalia: Revista Latina de Análisis de Comportamiento, vol. 24, núm. 3, pp. 365-371, 2016

Universidad Veracruzana

Recepción: 27 Noviembre 2015

Aprobación: 29 Febrero 2016

Resumen: Usando una sola rata se filmó el moldeamiento de una cadena conductual heterogénea de tres eslabones (i.e., cada uno con una respuesta diferente). Una vez que la cadena ocurrió con una frecuencia estable se dio por terminado el ejercicio. Sin embargo, dado que se conoce poco sobre cadenas heterogéneas se observó su extinción. Al eliminar el reforzamiento primario la cadena ocurrió con una frecuencia decreciente a través de algunas sesiones. Posteriormente, se entregó reforzamiento primario independiente para determinar la posible recurrencia de la cadena. Se encontró un aumento modesto en la frecuencia de cadenas completas durante varias sesiones. Después de una segunda extinción se recondicionó la cadena completa con reforzamiento primario dependiente de la respuesta. En vista de que la cadena heterogénea se comportó de manera semejante a la de una respuesta simple durante su extinción, evocación con reforzamiento primario y posterior recondicionemiento, se concluyó que la contingencia de reforzamiento fue efectiva para diferenciar a la cadena completa como una respuesta unitaria. Una contribución importante de este ejercicio fue sugerir la función discriminativa del reforzamiento primario para iniciar una nueva cadena.

Palabras clave: cadena heterogénea, moldeamiento, extinción, restablecimiento de la respuesta, unidad conductual, rata.

Abstract: Using a single rat an heterogeneous behavior chain with three links (i.e., each with a different response) was filmed. Once the behavior chain occurred with a stable frequency, the exercise was terminated. However, given that little is known about heterogeneous chains, its extinction was observed. When primary reinforcement was eliminated the chain occurred with a decreasing frequency across several sessions. Subsequently response- independent primary reinforcement was delivered to determine the possible recurrence of the chain. A modest increase in the frequency of complete chains was observed across several sessions. After a second extinction the complete chain was reconditioned with response-dependent primary reinforcement. Given that the complete chain behaved similarly to a simple response during its extinction, its elicitation by primary reinforcement and subsequent reconditioning it was concluded that the reinforcement contingency was effective to differentiate the complete chain as a unitary response. An important contribution of this exercise was to suggest the discriminative function of primary reinforcement to initiate a new chain.

Keywords: Heterogeneous chain, Shaping, Extinction, Response reestablishment, Behavioral unit, Rat.

Las cadenas conductuales se clasifican en dos categorías: las homogéneas son aquellas en que diferentes estímulos discriminativos/reforzadores condicionados (ED/Er) controlan la ocurrencia de una misma respuesta (R) y las heterogéneas, en las que los ED/Er controlan R´s con diferentes topografías (Keller y Schoenfeld, 1950). Ambos tipos de cadena terminan con la entrega de reforzamiento primario (ER) Durante la historia del Análisis de la Conducta se han filmado diferentes cadenas heterogéneas (algunas de ellas célebres, como la de la rata llamada Barnabus; cf. Pierrel & Sherman, 1963) con el fin de mostrar a los estudiantes los principios y conceptos que se enseñan en clase. Esta práctica ha mostrado su utilidad didáctica y de hecho ha ganado adeptos a nuestra disciplina. Con la misma intención se filmó el moldeamiento de una cadena heterogénea como apoyo para un curso introductorio al Análisis de la Conducta. Con el objeto de capturar la atención de los estudiantes nuestra cadena incluyó un componente inusual, consistente en recoger una canica e introducirla en un tubo (a la manera del uso de la canica como una herramienta para que al salir del otro lado del tubo se completara la respuesta). Aparte del carácter circense de este componente, la cadena difirió de las reportadas en la literatura en otros aspectos. Uno de estos consistió en no utilizar un intervalo entre ensayos (cf. Michael, 2000), sino permitir que la cadena volviera a ocurrir tan pronto como se completó la anterior, a la manera de una operante libre. Otro aspecto diferente a las cadenas con ratas mas comunes fue que la nuestra consistió en tres eslabones, mientras que la gran mayoría las publicadas han consistido en solo dos (e.g., D'Andrea, 1969).

Una vez que la cadena ocurrió con una frecuencia estable se dio por terminado el ejercicio didáctico. Sin embargo, dado que se conoce relativamente poco sobre cadenas heterogéneas se decidió probar algunas manipulaciones experimentales. La primera consistió en observar la extinción de la cadena suspendiendo el reforzamiento primario. En reportes anteriores sobre la extinción de cadenas heterogéneas el resultado mas común ha sido la disminución gradual en la frecuencia de la cadena completa hasta eventualmente desparecer, a la manera de una respuesta unitaria (e.g., Contrucci, Kuhn, Lerman, Vorndran, & Addison, 2006;D'Andrea, 1969). En contraste con estudios anteriores que han involucrado solamente dos eslabones (e.g., Balleine, Garner, Gonzalez, & Dickinson, 1995; Corbit, & Balleine, 2003; Thrailkill, & Bouton, 2015), la extinción de nuestra cadena puede verse como una replicación sistemática de la extinción de una cadena heterogénea mas larga y compleja.

La segunda manipulación de nuestro trabajo fue determinar si una vez extinguida es posible controlar un aumento en la frecuencia de la cadena completa mediante reforzamiento independiente. Dado que nuestra cadena ocurrió como operante libre surge la pregunta de cual evento controló el inicio de cada cadena. El evento más plausible es la entrega de reforzamiento primario al final de la cadena anterior. Por esta razón, la segunda intención de nuestro trabajo fue observar el efecto del reforzamiento primario independiente como un posible estímulo discriminativo para iniciar nuevas cadenas una vez extinguidas, tal como se ha mostrado con respuestas simples (e.g., Reid, 1958).

Por último, después de suspender el reforzamiento primario independiente, se volvió a entregar reforzamiento por cada emisión de la cadena completa. El propósito de recondicionar la cadena fue determinar si ocurriría con una frecuencia semejante a la original después de las intervenciones anteriores (Sidman, 1960).

Método

Sujeto

Se empleó una rata macho descendiente de Wistar, de tres meses de edad, privada al 80% de su peso ad libitum. En su jaula habitación individual tuvo libre acceso al agua.

Aparatos

Se usó una cámara experimental de aspecto comercial pero de origen desconocido. Dicha cámara se modificó para instrumentar la cadena heterogénea según se muestra en la Figura 1. La formación de la cadena se filmó con una cámara digital y la operación del equipo fue enteramente manual.

Diagrama de la cámara experimental con sus medidas; a) Dispensador de bolitas de comida
(BRS/LVE E20705), b) Cadena de metal (15 N, 1cm de largo), c) Charola de resina para canica de 7cm
de diámetro y 15 mm de espesor con tubo de cobre de 1.5 cm, y una canica de 1.2 cm, d) Controles
manuales, e) Palanca (15N, comercial de origen desconocido), f) Sonalert.

Figura 1
Diagrama de la cámara experimental con sus medidas; a) Dispensador de bolitas de comida (BRS/LVE E20705), b) Cadena de metal (15 N, 1cm de largo), c) Charola de resina para canica de 7cm de diámetro y 15 mm de espesor con tubo de cobre de 1.5 cm, y una canica de 1.2 cm, d) Controles manuales, e) Palanca (15N, comercial de origen desconocido), f) Sonalert.

Procedimiento

El Moldeamiento de la Cadena. Se condujeron tres o cuatro sesiones experimentales de 45 min distribuidas irregularmente durante cada semana. La Tabla 1 muestra el número de sesiones que requirió el moldeamiento de cada eslabón de la cadena. Siguiendo el procedimiento más común, los eslabones se moldearon de fin a principio, comenzando con el contiguo al reforzamiento primario (bolitas de comida de 25 mg remoldeadas de polvo de Rodent Laboratory Chow de Purina México). Mediante aproximaciones sucesivas se moldeó el primer eslabón, que consistió en depositar una canica en un tubo del mismo diámetro elevado 1.50 cm del piso de la charola. El segundo eslabón consistió en moldear la respuesta de tirar de una cadena metálica que sobresalía aproximadamente 1 cm del techo de la cámara. Tirar de la cadena resultaba en la entrega de la canica como estímulo discriminativo y reforzador condicionado (ED/Er). Posteriormente se empleó el tono de un Sonalert como ED/Er para controlar el tirar de la cadena. Por último, se moldeó la respuesta de presionar una palanca que resultaba en la aparición del tono como E^D/E^r.

Tabla 1

Sesiones por eslabón

Nota: el símbolo de interrogación (?) significa que se desconoce el estímulo que controla el presionar la palanca.

Extinción de la cadena. Una vez que la cadena conductual ocurrió confiablemente con una frecuencia relativamente alta, se suspendió la entrega de reforzamiento primario durante 10 sesiones.

Reforzamiento independiente. Cuando la cadena dejó de ocurrir, se volvió a entregar reforzamiento primario sin referencia a la conducta, una vez cada minuto aproximadamente. Si la cadena conductual reaparecía, la entrega de reforzamiento primario se posponía durante un minuto. Esta fase estuvo en efecto durante siete sesiones.

Suspensión del reforzamiento primario independiente. Durante las siguientes cinco sesiones no se entregó reforzamiento primario.

Recondicionamiento de la cadena conductual. Para finalizar el experimento, durante cinco sesiones se volvió a entregar reforzamiento primario cada vez que ocurría la cadena completa.

Resultados y discusión

Dado que se usó un procedimiento de operante libre en lugar del más común de ensayos discretos, la frecuencia de emisión de las cadenas se convirtió en una genuina variable dependiente. El primer panel de la Figura 2 muestra que durante las últimas cinco sesiones de la fase de formación de la cadena se emitieron alrededor de 100 cadenas en cada sesión de 45 min. A pesar de la irregularidad con la que se condujeron las sesiones, los eslabones de la cadena se moldearon con fluidez utilizando inicialmente reforzamiento primario y posteriormente los diferentes ED/Er. Aunque existen pocos estudios sobre cadenas heterogéneas, en su mayoría han empleado reforzadores positivos (como comida o agua). Sin embargo es interesante señalar que también se ha empleado reforzamiento negativo (e.g., escape de un choque eléctrico; Arnold, 1947a, 1947b, 1948) y administración de drogas (e.g., cocaína; Olmstead, Lafond, Everitt, & Dickinson, 2001, citado en Thrailkill & Bouton, 2015).

Número de cadenas completas en función de sesiones consecutivas divididas por las
condiciones del experimento: Cadenas reforzadas, Extinción, Reforzamiento independiente, Extinción y
Cadenas reforzadas.

Figura 2
Número de cadenas completas en función de sesiones consecutivas divididas por las condiciones del experimento: Cadenas reforzadas, Extinción, Reforzamiento independiente, Extinción y Cadenas reforzadas.

En relación a los diferentes procedimientos que se probaron después de edificar la cadena es importante mencionar que cada procedimiento sirvió como línea-base para evaluar los efectos del procedimiento siguiente. El segundo panel de la Figura 2 muestra la extinción de la cadena conductual. Dado que las cadenas conductuales están compuestas por R´s sucesivas que gradualmente se alejan en tiempo del ER , es concebible que cada respuesta haya sido reforzada con una diferente demora y por lo tanto disminuya mas rápida o lentamente que las otras (cf. Keller & Schoelfeld 1950, pp. 208). En contraste, en el caso de nuestra cadena no se observó la desintegración de la cadena en sus componentes sino simplemente ocurrió de manera completa cada vez menos frecuentemente hasta no ocurrir en lo absoluto durante las últimas cuatro sesiones del procedimiento. Esta observación sugiere que la cadena completa se extinguió como una respuesta unitaria ante la falta de reforzamiento primario. D'Andrea, (1969); Thrailkill y Bouton (2015) y Contrucci Kuhn, Lerman, Vorndran, y Addison (2006) reportaron esencialmente el mismo efecto al suspender la entrega de comida como reforzador primario al final de cada cadena de dos eslabones. El que la extinción disminuya gradualmente la frecuencia de la cadena completa de tres componentes apoya la idea que la cadena se comporta como una nueva unidad conductual.

El tercer panel de la misma figura muestra el efecto de entregar reforzamiento primario independiente de la conducta. En la situación experimental mas común se emplea un intervalo entre ensayos para separar las cadenas sucesivas (e.g., Michael, 2000). Sin embargo en el caso de nuestra cadena no se usó un intervalo entre ensayos sino que se permitió su ocurrencia tan pronto se completó la cadena anterior, a la manera de una operante libre Dado que la cadena iniciaba en ausencia de un estímulo exteroceptivo ostensible, es concebible que la entrega de ER al completar la cadena anterior controlara el inicio de una nueva cadena. En el caso de nuestra cadena la entrega de reforzamiento primario cada minuto resultó en la reaparición transitoria de la cadena completa hasta un máximo de 12 veces en una sesión. Este resultado sugiere que el reforzamiento primario, como cualquier otro estímulo, adquirió múltiples funciones entre la que se encuentra la función como estímulo discriminativo para la controlar la ocurrencia de la cadena completa (cf. Reid, 1958). En algunos contextos la recurrencia de una respuesta previamente extinguida tras la entrega de reforzamiento primario independiente se conoce como “restablecimiento de la respuesta” (e.g, Lattal & Wacker, 2015). Mientras que la recurrencia de una respuesta simple con reforzamiento primario independiente se ha demostrado en múltiples estudios, la demostración de la recurrencia de una cadena heterogénea completa carece de antecedentes en la literatura.

El cuarto panel de la Figura 2 muestra que suspender el reforzamiento primario independiente de la conducta resultó en la desaparición de la cadena y por lo tanto confirma el control discriminativo del reforzamiento primario sobre el inicio de la cadena completa.

El quinto panel de la Figura 2 muestra que tras entregar un par de reforzadores primarios independientes la cadena completa ocurrió nuevamente y que al ser reforzada, aumentó rápidamente su frecuencia, hasta llegar a un nivel estable de alrededor de 100 cadenas por sesión, semejante a la fase final del moldeamiento de la cadena (ver Panel 1 de la Figura 2).

En conjunto, los datos obtenidos después del moldeamiento de la cadena sugieren que la cadena completa se comportó durante extinción como una respuesta unitaria definida por la contingencia de reforzamiento. También muestran que el inicio de una nueva cadena estuvo controlado por la función discriminativa del reforzador precedente y que este fenómeno es semejante al “restablecimiento” de respuestas simples. Por último, el rápido recondicionamiento de la cadena con una frecuencia semejante a la inicial muestra que las 21 sesiones con otros procedimientos no tuvo ningún efecto disruptivo sobre la integridad de la cadena.

Referencias

Arnold, W. J. (1947a). Simple reaction chains and their integration. I. Homogeneous chaining with terminal reinforcement. Journal of comparative and physiological psychology, 40(5), 349-363. doi:10.1037/h0060641

Arnold, W. J. (1947b). Simple reaction chains and their integration. II. Heterogeneous chaining with terminal reinforcement. Journal of comparative and physiological psychology, 40(6), 427-440. doi:10.1037/h0063002

Arnold, W. J. (1948). Simple reaction chains and their integration. III. Heterogeneous chaining with serial reinforcement. Journal of comparative and physiological psychology, 41(1), 1-10. doi:10.1037/h0063058

Balleine, B. W., Garner, C., Gonzalez, F., & Dickinson, A. (1995). Motivational control of heterogeneous instrumental chains. Journal of Experimental Psychology: Animal Behavior Processes, 21(3), 203-217. doi10.1037/0097-7403.21.3.203

Corbit, L. H., & Balleine, B. W. (2003). Instrumental and Pavlovian incentive processes have dissociable effects on components of a heterogeneous instrumental chain. Journal of Experimental Psychology: Animal Behavior Processes, 29(2), 99-106. doi:10.1037/0097-7403.29.2.99

Contrucci, S.A., Lerman, D., Vorndran, C.M., &Addison, A. (2006). Analysis of Factors That Affect Responding in a Two-Response Chain in Children with Developmental Disabilities Journal of Applied Behavior Analysis, 39(3): 263–280.doi: 10.1901/jaba.2006.118-05

D'Andrea, T. (1969). Extinction of a heterogeneous chain after several reinforcement schedules . Journal of the Experimental Analysis Behavior. 12(1): 127–135. doi: 10.1901/jeab.1969.12-127

Keller, F. S., & Schoenfeld, W. N. (1950). Principles of Psychology. New York, E.U.: Appleton Century –Crofts.

Lattal, K. A., & Wacker, D. (2015). Some dimensions of recurrent operant behavior. Revista Mexicana de Análisis de la Conducta, 41, 1-13.

Michael, J. (2000). Implications and Refinements of the Establishing Operation Concept. Journal off Applied Behavior Analysis. 33(4), 401–410. doi:10.1901/jaba.2000.33-401

Pierrel, R., & Sherman, J. G. (1963). Train your pet the Barnabus way. Brown Alumni Monthly. Feb, 8-14.

Reid, L.R. (1958). The Role of the Reinforcer as a Stimulus. British Journal of Psychology. 49 (3), 202–209 doi: 10.1111/j.2044-8295.1958.tb00658.x

Sidman, M. (1960). Tactics of scientific research. New York USA: Basic Books Inc.

Thrailkill, E. A., & Bouton, M. E. (2015). Extinction of Chained Instrumental Behaviors: Effects of Procurement Extinction on Consumption Responding. Journal of Experimental Psychology: Animal Behavior Processes, 41(3), 232-246. doi: 10.1037/xan0000064

Notas

1 Este trabajo está basado en un cartel presentado durante el XXV Congreso Mexicano de Análisis de la Conducta, Xalapa, Ver. Septiembre 9-11, 2015 y que fue distinguido con una Mención Honorífica. Dirigir correspondencia al primer autor (ps_diazdiaz@hotmail.com) o al segundo (cbruner@unam.mx).