Artículos Originales
El efecto del procedimiento de Consecuencias Diferenciales en el aprendizaje de evitación discriminada en humanos
The effect of Differential Outcomes Procedure during discriminated avoidance learning in humans.
El efecto del procedimiento de Consecuencias Diferenciales en el aprendizaje de evitación discriminada en humanos
Revista Argentina de Ciencias del Comportamiento, vol. 11, núm. 1, pp. 16-24, 2019
Universidad Nacional de Córdoba

Recepción: 10 Septiembre 2018
Aprobación: 15 Febrero 2019
Financiamiento
Fuente: Dirección General de Apoyo Para Académicos de la Universidad Nacional Autónoma de México (UNAM)
Nº de contrato: IN304318
Beneficiario: Vila, Javier
Resumen: Cuando se emplean consecuencias únicas, para dos o más respuestas de una discriminación condicional (Procedimiento de Consecuencias Diferenciales; PCD), en tareas apetitivas se observa un mayor aprendizaje. La evitación discriminada impide el establecimiento de relaciones respuesta-reforzador, ya que la respuesta previene la presentación del evento aversivo, por lo que ambos no ocurren juntos. Se presenta un experimento que muestra el efecto del PCD en una tarea de evitación discriminada. Para demostrar los efectos de la relación pavloviana entre el estímulo y el evento aversivo en tareas de evitación, dos grupos de participantes recibieron dos entrenamientos uno con consecuencias diferenciales (CD) y otro con consecuencias comunes (CC). Los resultados mostraron un mayor aprendizaje de evitación del grupo CD, debido al papel de las relaciones pavlovianas en el aprendizaje de evitación. Sugiriendo que diferentes miedos condicionados a estímulos específicos pueden tener propiedades discriminativas propias en la elección de dos respuestas de evitación.
Palabras clave: aprendizaje de evitación, procedimiento de consecuencias diferenciales, evitación discriminada, humanos.
Abstract: Use of unique outcomes for each of two correct responses in a discrimination task (Differential Outcomes Procedure; DOP) in appetitive tasks has been shown to enhance learning. Use of an avoidance task would seem to rule out response-outcome associations because by the nature of an avoidance task, because correct responses and aversive outcomes never co-occur. One experiment shows the DOP effect in a discriminative avoidance task. To demonstrate the effects of the pavlovian relationship between the stimulus and the aversive event in avoidance tasks, two groups of participants were compared, one with differential outcomes (DO) and another with common outcomes (CC). Results showed a greater learning for CD group, due to the role of pavlovian relations in avoidance learning. Results suggest that fear is not a unitary state and that the fears conditioned to different events are discriminable states with stimulus properties that can guide the choices of two avoidance responses.
Keywords: avoidance learning, differential outcomes procedure, discriminated avoidance, humans.
Introducción
El aprendizaje de evitación es definido como el incremento de una respuesta que impide la presentación de un estímulo aversivo, o que reduce su intensidad (Skinner, 1953). Metodológicamente existen dos procedimientos para generar aprendizaje de evitación. En el procedimiento de evitación clásica o discriminada, a un organismo se le presenta un estímulo discriminativo (ED) o señal ante el cual debe emitir una respuesta durante un periodo de tiempo determinado, de no hacerlo se presentará una descarga eléctrica, para posteriormente dar inicio a otro ensayo similar (Hunter, 1935).
En un procedimiento de evitación operante o no discriminada, no se presenta ningún ED que indique que se presentará la descarga. Por lo que ésta se presenta de acuerdo con un periodo de tiempo llamado intervalo choque-choque, posteriormente a éste, se presenta el estímulo aversivo. Pero, si ocurre una respuesta, la presentación de la descarga será pospuesta durante un tiempo determinado denominado intervalo respuesta-choque. Si no se emite ninguna respuesta al terminar este intervalo, se activará de nuevo el intervalo choque-choque (Sidman, 1953).
La investigación de la evitación en animales y humanos ha sido de gran importancia en el estudio del aprendizaje (Bolles, 1972; Overmier & Archer, 1989). Los experimentos con animales han dado las bases para el análisis teórico del aprendizaje de conductas de evitación (Mowrer, 1951). Mientras que, los estudios con humanos han confirmado la validez externa de estos principios, y su posible aplicación a problemas clínicos, como la resistencia a la extinción del miedo condicionado en psicoterapia (Levis, 1981; Turner & Solomon, 1962).
Como la respuesta de evitación impide la aparición del estímulo aversivo, Mowrer (1951) inicialmente propuso la teoría de los dos factores para explicar su adquisición y mantenimiento. Esta aproximación teórica supone que, inicialmente ocurre un condicionamiento pavloviano entre la señal y el estímulo aversivo provocando una respuesta condicionada (RC) de miedo. Así al ocurrir la respuesta de evitación, ésta permite escapar del miedo al terminar con la señal y la respuesta de evitación es reforzada negativamente. Recientemente esta teoría ha sido criticada y desplazada por teorías cognitivas que han intentado explicar el aprendizaje de evitación a partir de constructos hipotéticos más complejos (Lovibond, 2006). Sin embargo, la idea de la participación del condicionamiento pavloviano e instrumental se ha conservado en estas teorías. Actualmente el origen del mantenimiento de la conducta de evitación es considerado a partir de múltiples factores. En primera instancia la no ocurrencia del evento aversivo, en segundo lugar la reducción del miedo condicionado debida a la terminación de la señal, y finalmente la ocurrencia de estímulos posteriores a la respuesta de evitación que pueden tener propiedades de señal de seguridad, y por último un hábito estímulo-respuesta que hace que la señal provoque la respuesta (Krypotos, Effting, Kindt, & Beckers, 2015; LeDoux, Moscarello, Sears, & Campese, 2017; Wang, Lee, O’Doherty, Seymour, & Yoshida, 2018).
Por su parte, Trapold y Overmier (1972), han propuesto que las relaciones pavlovianas presentes en un paradigma de discriminación instrumental dan al estímulo la función de provocar una anticipación o expectativa del reforzador, la cual a su vez tiene propiedades discriminativas. Para confirmar esta idea, estos autores proponen dos procedimientos para entrenar discriminaciones condicionales. Uno de ellos, conocido en la literatura como Procedimiento de Consecuencias Diferenciales (PCD), el cual está basado en una tarea de elección con dos cadenas de respuesta (E1-R1-C1 y E2-R2-C2) reforzadas por diferentes consecuencias (C1 y C2). Por otro lado, el Procedimiento de Consecuencias Comunes (PCC), refuerza ambas cadenas de respuesta con el mismo reforzador (E1-R1-C1 y E2-R2-C1). Estos autores suponen que la anticipación del reforzador en las relaciones E1-C1 y E2-C2 del PCD tiene propiedades discriminativas, por lo que, la adquisición del aprendizaje en este procedimiento sería más rápida y precisa que en el PCC, ya que cada respuesta (R1 y R2) es reforzada por una consecuencia específica con un ED determinado.
Trapold (1970) en un estudio pionero con ratas, empleando una tarea de elección con dos palancas, confirmó que cuando cada respuesta de discriminación era reforzada con una consecuencia distinta, el aprendizaje ocurrió más rápido. Lo que sugiere que las relaciones pavlovianas que ocurren entre cada ED y el reforzador especifico, en un PCD, pueden tener propiedades discriminativas adicionales.
Este aprendizaje más rápido y en ocasiones con una mayor asíntota, observado como resultado del PCD, ocurre en un gran número de especies, (ver revisión en Goeters, Blakely, & Poling, 1992; Romero & Vila, 2005; Urcuioli, 2005). Como resultado del PCD, en participantes humanos se han observado mejoras de la memoria a corto plazo (López-Crespo & Estévez, 2013) y a largo plazo (Romero, Vila, & Overmier, 2007). Así como mejoras en el aprendizaje de personas con problemas de memoria (Hochhalter & Joseph, 2001; Vila, Cortes-Espinosa, Alvarado, & Overmier, 2010). Dada la generalidad del fenómeno, éste es conocido ampliamente en la literatura como efecto de consecuencias diferenciales.
Sin embargo, casi todos los estudios que han empleado el PCD han sido realizados con tareas apetitivas, en las que los reforzadores han sido distintos tipos de comida, o fichas entre otros. Lo que ha impedido ampliar la explicación del efecto de consecuencias diferenciales, y considerarla no solo como una interacción de las relaciones pavlovianas E1-C1 e instrumentales E1-R1, tal y como lo sugieren Trapold y Overmier (1972). Ya que adicionalmente a esta idea, existe la posibilidad de analizar el efecto en términos, sólo de las relaciones instrumentales E1-R1 y R1-C1. Esta alternativa enfatiza el hecho que en las situaciones apetitivas, la ocurrencia de la R depende del reforzador y no sólo de la presentación del ED (p.ej., Colwill & Rescorla, 1988). Una estrategia para evaluar esta posibilidad ha sido estudiar el efecto de consecuencias diferenciales empleando el aprendizaje de evitación discriminada.
Overmier, Bull y Trapold (1971) entrenaron a perros en una tarea de discriminación, en la que aprendiéron a emitir una respuesta de evitación R1 ante la presencia de un estímulo discriminativo E1, ante la presencia de un segundo estímulo discriminativo E2, a emitir una segunda respuesta de evitación R2. Para un grupo, el estímulo aversivo evitado fue el mismo para ambas respuestas ante cada señal (PCC). Sin embargo, en un segundo grupo el estímulo aversivo fue específico para cada cadena E-R (PCD). En ambos grupos, el estímulo aversivo programado ocurría, sólo si los animales no emitían la respuesta de evitación. Los resultados mostraron un mejor aprendizaje de evitación en el grupo PCD que en el grupo PCC. Esto le permitió a los autores concluir que, las relaciones entre el ED y el estímulo aversivo actúan como señales adicionales capaces de producir un aprendizaje de evitación más rápido en el grupo PCD.
Una tarea de evitación facilita la relación pavloviana entre la señal y el estímulo aversivo, pero previene el desarrollo de relaciones entre la respuesta y el evento aversivo. Ya que, en el procedimiento de evitación discriminada, si se emite la respuesta el estímulo aversivo no se presenta pero cuando el organismo no es capaz de evitarlo, el ED es apareado con el evento aversivo permitiendo una relación pavloviana (E-C). Por lo que el PCD, al emplear un procedimiento de evitación, agrega una fase de discriminación pavloviana que permite un control selectivo de las respuestas de evitación. La demostración del efecto de consecuencias diferenciales en el aprendizaje de evitación lleva a la confirmación de la propuesta teórica de Trapold y Overmier (1972), que enfatiza el papel de las relaciones pavlovianas como señales discriminativas en el aprendizaje instrumental.
Dada la importancia que actualmente tiene la ocurrencia del efecto de consecuencias diferenciales en humanos (Fuentes, Sui, Estévez, & Humphreys, 2016; López-Crespo & Estévez, 2013), el presente experimento es una replicación sistemática (Sidman, 1960), del estudio original de Overmier et al. (1971) variando la especie y adaptando la tarea de evitación discriminada. Los trabajos sobre aprendizaje de evitación con humanos son escasos en la literatura, pero existe un nuevo interés en su estudio (p. ej., De Houwer, Crombez, & Baeyens, 2005; Gillan, Urcelay, & Robbins, 2016; LeDoux et al. 2017; Lovibond, Mitchell, Minard, Brady, & Menzies, 2009; Molet, Leconte, & Rosas, 2006; Wang et al., 2018; Weiner, 1969). Así, el objetivo de este trabajo, fue comparar el aprendizaje de dos grupos de participantes empleando el PCD y el PCC en una tarea virtual de evitación discriminada. Lo que permitió no sólo la observación del efecto de consecuencias diferenciales en humanos en una situación de evitación, sino el estudio de las relaciones pavlovianas que ocurren en el PCD cuando las relaciones respuesta- reforzador están ausentes, tal y como ocurre en un procedimiento de evitación discriminada.
Método
Participantes
Participaron 24 adultos jóvenes, (15 hombres y 9 mujeres) alumnos de la Facultad de Estudios Superiores Iztacala con edades entre 18 y 28 años (M = 21.7; DE = 4.3), sin experiencia previa con la tarea experimental. De varias carreras y grados, dado que estos factores fueron irrelevantes para el estudio. Todos los participantes firmaron un consentimiento informado de acuerdo con los criterios éticos para la investigación con humanos de la Facultad de Estudios Superiores Iztacala (UNAM), coherentes con el Código ético del psicólogo (Sociedad Mexicana de Psicología, 2007). Los principios éticos se presentaron a todos los participantes en la pantalla inicial del experimento, en la cual, los participantes decidían continuar o no con el experimento.
Materiales y Situación experimental
Se utilizaron dos computadoras de escritorio (IBM compatibles) con un monitor de 24 cm, y un mouse óptico cada una. Se emplearon los auriculares (Sony, MDR-EX 15LP in ear), en los cuales se presentaron dos sonidos (40 y 60 Hz) con una intensidad de 90 dB, uno del lado izquierdo y otro del lado derecho. Para la presentación de la tarea experimental, se empleó el programa informático, Super Lab Pro for Windows v 4.08 (Cedrus, Co.). Las respuestas se registraron empleando una caja de respuesta con dos botones activos (Cedrus, Co., RB-540). El experimento se llevó a cabo en cubículos individuales de aproximadamente 2 m2, amueblados con una silla y una mesa. Una vez sentados, la vista de los participantes estaba en línea recta al monitor de una computadora a una distancia aproximada de 60 cm.
Tarea experimental. Se utilizó una tarea virtual de evitación discriminada, en la cual los participantes se colocaban los auriculares y aprendían a evitar un sonido desagradable (40 o 60 Hz, 90 dB), que sonaba del lado izquierdo (CI) o derecho (C2) de los auriculares cuando aparecía un estímulo específico (E1 o E2) para cada sonido. La tarea se dividió en dos fases; una inicial de condicionamiento pavloviano y otra de evitación. Durante la fase pavloviana los participantes recibían 12 exposiciones aleatorias de E1 y E2 (6 veces cada uno) durante 5s, seguidas de un ruido desagradable que fue específico para cada estímulo presentado en el oído izquierdo o derecho. Posteriormente daba inicio la fase de evitación, donde los participantes aprendían a responder en una caja de respuestas para evitar la presentación del sonido aversivo. Inicialmente, en la pantalla se presentaba el estímulo E1 o E2, posteriormente aparecía en el centro de la pantalla una mira de puntería durante 2.5 s, como intervalo entre ensayos (IEE). Para evitar el sonido, los participantes aprendían a presionar un botón de la caja de respuestas (R1 o R2). Si los participantes no presionaban el botón ante E1 o E2 durante 5s el estímulo terminaba y se presentaba el sonido desagradable, en un oído o en ambos dependiendo del grupo. Así, cada ensayo terminaba con la respuesta de evitación o con la presentación del ruido, cada estímulo se presentó aleatoriamente durante 12 ensayos, y al comienzo de cada ensayo daba inicio el IEE. La figura 1 presenta un esquema de la tarea experimental empleada.

Muestra la tarea experimental de evitación discriminada para los grupos CC y CD. Así como, las fases pavloviana e instrumental sucesivas; E1 y E2 representan los patrones visuales y R1 y R2 las respuestas emitidas a la caja. Se muestran también los sonidos de 40 y 60 Hz de 90 dB y si estos eran presentados a la izquierda (C2) o derecha (C1).
Procedimiento
Los participantes fueron asignados aleatoriamente a uno de dos grupos, de doce participantes cada uno (grupos: CD y CC). Al inicio de esta fase cada participante se sentó en la silla del cubículo y aparecían en la pantalla del monitor las instrucciones:
“¡¡¡Te solicitamos que pongas mucha atención a la tarea!!!
¡¡¡Aquí vamos, suerte!!!
Presiona la barra espaciadora para continuar!!!!”
Durante la fase pavloviana, se presentaron tres imágenes distintas (EC1, EC2, EC3) con tres sonidos, 60 Hz sonido lado derecho (C1), 40 Hz sonido lado izquierdo (C2) y un sonido de aves 60 dB (C3; Microsoft Co.), como descanso auditivo de los participantes. En esta fase la caja de respuesta no estaba activa y se presentaron seis ensayos de tipo E1- C1, seis ensayos de E2 - C2 y tres ensayos E3 - C3. Los 15 ensayos se presentaban de forma aleatoria. A manera de IEE, se presentaba una pantalla con una mira circular de puntería de 2 cm de diámetro durante 2.5 s. En cada ensayo, aparecía una de las tres imágenes durante 5 s y posteriormente aparecía uno de los tres sonidos durante 3 s. En esta fase no se registró ninguna respuesta. Durante la fase instrumental, la caja de respuesta estaba activada y los participantes de ambos grupos PC y PD podían evitar los sonidos; 60 Hz-sonido lado derecho (C1), 40 Hz-sonido lado izquierdo (C2). Cuando aparecían en la pantalla los estímulos E1 o E2, los participantes podían evitar los sonidos si respondían en la caja emitiendo R1 o R2 respectivamente, antes de que terminara el estímulo aparecía entonces una pantalla como retroalimentación con la leyenda “LOGRASTE EVITAR EL SONIDO” finalizando así el ensayo. Si no respondían al final del estímulo se presentaba el sonido correspondiente dependiendo de la condición y aparecía una pantalla con la leyenda “NO LOGRASTE EVITAR EL SONIDO” finalizando el ensayo. Al inicio de esta fase aparecían en la pantalla las siguientes instrucciones:
“Tu tarea será evitar que se presente el sonido desagradable.
Para participar en la tarea, tienes que presionar el botón derecho (azul) o izquierdo (amarillo) de la caja de respuestas para evitar el sonido desagradable. ¡¡¡Pero apresúrate a presionar porque de lo contrario no podrás impedirlo!!!
¡¡¡Aquí vamos!!! ¡¡¡Suerte!!!
Presiona la barra espaciadora para continuar!!!”
Cada grupo difería en cuanto a las consecuencias programadas para cada respuesta R1 y R2. Así, los participantes del grupo CD cuando emitían R1 ante E1, terminaba el estímulo y no se presentaba C1, pero si no emitían R1 recibían el sonido de 40 Hz en el oído izquierdo C1, al final del estímulo E1. Cuando emitían R2 ante E2, el estímulo terminaba y no se presentaba C2, pero si no emitían R2 recibían el sonido de 60 Hz en el oído derecho C2, al final del estímulo E2. En el grupo CC cuando los participantes, emitían R1 ante E1 el estímulo terminaba y no se presentaba C1, pero si no emitían R1 recibían el sonido de 60 Hz (C1) en ambos oídos, al final del estímulo E1. Pero, cuando emitían R2 ante E2 el estímulo terminaba y no se presentaba C1, pero si no emitían R2 recibían el sonido de 60 Hz (C1), en ambos oídos al final del estímulo E2. Cuando los ensayos terminaban en ambos grupos se presentaban las pantallas de retroalimentación correspondiente y posteriormente el IEE de 2.5 s. Ambos grupos recibieron 12 ensayos aleatorios de cada estímulo E1 y E2, adicionalmente se presentaron 6 ensayos pavlovianos adicionales de E3-C3 a manera de descanso auditivo. La Tabla 1 presenta el diseño experimental empleado.
Análisis estadísticos
La variable dependiente fue el número de respuestas de evitación emitidas a cada estimulo E1 y E2 durante los ensayos de la fase instrumental (ver Tabla 1). La variable independiente fue el entrenamiento con consecuencias diferenciales donde cada respuesta evitaba un sonido específico C1 y C2. Se realizó un ANOVA mixto (4 bloques de ensayo) x 2 respuestas x 2 grupos, para comparar la adquisición de ambos grupos empleando el paquete estadístico TIBCO Statistica v7 for Windows. La magnitud del efecto se realizó mediante el cálculo de Eta cuadrada (η²).
| Grupo | Fase pavloviana | Fase instrumental | |
| (CD) | E1-C1 (6)E2-C2 (6)E3-C3 (3) | E1-No R1-C1 E1-R1- Æ(12) E2-No R2-C2 E2-R2- Æ (12) E3-C3 (6) | |
| (CC) | E1-C1 (6)E2-C1 (6) E3-C3 (3) | E1-No R1-C1 E1-R1- Æ(12) E2-No R2-C1 E2-R2- Æ (12) E3-C3 (6) |
Resultados
El aprendizaje de evitación ocurre con mayor rapidez en el grupo CD en el cual cada secuencia E-R tiene un sonido específico (C1 y C2), que en el grupo CC donde ambas secuencias comparten el mismo estímulo aversivo. Así, cada respuesta de evitación R1 y R2 ocurre un mayor número de veces en el grupo que recibió un entrenamiento con el PCD. La figura 2 muestra las respuestas de evitación R1 y R2 a cada señal E1 y E2 emitidas en cada grupo. Un ANOVA mixto (4 bloques de ensayo x 2 respuestas x 2 grupos), no mostró diferencias significativas para la interacción principal, ni para el factor grupo ya que ambos grupos aprenden la tarea de evitación. Sin embargo, evidenció diferencias en el aprendizaje de ambos grupos tanto para R1, F (1,22) = 1957.87, p < .05, η = .003, como para R2, F (1,22) = 811.80, p < .05, η = .01. Todos los participantes aprendieron la tarea de evitación emitiendo ambas respuestas para evitar cada sonido. Pero existen diferencias entre los bloques de tres ensayos en ambos grupos durante la adquisición F (1,44) = 756.873, p < .05, η² = .01. La prueba post hoc de Tukey, indicó diferencias entre grupos en los dos primeros bloques de tres ensayos para ambas respuestas, antes de que el aprendizaje de evitación sea asintótico, lo que muestra que R1 y R2 en el grupo CD son mayores.

Se muestran las respuestas correctas de evitación R1 y R2 a cada señal E1 y E2 en cada grupo CD y CC, durante los 12 ensayos de adquisición presentados en bloques de tres ensayos. Ambas respuestas (R1 y R2) son mayores en el grupo CD (p > .05) que las respuestas emitidas en el grupo CC, mostrando un mejor aprendizaje de evitación.
En general, los resultados mostraron que el grupo CD presentó un mayor aprendizaje que el grupo CC en ambas respuestas en los primeros 6 ensayos, confirmando así que, cuando dos cadenas de respuesta (E1-R1-C1 y E2-R2-C2) son reforzadas diferencialmente (C1 y C2) se observa un aprendizaje más rápido y preciso, que cuando ambas son reforzadas con la misma consecuencia (Trapold & Overmier, 1972).
Discusión
Los resultados son coherentes con el efecto de consecuencias diferenciales observado en el aprendizaje de evitación (Overmier et al., 1971), empleando una tarea de evitación discriminada con humanos. En la cuál se observo qué, el aprendizaje de las respuestas de evitación (R1, R2) más rápido en el grupo CD que en el grupo CC, ya que en este grupo cada estimulo (E1, E2) es relacionado con un estímulo aversivo específico (C1, C2). Así mismo, son coherentes con las observaciones iniciales de Trapold (1970) y con otros estudios del PCD con humanos (Romero & Vila, 2005).
Casi todos los estudios que han analizado el PCD han empleado tareas apetitivas, y solo uno de ellos ha sido realizado empleando una situación de evitación (Overmier et al., 1971). Por lo que el experimento realizado en el presente estudio de investigación es de importancia en dos puntos, la demostración del efecto de consecuencias diferenciales en el aprendizaje de evitación con humanos, abriendo la posibilidad de una mejor comprensión de la adquisición de miedo en humanos. Los presentes resultados, al igual que los obtenidos en perros (Overmier et al., 1971), sugieren que el miedo no es un estado motivacional único. Esto se debe a que el temor y la ansiedad condicionados a eventos aversivos distintos, pueden ser diferentes y tener propiedades de estímulo propias que guíen a dos respuestas de evitación. Así, un estímulo apareado a un evento aversivo particular puede producir un mayor aprendizaje de evitación, al permitir diferenciar entre dos eventos aversivos.
Un punto adicional a considerar es la importancia teórica del PCD, debido a que un procedimiento de evitación discriminada permite estudiar la relación pavloviana entre los EDs de la imágen (E1 y E2) con cada sonido aversivo (C1 y C2), y la relación instrumental entre ambas respuestas (R1 y R2) con la no ocurrencia del sonido. La diferencia en la adquisición de las respuestas de evitación en los grupos CD y CC observada es debida al empleo de una discriminación pavloviana en la que cada EC señala una consecuencia aversiva específica validando los supuestos de Trapold y Overmier (1972) sobre el papel de las relaciones pavlovianas en el condicionamiento instrumental al tener propiedades discriminativas adicionales cuando se aparean a consecuencias específicas. Excluyendo en este caso, aquellas explicaciones del efecto de consecuencias diferenciales basadas únicamente en relaciones instrumentales R-C. Debido a que, en la tarea de evitación empleada, no existe posibilidad de que se haya establecido alguna relación instrumental entre las respuestas y el sonido, por lo que la única mediación posible es la de las relaciones pavlovianas entre el estímulo y el sonido.
La propuesta original de Trapold y Overmier (1972), supone la presencia de una expectativa para cada reforzador que funciona como ED en una tarea de elección con dos cadenas de respuesta (E1-R1-C1 y E2-R2-C2), para explicar el efecto del PCD observado en estudios anteriores (Overmier et al., 1971; Trapold, 1970). En estos estudios dos cadenas de respuestas (E1-R1-C1 y E2-R2-C2) son reforzadas diferencialmente con dos reforzadores, observándose un aprendizaje de ambas respuestas más rápido y preciso que cuando se usa el mismo reforzador para ambas cadenas (E1-R1-C1 y E2-R2-C1). Trapold y Overmier (1972) suponen la presencia de una expectativa específica para cada reforzador, la cual puede funcionar como una señal adicional para cada respuesta cuando se presenta el ED respectivo. Esta expectativa no estaría presente en la condición en la que solo se emplea un único reforzador y por tanto el aprendizaje sería más lento y menos preciso. Por lo que, las relaciones pavlovianas entre cada ED y su reforzador, estarían presentes solo en el PCD al producir la expectativa de la consecuencia. Promoviendo así un mayor aprendizaje.
Aplicando esta idea a los presentes resultados podemos suponer que, en el grupo CD, la expectativa de C1 y C2 ocurriría al presentarse E1 y E2, los cuales a su vez señalarían la ocasión para la emisión de R1 y R2, que a su vez serían reforzadas por la no presentación de E1 y E2, terminando así la expectativa de C1 y C2. Por lo que la expectativa específica de cada consecuencia estaría presente solo en ese grupo y no en el grupo CC, en el cual la expectativa de la consecuencia de R1 y R2 sería la misma.
Un constructo teórico como el de la expectativa del reforzador y sus propiedades discriminativas permite relacionar adecuadamente las variables empíricas presentes en el grupo CD, sugiriendo nuevas hipótesis el respecto (Bouton, 2016). Como las relacionadas con el mantenimiento de la respuesta de evitación de los participantes en la presente situación (LeDoux et al., 2017; Wang et al., 2018). De acuerdo con esta idea, los presentes resultados contribuyen a mejorar el entendimiento de las teorías actuales de la evitación. Ya que, son coherentes empíricamente con el constructo teórico de expectativa del reforzador condicionada de forma pavloviana, propuesto originalmente por Trapold y Overmier (1972), para explicar el condicionamiento instrumental.
A manera de conclusión, los presentes resultados tienen también implicaciones para el aprendizaje de miedos en humanos. El efecto de consecuencias diferenciales en humanos sugiere que, también se forman expectativas estímulo- consecuencia que pueden guiar elecciones basadas en distintos miedos. Tales hallazgos sugieren que, el PCD tiene el potencial de ser utilizado para guiar el desarrollo de nuevas intervenciones con pacientes que padecen conductas, tales como fobias y conductas compulsivas, como lo sugiere Levis (1981). De manera similar a como se ha empleado el PCD con participantes humanos en situaciones apetitivas (López-Crespo & Estévez, 2013; Romero & Vila, 2005). Al no ser este un trabajo clínico, es difícil sugerir con precisión cómo podría ser tal desarrollo. Sin embargo, existen en la literatura algunos buenos intentos en esa dirección (p. ej., Bouton, Mineka, & Barlow, 2001; O'Donohue, & Fisher, 2009).
Agradecimientos
Esta investigación fue realizada con el apoyo del proyecto IN304318 de la Dirección General de Apoyo Para Académicos de la Universidad Nacional Autónoma de México (UNAM) otorgado al primer autor.
Referencias
Bolles, R. C. (1972). The avoidance learning problem. En G. H. Bower & K. W. Spence (Eds.), The psychology of learning and motivation (Vol. 6, pp. 97–145). New York: Academic Press. doi: 10.1016/S0079-7421(08)60385-0
Bouton, M. E. (2016). Learning and behavior: A contemporary synthesis (2.. ed.). Massachusetts: Sinauer Associates.
Bouton, M. E., Mineka, S., & Barlow, D. H. (2001). A modern learning theory perspective on the etiology of panic disorder. Psychological review, 108(1), 4-32. doi: 10.1037/0033-295X.108.1.4
Colwill, R. M., & Rescorla, R. A. (1988). Associations between the discriminative stimulus and the reinforcer in instrumental learning. Journal of Experimental Psychology: Animal Behavior Processes, 14(2), 155-164. doi: 10.1037/0097-7403.14.2.155
De Houwer, J., Crombez, G., & Baeyens, F.(2005). Avoidance behavior can function as a negative occasion setter. Journal of Experimental Psychology 31(1.,101–106. doi: 10.1037/0097-7403.31.1.101
Fuentes, L. J., Sui, J., Estévez, A. F., & Humphreys, G. W. (2016). The differential outcomes procedure can overcome self-bias in perceptual matching. Psychonomic bulletin & review, 23(2), 451-458. doi: 10.3758/s13423-015-0895-3
Gillan, C. M., Urcelay, G. P., & Robbins, T. W. (2016). An associative account of avoidance. En R. A. Murphy, & R. C. Honey (Eds.), The Wiley Handbook on the Cognitive Neuroscience of Learning (pp. 442–468.. Chichester: John Wiley & Sons
Goeters, S., Blakely, E., & Poling, A. (1992). The differential outcomes effect. The Psychological Record, 42(3), 389-411. doi: 10.1007/BF03399609
Hochhalter, A. K., & Joseph, B. (2001). Differential outcomes training facilitates memory in people with Korsakoff and Prader-Willi syndromes. Integrative Physiological and Behavioral Science, 36(3), 196-204. doi: 10.1007/BF02734093
Hunter, W. S. (1935). Conditioning and extinction in the rat. British Journal of Psychology, 26(2), 135-148. doi: 10.1111/j.2044-8295.1935.tb00781.x
Krypotos, A. M., Effting, M., Kindt, M., & Beckers, T. (2015). Avoidance learning: a review of theoretical models and recent developments. Frontiers in Behavioral Neuroscience, 9, 1-16. doi: 10.3389/fnbeh.2015.00189
LeDoux, J. E., Moscarello, J., Sears, R., & Campese, V. (2017). The birth, death and resurrection of avoidance: a reconceptualization of a troubled paradigm. Molecular psychiatry, 22(1), 24-36. doi: 10.1038/mp.2016.166
Levis, D. J. (1981). Extrapolation of two-factor learning theory of infrahuman avoidance behavior to psychopathology. Neuroscience & Biobehavioral Reviews, .(3), 355-370. doi: 10.1016/0149-7634(81)90030-0
López-Crespo, G., & Estévez, A. F. (2013). Working memory improvement by the differential outcomes procedure. En S. H. Clair-Thompson (Ed.), Working memory: Developmental differences, component processes, and improvement mechanisms (pp. 145–157). New York: Nova Publishers
Lovibond, P. F. (2006). Fear and avoidance: an integrated expectancy model. En M. G. Craske, D. Hermans, & D. Vansteenwegen (Eds.), Fear and Learning: From Basic Processes to Clinical Implications (pp. 117–132). Washington, DC: American Psychological Association.
Lovibond, P. F., Mitchell, C. J., Minard, E., Brady, A., & Menzies, R. G. (2009). Safety behaviours preserve threat beliefs: protection from extinction of human fear conditioning by an avoidance response. Behaviourresearch and therapy, 47(8), 716-720. doi: 10.1016/j.brat.2009.04.013
Molet, M., Leconte, C., & Rosas, J. M. (2006). Acquisition, extinction and temporal discrimination in human conditioned avoidance. Behaviouralprocesses, 73(2), 199-208. doi: 10.1016/j.beproc.2006.05.009
Mowrer, O. H. (1951). Two-factor learning theory: summary and comment. Psychological review, 58(5), 350-354. doi: 10.1037/h0058956
O'Donohue, W. T., & Fisher, J. E. (2009). General Principles and Empirically Supported Techniques of Cognitive Behavior Therapy. New York: Wiley.
Overmier, J., & Archer, T. (1989). Historical perspectives on the study of aversively motivated behavior: History and new look. En T. Archer & L. Nilsson (Eds.), Aversion, avoidance, and anxiety: Perspectives on aversively motivated behavior (pp. 3-39). Hillsdale, NJ: Lawrence.
Overmier, J. B., Bull, J. A., & Trapold, M. A. (1971). Discriminative cue properties of different fears and their role in response selection in dogs. Journal of Comparative and Physiological Psychology, 76(3), 478-482. doi: 10.1037/h0031403
Romero, M., & Vila, J. (2005). El procedimiento de consecuencias diferenciales y la recuperación de información en humanos. Revista Colombiana de Psicología, 14(1), 119-136.
Romero, M., Vila, J., & Overmier, B. (2007). Análisis de dos variables en la recuperación de información con humanos adultos jóvenes. Revista Colombiana de Psicología, 16(1), 31-48.
Sidman, M. (1953). Avoidance conditioning with brief shock and no exteroceptive warning signal. Science, 118 (3058), 157-158. doi: 10.1126/science.118.3058.157
Sidman, M. (1960). Tactics of scientific research: Evaluating experimental data in psychology (Vol. 5). New York, NY: Basic Books.
Skinner, B. F. (1953). Science and human behavior. New York: Macmillan.
Sociedad Mexicana de Psicología (2007). Código ético del psicólogo (4..ed.). México: Trillas.
Trapold, M. A. (1970). Are expectancies based upon different positive reinforcing events discriminably different? Learning and Motivation, 1(2), 129-140. doi: 10.1016/0023-9690(70)90079-2
Trapold, M. A., & Overmier, J. B. (1972). The second learning process in instrumental learning. En A. H. Black & W. F. Prokasy (Eds.), Classical Conditioning II: Current Research and Theory (pp. 427–452). New York: Appleton-Century-Crofts
Turner, L. H., & Solomon, R. L. (1962). Human traumatic avoidance learning: Theory and experiments on the operant-respondent distinction and failures to learn. Psychological Monographs: General and Applied, 76(40), 1-32. doi: 10.1037/h0093915
Urcuioli, P. J. (2005). Behavioral and associative effects of differential outcomes in discrimination learning. Animal Learning & Behavior, 33(1), 1-21. doi: 10.3758/BF03196047
Vila, J., Cortes-Espinosa, S., Alvarado, A., & Overmier, B. (2010). Aprendizaje de adultos mayores con deterioro cognitivo asociado a la edad mediante consecuencias diferenciales. Journal of Behavior, Health & Social Issues, 2(2), 47-56. doi: 10.5460/jbhsi.v2.2.26790
Wang, O., Lee, S. W., O’Doherty, J., Seymour, B., & Yoshida, W. (2018). Model-based and model-free pain avoidance learning. Brain and Neuroscience Advances, 2,1-18. doi: 10.1177/2398212818772964
Weiner, H. (1969). Conditioning history and the control of human avoidance and escape responding. Journal of the Experimental Analysis of Behavior, 12(6), 1039-1043. doi: 10.1901/jeab.1969.12-1039
Notas de autor
javila@campus.iztacala.unam.mx
Información adicional
Citar este artículo como: Vila, J., Domínguez-Martínez, J. y Rojas-Iturria, F. (2019). El efecto del procedimiento de Consecuencias Diferenciales en el aprendizaje de evitación discriminada en humanos. Revista Argentina de Ciencias del Comportamiento, 11(1), 16-24
Enlace alternativo
https://revistas.unc.edu.ar/index.php/racc/article/view/21256/pdf (pdf)