Artículos de Investigación
Recepción: 13 Abril 2020
Aprobación: 18 Noviembre 2020
DOI: https://doi.org/10.5514/rmac.v47.i1.79750
Financiamiento
Fuente: CONACYT
Nº de contrato: 180619
Beneficiario: Mario Serrano
Financiamiento
Fuente: CONACYT
Nº de contrato: 131896
Beneficiario: Felipe Díaz
Resumen: El presente experimento exploró el efecto de consecuencias diferenciales “biológicamente neutras”. Dos grupos de ratas se expusieron a un procedimiento de discriminación condicional de dos opciones. Las respuestas a una de dos palancas disponibles en presencia de un estímulo visual y las respuestas a la otra palanca en presencia de un segundo estímulo visual se reforzaron con pelletas de comida. Para un grupo, un estímulo auditivo se correlacionó consistentemente con la entrega del reforzador por las respuestas en una palanca pero no en la otra. Para el otro grupo, el estímulo auditivo se presentó o no con el reforzamiento después de cualquier respuesta correcta, aleatoriamente. El porcentaje global de respuestas correctas fue similar entre los grupos, pero las ratas expuestas a la condición correlacionada mostraron un sesgo por la palanca que produjo sólo comida. Junto con otros experimentos previos, estos resultados cuestionan el efecto de consecuencias diferenciales utilizando diferencias biológicamente neutras o no.
Palabras clave: discriminación condicional, estímulos visuales, consecuencias diferenciales, comida, ratas.
Abstract: The present experiment explored the differential outcomes effect using “biologically neutral outcomes”. Two groups of rats were exposed to a two-choice conditional discrimination procedure. Responses to one of two available levers in the presence of one visual stimulus and responses to the other lever in the presence of a second visual stimulus were reinforced with food pellets. For one group, an auditory stimulus was consistently correlated with reinforcer delivery for responses in one lever but not the other. For the other group, the auditory stimulus was or wasn’t presented with reinforcement after either correct response, randomly. Global percentage of correct responses was similar between groups, but rats exposed to the correlated condition showed a bias for the lever that produced food only. Along with previous experiments, the present results question the differential outcomes effect using either biologically neutral or biologically non-neutral outcomes.
Keywords: conditional discrimination, visual stimuli, differential outcomes, food, rats.
Introducción
En un procedimiento de discriminación condicional de dos opciones, cada ensayo consiste en la presentación aleatoria de uno de dos estímulos exteroceptivos (e.g., E1 o E2) y, simultánea o sucesivamente, dos operandos (R1 y R2) concurrentemente disponibles. Las respuestas en R1 y R2 se refuerzan en presencia (o después) de E1 y E2, respectivamente, mientras que las combinaciones inversas entre estímulos y respuestas (i.e., E1 -R2 y E2-R1) no producen consecuencias (Flores et al. 2019). Utilizando este procedimiento, Trapold (1970) observó que reforzar la combinación E1 -R1 con agua azucarada y la combinación E2-R2 con comida (y viceversa), produjo un mayor porcentaje de respuestas correctas en comparación con reforzar ambas combinaciones sólo con comida o sólo con agua azucarada. Este efecto de consecuencias diferenciales (ECD) se ha replicado en numerosos estudios utilizando diferentes procedimientos de discriminación condicional y diversas diferencias cuantitativas y cualitativas entre las consecuencias, en diferentes especies animales incluyendo a los seres humanos, en cuyo caso dicho procedimiento ha mostrado ser efectivo incluso para incidir en la solución de problemas prácticos (Goeters et al. 1992; Mateos & Flores, 2016; Urcuioli, 2005).
A diferencia de lo reportado por Trapold (1970), más recientemente Serrano y Blanco (2016) encontraron que correlacionar diferencialmente agua y comida con los estímulos de un procedimiento de discriminación condicional de dos opciones, no solamente no favoreció la velocidad de adquisición de la discriminación condicional respecto de ratas que recibieron el agua y la comida de manera aleatoria por responder correctamente, sino además que la correlación produjo un mayor porcentaje de respuestas correctas en los ensayos reforzados con comida en comparación con los ensayos reforzados con agua. Sobre la base de estos resultados, los autores concluyeron que cuando se utilizan consecuencias diferenciales correlacionadas con los estímulos de un procedimiento de discriminación condicional de dos opciones, los animales aprenden dos discriminaciones simples independientes, mientras que bajo la condición de consecuencias diferenciales no correlacionadas (i.e., aleatorias) evoluciona una discriminación condicional propiamente dicha, es decir, una adecuación de la actividad de las ratas a las variaciones momento a momento en la funcionalidad de los estímulos y opciones de respuesta presentados.
El sesgo por una de las opciones de respuesta de un procedimiento de discriminación condicional de dos opciones, ya había sido reportado en dos estudios previos por Carlson y Wielkiewicz (1972; 1976) utilizando, respectivamente, diferentes demoras (5 s vs 0 s) y magnitudes (5 pelletas vs 1 pelleta de alimento) de reforzamiento. Además del ECD, en el primer estudio se reportó que las ratas expuestas a la condición de consecuencias diferenciales respondieron principalmente en la palanca que producía reforzamiento inmediato en prácticamente la primera mitad del experimento, mientras que en el segundo estudio se observó que las ratas respondieron mayoritariamente en la palanca correlacionada con la magnitud de reforzamiento más alta en las primeras nueve sesiones experimentales. En este sentido, los resultados de ambos reportes concuerdan con el planteamiento de Serrano y Blanco (2016) de que bajo procedimientos de discriminación condicional de dos opciones con consecuencias diferenciales, las ratas aprenden dos discriminaciones simples independientes, es decir, al principio responden únicamente a alguno de los estímulos del procedimiento y, sólo posteriormente, al estímulo alternativo.
El planteamiento anterior supone que la correlación diferencial entre los estímulos exteroceptivos y las consecuencias es la responsable del sesgo por una de las opciones de respuesta, al que a su vez podrían atribuirse las diferencias en la velocidad de adquisición de una discriminación condicional entre una condición con consecuencias diferenciales y una de consecuencias comunes o diferenciales no correlacionadas con E1 y E2. Tanto en el experimento de Serrano y Blanco (2016) como en los de Carlson y Wielkiewicz (1972; 1976), sin embargo, el sesgo por una opción de respuesta pudo deberse simplemente a la “preferencia” de las ratas por un reforzador respecto del otro. Se sabe, por ejemplo, que las ratas responden más persistentemente por alimento que por agua en programas de reforzamiento concurrente (e.g., McSweeney et al. 1996), así como que bajo tales procedimientos la frecuencia de respuesta en una de las opciones disminuye con los incrementos en la demora para la entrega del alimento (e.g., Chung, 1965), pero aumenta con los incrementos en la magnitud de reforzamiento (e.g., Catania, 1963).
Una posibilidad para aislar los efectos de la cualidad de los estímulos reforzantes o de los parámetros de reforzamiento en la adquisición de discriminaciones condicionales con consecuencias diferenciales, consiste en presentar un mismo estímulo reforzante que se distingue entre los tipos de ensayo mediante la agregación de una señal exteroceptiva. Utilizando ratas y procedimientos de discriminación condicional de dos opciones, Friedman y Carlson (1973) y Fedorchak y Bolles (1986) reportaron que presentar una luz junto con la entrega del reforzador en un tipo de ensayo particular, fue suficiente para producir el ECD. Utilizando palomas y procedimientos de igualación de la muestra demorada, estudios más recientes igualmente reportaron un ECD al distinguir la entrega de alimento entre los ensayos mediante diferentes estímulos exteroceptivos (Kelly & Grant, 2001; Miller et al. 2009). En este contexto, el presente experimento evaluó los efectos de diferenciar mediante un tono la entrega del reforzador en uno de los tipos de ensayo de un procedimiento de discriminación condicional de dos opciones, sobre los porcentajes globales y locales de respuestas correctas en ratas.
Método
Sujetos
Se utilizaron seis ratas de la cepa Wistar, experimentalmente ingenuas y aproximadamente de tres meses de edad al inicio del experimento. Las ratas se sometieron a un régimen de privación de alimento para mantenerlas al 80% (±10 gr) de su peso en alimentación libre. De considerarse necesario, las ratas recibieron alimento suplementario después de cada sesión experimental. El agua estuvo disponible a lo largo del experimento en jaulas hogar individuales, las cuales se ubicaron en una colonia con temperatura controlada y un ciclo luzoscuridad 12:12. Las ratas se manejaron con el mayor apego a lo especificado en la norma oficial mexicana para el manejo de animales NOM-062-ZOO-1999.
Aparatos
Se utilizaron tres cámaras de condicionamiento operante para ratas (ENV-008) manufacturadas por Med Associaties Inc.. Las paredes anteriores y posteriores eran de aluminio y las paredes laterales eran de acrílico transparente. A 2 cm del piso de rejilla, en el centro de la pared anterior de cada cámara, se colocó un receptáculo de comida (ENV202M-S) que se conectó a un dispensador de alimento de 45 mg (ENV-203M-45). El dispensador de alimento liberó una pelleta de comida (Bioserv Diet.) en cada activación. A los lados derecho e izquierdo de cada receptáculo de comida, 2 cm arriba del piso de rejilla, se colocó un receptáculo de comida (ENV-200R2M) provisto con un detector de entradas de cabeza (ENV-254-CB), los cuales sirvieron únicamente como dispositivos de respuesta y no se conectaron a dispensador de alimento alguno. Un módulo de estímulo triple (ENV-222M) provisto con leds de color rojo, amarillo y verde se colocó arriba de cada uno de los receptáculos laterales. A 18 cm del piso de rejilla se colocaron dos sonalerts que podían emitir, respectivamente, un tono de 2,900 Hz (ENV-223AM) y otro de 4,500 Hz (ENV-233HAM) por activación. El sonalert de 2,900 Hz se colocó en la esquina superior izquierda de la pared anterior y el otro en la esquina superior derecha. Las cámaras de condicionamiento se ubicaron dentro de cubículos de aislamiento acústico (ENV-022MD-27), cada uno provisto con un ventilador que proveyó ruido blanco constante y facilitó la circulación del aire. Para la programación y registro de los eventos experimentales se utilizó una computadora de escritorio (HP Compac Pro 6305), equipada con una interfaz (SG-6510DA) y el software Med-PC® IV.
Procedimiento
Los animales se dividieron en dos grupos de tres ratas cada uno. Las ratas etiquetadas como R1, R2 y R3 conformaron el Grupo Consecuencias Diferenciales (CD) y las ratas etiquetadas como R4, R5 y R6 conformaron el Grupo Consecuencias No Diferenciales (CND). Posteriormente, sin entrenamiento al comedero ni a los receptáculos laterales, todas las ratas fueron expuestas directamente a un programa definido temporalmente (Schoenfeld & Cole, 1972) en el que los primeros 30 s correspondieron al subciclo t. y los 30 s restantes al subciclo t.. En todos los casos, las dos luces rojas (E1) o las dos luces verdes (E2) arriba de los receptáculos laterales se agregaron al subciclo t. en forma aleatoria, sin restricción ni reemplazo. El E1 señaló que cuatro respuestas de asomarse al receptáculo ubicado a la izquierda serían reforzadas con una pelleta de comida, mientras que el E2 señaló que cuatro respuestas de asomarse al receptáculo de la derecha serían reforzadas también con comida. En ambos casos, la satisfacción del requisito de respuesta también canceló la presentación de E1 o E2.
Además de la cancelación de las señales agregadas al subciclo t., cuatro respuestas de asomarse al receptáculo de la izquierda en presencia de E2 y cuatro respuestas de asomarse al receptáculo de la derecha en presencia de E1 se consideraron respuestas incorrectas, mientras que no asomarse a algún receptáculo en presencia de uno u otro estímulo o no completar el requisito de respuestas para la presentación del reforzador se consideraron ciclos sin respuesta. En éstos, E1 y E2 estuvieron presentes a lo largo de todo el subciclo t.. Durante el subciclo t. las respuestas de asomarse a los receptáculos laterales no tuvieron consecuencias programadas y no se presentó señal alguna.
Para las ratas del Grupo CD, las respuestas correctas en los ciclos en los que se agregó E1 al subciclo t. produjeron, además de la pelleta de comida, la presentación de un tono de 4,500 Hz durante 3 s. Las respuestas correctas en los ciclos en los que se agregó E2 produjeron únicamente la entrega del alimento. Para las ratas del Grupo CND, en los ciclos en los que se agregó E1 o E2 al subciclo t., las respuestas correctas produjeron la pelleta de comida con o sin tono de 4,500 Hz, de forma aleatoria. El experimento estuvo vigente durante 20 sesiones conformadas por 30 ciclos T, conducidas de lunes a sábado entre las 15:00 y las 17:00 hrs.
Resultados
La Figura 1 muestra el porcentaje global de respuestas correctas a lo largo del experimento para cada rata. En la figura se observa que el porcentaje global de respuestas correctas incrementó desde niveles cercanos o iguales a cero hasta valores cercanos o iguales a 90% para las ratas R1 y R2 del Grupo CD y las ratas R4 y R5 del Grupo CND. Para la rata R3 del Grupo CD y la rata R6 del Grupo CND, la ejecución alcanzó valores de 72% y 67% de respuestas correctas, respectivamente.

Nota. Cada punto representa el porcentaje de respuestas correctas basado en el total de ciclos E1 y E2 presentados.
La Figura 2 muestra los porcentajes locales (i.e., en los ciclos en los que se agregó E1 y en los ciclos en los que se agregó E2) de respuestas correctas (paneles superiores), respuestas incorrectas (paneles centrales) y ciclos sin respuesta (paneles inferiores), promedio de las 20 sesiones experimentales para cada rata. En todos los casos, la base para calcular los porcentajes fue el número de veces que cada tipo de ciclo se presentó en cada sesión experimental.

Nota. Los paneles superiores muestran las respuestas correctas, los paneles centrales las respuestas incorrectas y los paneles inferiores los ciclos sin respuesta. Cada barra representa el promedio de las 20 sesiones experimentales.
En lo que a los porcentajes de respuestas correctas se refiere, en los paneles superiores de la Figura 2 se observa un menor porcentaje de respuestas correctas en los ciclos en los que se agregó E1 que en los ciclos en los que se agregó E2 para las ratas del Grupo CD. Específicamente, para las ratas R1, R2 y R3 se observaron, en promedio, porcentajes locales de respuestas correctas de 36% y 71%, 30% y 91% y de 22% y 67% en los ciclos en los que se agregaron E1 y E2, respectivamente. Para las ratas del Grupo CND, el promedio de los porcentajes locales de respuestas correctas en los ciclos en los que se agregaron E1 y E2 fue, respectivamente, de 63% y 48% para R4, de 34% y 57% para R5 y de 52% y 47% para R6.
En el caso de los porcentajes de respuestas incorrectas, en los paneles centrales de la Figura 2 se observa que el porcentaje local de errores fue mayor en los ciclos en los que se agregó E1 que en los ciclos en los que se agregó E2 para las tres ratas del Grupo CD. Para las ratas del Grupo CND, se observa un mayor porcentaje de respuestas incorrectas en los ciclos en los que se agregó E2 para la rata R4 y en los ciclos en los que se agregó E1 para la rata R5. Para la rata R6, se observa que la diferencia entre los porcentajes locales de respuestas incorrectas fue menor que para las otras dos ratas de este grupo, así como que las respuestas incorrectas se concentraron en los ciclos en los que se agregó E2.
En el caso de los ciclos sin respuesta, en general, en los paneles inferiores de la Figura 2 se observa que con excepción de las ratas R1 y R5, para las que se registró un mayor porcentaje de ciclos sin respuesta en los ciclos en los que se agregó E1, para el resto de las ratas de ambos grupos se observan prácticamente los mismos porcentajes locales de ciclos sin respuesta en ambos tipos de ciclo.
La Figura 3 muestra el promedio grupal de los porcentajes de respuestas correctas (RC), respuestas incorrectas (RI) y ciclos sin respuesta (CSR) en los ciclos en los que se agregó E1 (izquierda) y los ciclos en los que se agregó E2 (derecha) a lo largo del experimento. En la primera mitad del experimento, en la figura se observa que para el Grupo CD los porcentajes de respuestas incorrectas y respuestas correctas en los ciclos en los que se agregó E1 y E2, respectivamente, alcanzaron valores similarmente altos y prácticamente el mismo patrón a lo largo de las sesiones. Adicionalmente, se observa que en los ciclos en los que se agregó E1 el porcentaje de respuestas correctas fue cercano a cero e incrementó progresivamente hasta niveles cercanos al 80% en la segunda mitad del experimento. En ésta, se observa que los porcentajes de respuestas incorrectas disminuyeron progresivamente en los ciclos en los que se agregó E1, mientras que en los ciclos en los que se agregó E2 los porcentajes de respuestas incorrectas incrementaron ligeramente. En general, excepto por algunas sesiones intermedias en los ciclos en los que se agregó E1, en la figura se observa que para el Grupo CD los porcentajes de ciclos sin respuesta siguieron una tendencia decreciente y se mantuvieron cercanos a cero a lo largo del experimento, independientemente del estímulo agregado al subciclo t..

Nota. La línea negra muestra respuestas correctas (RC), los círculos respuestas incorrectas (RI) y los cuadrados los ciclos sin respuesta. (CSR).
Para el Grupo CND, en la figura 3 se observan incrementos progresivos en los porcentajes de respuestas correctas a lo largo del experimento, tanto en los ciclos en los que se agregó E1 como en los que se agregó E2. En ambos casos, se observa que durante la primera mitad del experimento el porcentaje de respuestas incorrectas fue comparable al porcentaje de respuestas correctas, así como que durante la segunda mitad del experimento los porcentajes de respuestas incorrectas siguieron una tendencia decreciente en ambos tipos de ciclo. En la figura también se observa que independientemente del estímulo agregado al subciclo t., los porcentajes de ciclos sin respuesta para el Grupo CND siguieron una tendencia decreciente en las primeras sesiones del experimento, manteniéndose cercanos a cero en la mayoría de las sesiones experimentales.
Discusión
El presente experimento evaluó los efectos de diferenciar mediante la presentación de un estímulo auditivo la entrega del reforzador en uno de los tipos de ciclo de un procedimiento de discriminación condicional de dos opciones, sobre los porcentajes globales y locales de respuestas correctas, así como sobre los porcentajes locales de respuestas incorrectas y de ciclos sin respuesta. Al igual que en el reporte de Serrano y Blanco (2016) utilizando agua y comida como consecuencias, los resultados del presente experimento no mostraron una mayor velocidad de adquisición de la discriminación condicional por la implementación de consecuencias diferenciales, pero sí un mayor porcentaje de respuestas correctas en uno de los tipos de ciclo; específicamente, aquel en el que las respuestas correctas produjeron sólo la entrega de comida. Bajo la condición de consecuencias diferenciales no correlacionadas con los estímulos exteroceptivos, las ratas también mostraron un mayor porcentaje de respuestas correctas en un tipo de ciclo que en otro, sin embargo, para este grupo de ratas los porcentajes locales de respuestas correctas no difirieron sustancialmente entre los tipos de ciclo y, además, el tipo de ciclo con el porcentaje de respuestas correctas más alto fue diferente entre los animales. Los resultados también revelaron que si bien para ambos grupos de ratas los porcentajes de ciclos sin respuesta fueron bajos en ambos tipos de ciclo, los porcentajes de respuestas incorrectas difirieron entre los tipos de ciclo para las tres ratas del Grupo CD, mientras que para las ratas del Grupo CND dichos porcentajes fueron comparables entre los tipos de ciclo, sugiriendo que estas últimas ratas alternaron entre las opciones de respuesta en mayor medida que las ratas del primer grupo. Dicha alternación puede inferirse por el hecho de que a lo largo de la primera mitad del experimento, los porcentajes promedio de respuestas correctas e incorrectas fueron similares en ambos tipos de ciclo para el Grupo CND pero no para el Grupo CD.
Los resultados del presente experimento muestran que ejecuciones terminales similares pueden derivar de diferentes porcentajes locales de respuestas correctas e incorrectas y, en esa medida, concuerdan con las conclusiones de Serrano y Blanco (2016) en torno al tipo de ejecuciones que tienen lugar bajo procedimientos de discriminación condicional de dos opciones con consecuencias diferenciales correlacionadas con los estímulos exteroceptivos versus consecuencias diferenciales no correlacionadas con tales estímulos. Específicamente, los resultados que aquí se reportan confirman que mientras bajo consecuencias diferenciales correlacionadas las ratas responden inicialmente a uno de los estímulos y sólo después de varias sesiones al estímulo alternativo (e.g., Carlson & Wielkiewicz, 1972; 1976), bajo consecuencias diferenciales no correlacionadas con E1 y E2 las ratas responden desde las primeras sesiones a ambos estímulos en tanto alternan entre las opciones de respuesta disponibles. Sobre el particular, la entrega de una pelleta de alimento en ambos tipos de ciclo en el presente experimento sugiere que el sesgo por una opción de respuesta en este tipo de procedimientos, se debe a la correlación diferencial de los estímulos exteroceptivos y las diferentes consecuencias implementadas y no a las diferencias cualitativas o cuantitativas entre estas últimas. Al respecto, destaca que desafortunadamente el presente experimento no agotó las variables de reforzamiento del experimento de Serrano y Blanco. En este sentido, nuevos estudios deberían indagar si el sesgo por una opción de respuesta particular igualmente se observa al utilizar agua como parte de las consecuencias diferenciales “biológicamente neutras”.
De acuerdo con Trapold (1970), el ECD obedece al desarrollo de expectativas de reforzamiento que se agregan a los estímulos condicionales nominales, incrementando así la diferencia entre ellos y, en esa medida, derivando en una mayor velocidad de adquisición de la discriminación condicional. Aunque originalmente las expectativas de reforzamiento se consideraron como reacciones condicionadas clásicamente (Trapold & Overmier, 1792), Fedorchak y Bolles (1986) las “elevaron” al rango de representaciones puramente cognitivas de las consecuencias al demostrar el ECD reforzando las respuestas correctas de varias ratas con agua versus agua y una luz intermitente en un procedimiento de discriminación condicional de dos opciones. Como se señaló en la sección introductoria, utilizando el mismo tipo de procedimiento, este ECD biológicamente neutras ya había sido reportado previamente por Friedman y Carlson (1973) utilizando ratas y comida versus comida y un luz ámbar, mientras que en estudios más recientes con palomas la entrega del alimento entre los ensayos de igualación de la muestra demorada se diferenció mediante distintos estímulos visuales o un estímulo visual y otro auditivo (Kelly & Grant, 2001; Miller et al. 2009).
Como condiciones de control, en el estudio de Friedman y Carlson (1973) se utilizaron una de consecuencias diferenciales no correlacionadas con los estímulos exteroceptivos (i.e., la luz se presentó con la comida de manera aleatoria tras las respuestas correctas en uno u otro ensayo), así como dos condiciones de consecuencias comunes: encendido y ausencia de la luz ámbar en ambos tipos de ensayos, respectivamente. La velocidad de adquisición de la discriminación condicional fue mayor para las ratas expuestas a la condición de consecuencias diferenciales que para las ratas expuestas a la condición de consecuencias diferenciales no correlacionadas, sin embargo, a diferencia del experimento de Trapold (1970) utilizando comida y agua azucarada como reforzadores, la velocidad de adquisición no difirió entre las ratas expuestas a la condición de consecuencias diferenciales y las ratas expuestas a cualquiera de las dos condiciones de consecuencias comunes. En el estudio de Miller et al. (2009), si bien se observó un ECD al introducir intervalos de demora entre los estímulos del procedimiento de igualación de la muestra utilizado, la velocidad de adquisición de la discriminación condicional no difirió entre sus grupos de palomas ni al utilizar diferentes estímulos visuales (Experimento 1) ni al utilizar un estímulo visual y otro auditivo (Experimento 2) como diferenciadores de las consecuencias.
Dado que en el presente experimento no se observaron diferencias en los porcentajes globales de respuestas correctas entre los grupos CD y CND, los resultados aquí reportados concuerdan con los recién descritos de los experimentos en los que también se utilizaron consecuencias diferenciales biológicamente neutras y no se observó el ECD en la velocidad de adquisición de la discriminación condicional. De hecho, en virtud de las diferencias entre los porcentajes locales de respuestas correctas observado para las tres ratas del Grupo CD, puede decirse que las consecuencias diferenciales afectaron negativamente – en lugar de favorecer– la adquisición de la discriminación condicional. En este sentido, los resultados del presente experimento igualmente concuerdan con los observados por Ramos y Savage (2003), quienes utilizando ratas, un procedimiento de “igualación de posición” –en el que los operandos R1 y R2 se utilizan, uno a la vez, también como E1 o E2– y comida versus agua azucarada como consecuencias, reportaron que durante la fase de entrenamiento de la discriminación condicional, el grupo de ratas expuesto a consecuencias diferenciales no correlacionadas mostró un mayor porcentaje de respuestas correctas que el grupo expuesto a consecuencias diferenciales correlacionadas.
Aunque el ECD se observó al introducir intervalos de demora entre la terminación de E1 o E2 y la presentación de R1 y R2, sobre el estudio de Ramos y Savage (2003) destaca que “los animales entrenados con el PCD [procedimiento de consecuencias diferenciales] persistieron más en su responder sesgado” (p. 26). Desafortunadamente, el sesgo por una u otra opción de respuesta al que se refirieron sólo se analizó en la primera sesión de la fase de entrenamiento. En otro experimento con las mismas características que el anterior, en el que adicionalmente se utilizaron dos grupos de ratas jóvenes y dos grupos de ratas envejecidas, tampoco se observaron diferencias en la velocidad de adquisición de la discriminación condicional entre los cuatro grupos de ratas y, adicionalmente, se observó que “los animales entrenados con el PCD tendieron a desarrollar un sesgo de respuesta hacia el muestra asociado con el reforzador “preferido” (pelleta de comida). La mayoría de los errores se hicieron en la palanca asociada con la pelleta de comida (72%) en los grupos PCD, mientras que los errores se distribuyeron uniformemente entre las palancas en los grupos NOP” (Savage et al. 1999, p.322).
Nuevos estudios deberán indagar si bajo procedimientos de discriminación condicional de dos opciones y consecuencias diferenciales biológicamente neutras, el ECD también “emerge” al introducir intervalos de demora entre las señales condicionales y la oportunidad para responder, incluso si en la fase de entrenamiento dicho tipo de consecuencias diferenciales no favorece o afecta negativamente la velocidad de adquisición de la discriminación condicional. En este contexto, no debe dejar de señalarse que en línea con la lógica de los programas definidos temporalmente (Schoenfeld & Cole, 1972), tanto en el reporte de Serrano y Blanco (2016) como en el presente experimento las opciones de respuesta estuvieron disponibles a lo largo de toda la sesión experimental, mientras que en la mayoría de los estudios anteriores utilizando ratas y procedimientos de discriminación condicional de dos opciones (Carlson & Wielkiewicz; 1972; 1976; Friedman & Carlson, 1973; Trapold, 1970), la primera respuesta sobre alguna de las palancas disponibles produjo el retiro de la palanca alternativa y, adicionalmente, ambos dispositivos de respuesta se retrajeron durante el intervalo entre ensayos.
Lo anterior es importante no sólo porque los estudios venideros antes sugeridos difícilmente podrían utilizar dispositivos de respuesta como los receptáculos de alimento del presente experimento, sino adicionalmente porque en virtud de las diferencias procedurales antes señaladas, probablemente su carácter “libre” (Ferster, 1953) sea responsable de la ausencia del ECD en éste y el experimento de Serrano y Blanco (2016). En este sentido, además de la introducción de intervalos de demora, sería conveniente que estudios próximos abordaran el asunto de la disponibilidad temporal de los dispositivos de respuesta a lo largo de la sesión experimental, así como el correspondiente a la “topografía” de la respuesta requerida para la producción de los reforzadores (i.e., asomarse versus apretar una palanca). En cualquier caso, todavía quedarían por determinar las razones por las que la generalidad del ECD puede cuestionarse al utilizar el procedimiento de igualación de posición, así como consecuencias diferencias biológicamente neutras. Al menos en este segundo caso, el único argumento viable en este momento es que a diferencia de los experimentos de Friedman y Carlson (1973) y de Miller et al. (2009), en los estudios de Fedorchak y Bolles (1986) y de Kelly y Grant (2001) se condujeron ensayos de corrección; una condición no implementada en el presente estudio.
En lo que se refiere a los errores observados en el presente experimento, por un lado, la presencia (ratas R1, R2 y R3) y ausencia (R4, R5 y R6) de diferencias entre los porcentajes de respuestas incorrectas en cada tipo de ciclo, sugiere, como se señaló más arriba, que las ratas del Grupo CD alternaron entre las opciones de respuesta en menor medida que las ratas del Grupo CND. Dado que en el presente experimento no se llevó a cabo ningún entrenamiento preliminar, nuevos estudios deberán determinar si un entrenamiento previo en alternación entre las opciones de respuesta podría eliminar el sesgo que se establece por alguna de ellas al utilizar consecuencias diferenciales, biológicamente neutras o no. Por el otro lado, los resultados sobre las respuestas incorrectas abren la posibilidad de que el estímulo auditivo presentado concurrentemente con el alimento, poseyera propiedades aversivas. Aunque este planteamiento estaría ignorando la ejecución observada para las ratas del Grupo CND, así como el hecho de que tonos similares han sido utilizados como estímulos condicionales en otros estudios sobre discriminación condicional en ratas (e.g., Serrano et al., 2018), nuevos experimentos deberían atender a dicha posibilidad.
Agradecimientos
Los autores desean agradecer los comentarios de los revisores anónimos, cuyas sugerencias enriquecieron notablemente el manuscrito original.
Referencias
Catania, A. C. (1963). Concurrent performances: A baseline for the study of reinforcement magnitude. Journal of the Experimental Analysis of Behavior, 6(2), 299-300. https://doi.org/10.1901/jeab.1963.6-299
Carlson, J. G., & Wielkiewicz, R. M. (1972). Delay of reinforcement in instrumental discrimination learning of rats. Journal of Comparative & Physiological Psychology, 81(2), 365-370. https://doi.org/10.1037/h0033531
Carlson, J. G., & Wielkiewicz, R. M. (1976). Mediators of the effects of magnitude of reinforcement. Learning & Motivation, 7(2), 184-196. https://doi.org/10.1016/0023-9690(76)90027-8
Chung S. H. (1965). Effects of delayed reinforcement in a concurrent situation. Journal of the Experimental Analysis of Behavior, 8(6), 439-444. https://doi.org/10.1901/jeab.1965.8-439
DIARIO OFICIAL DE LA FEDERACIÓN (2001). Norma Oficial Mexicana– NOM–062–ZOO–1999. Especificaciones técnicas para la producción, cuidado y uso de los animales de laboratorio. 22 de Agosto de 2001.
Fedorchak, P. M., & Bolles, R. C. (1986). Differential outcome effect using a biologically neutral outcome difference. Journal of Experimental Psychology: Animal Behavior Processes, 12(2), 125-130. https://doi.org/10.1037/0097-7403.12.2.125
Ferster, C. B. (1953). The use of the free operant in the analysis of behavior. Psychological Bulletin, 50(4), 263-274. https://doi.org/10.1037/h0055514
Flores, C., Hernández, M., & Madrigal, M. (2019). Parámetros de estímulo que regulan el comportamiento en programas definidos temporalmente. En M. Serrano (Ed.), Programas de estímulo: Las contribuciones mexicanas (pp. 117-146). Ediciones de la Noche.
Friedman, G. J., & Carlson, J. G. (1973). Effects of a stimulus correlated with positive reinforcement upon discrimination learning. Journal of Experimental Psychology, 97(3), 281-286. DOI: https://doi.org/10.1037/h0034123
Goeters, S., Blakely, E., & Poling, A. (1992). The differential outcomes effect. The Psychological Record, 42, 389-411. DOI: https://doi.org/10.1007/BF03399609
Kelly, R., & Grant, D. S. (2001). A differential outcomes effect using biologically neutral outcomes in delayed matching-to-sample with pigeons. The Quarterly Journal of Experimental Psychology, 54B(1), 69-79. DOI: https://www.tandfonline.com/doi/abs/10.1080/713932744
Mateos-Morfín L. R., & Flores-Aguirre, C. J. (2016). El efecto de consecuencias diferenciales: Un caso de investigación traslacional. Universitas Psychologica, 15(2), 51-60. DOI: https://doi.org/10.11144/Javeriana.upsy15-2.ecdc
McSweeney, F. K., Swindell, S., & Weatherly, J. N. (1996). Withinsession changes in responding during concurrent schedules with different reinforcers in the components. Journal of the Experimental Analysis of Behavior, 66(3), 369-390. DOI: https://doi.org/10.1901/jeab.1996.66-369
Miller, H. C., Friedrich, A. M., Narkavic, R. J., & Zentall, T. R. (2009). A differential-outcomes effect using hedonically nondifferential outcomes with delayed matching to sample by pigeons. Learning and Behavior, 37(2), 161-166. DOI: https://doi.org/10.3758/LB.37.2.161
Ramos, R., & Savage, L. M. (2003). The differential outcomes procedure can interfere or enhance operant rule learning. Integrative Physiological & Behavioral Science, 38(1), 17-35. DOI: https://doi.org/10.1007/BF02734258
Savage, L. M., Pitkin, S. R., & Careri, J. M. (1999). Memory enhancement in aged rats: The differential outcomes effect. Developmental Psychology, 35(4), 318-327.
Schoenfeld, W. N., & Cole, B. K. (1972). Stimulus schedules: The t-τ systems. Harper & Row.
Serrano, M., & Blanco, S. (2016). Reporte breve: Desempeño en discriminación condicional en función del agua, comida y dimensión física de las señales. Revista Mexicana de Análisis de la Conducta, 42(3), 249-259. DOI: https://doi.org/10.5514/rmac.v42.i3.58840
Serrano, M., Sosa, R., Flores, C., & Torres, C. (2018). Discriminación condicional de dos opciones utilizando programas definidos temporalmente. Avances en Psicología Latinoamericana, 36(3), 527536. DOI: https://doi.org/10.12804/revistas.urosario.edu.co/apl/a.4618
Trapold, M. A. (1970). Are expectancies based upon different positive reinforcing events discriminably different? Learning & Motivation, 1(2), 129-140. DOI: https://doi.org/10.1016/0023-9690(70)90079-2
Trapold, M. A., & Overmier, J. B. (1972). The second learning process in instrumental learning. En A. H. Black & W. F. Prokasy (Eds.), Classical conditioning II: Current research and theory (pp. 427-452). Appleton-Century-Crofts.
Urcuioli, P. J. (2005). Behavioral and associative effects of differential outcomes in discrimination learning. Learning and Behavior, 33 (1), 1-21. DOI: https://doi.org/10.3758/BF03196047