Ud6 Psicologia Aprendizaje
Ud6 Psicologia Aprendizaje
Resumen ...................................................................................................................... 24
2
UD 6. Condicionamiento operante (III): control de la conducta
por el estímulo. Aplicaciones terapéuticas
Comenzamos la última unidad de la asignatura, que será también la última que dedicaremos al
estudio del condicionamiento operante.
Como hemos visto en anteriores unidades, podemos abordar multitud de situaciones desde el
paradigma del condicionamiento operante, y, siguiendo el principio de parsimonia, no será
necesario atender a otros constructos o inferencias para explicar la conducta.
Durante esta unidad, intentaremos dar respuestas a cuestiones tales como las siguientes:
3
6.1. Control por el estímulo
Este control por el estímulo es fundamental para la adaptación del organismo al ambiente, ya
que las consecuencias de una misma conducta serán diferentes dependiendo de las señales
del contexto y circunstancias donde se dé. Esta respuesta dependiente de las condiciones
estimulares se ha planteado a nivel empírico como un continuo entre dos polos de capacidades
enfrentadas, pero complementarias: generalización y discriminación.
Recuerda
4
6.1.1. Dos polos: generalización y discriminación
Cuando un estímulo adquiere control sobre la conducta (Skinner, 1953), también las
características que lo configuran pueden ejercer cierto grado de control por sí mismas. De
esta forma, otro estímulo nuevo que comparta características con el estímulo con el que ya
se ha tenido experiencia podrá ejercer cierto control sobre la misma conducta que el estímulo
conocido, pese a que nunca se haya tenido una experiencia de aprendizaje previa con él. Por
el contrario, en otras ocasiones, cuando se presenten dos estímulos con características
similares, ante una pequeña diferencia el organismo dará una respuesta distinta, ya que se
ha aprendido previamente que esa característica diferente implica consecuencias muy
diferentes.
A nivel esencial se puede hablar de control por el estímulo tanto desde un paradigma de
condicionamiento clásico pavloviano como desde el condicionamiento operante. Sin
embargo, a nivel práctico se identifica mucha mayor complejidad en el segundo respecto al
primero. En el condicionamiento clásico, tanto el EI como el EC ejercen de control de la
conducta de las RI y RC, planteándose como respuestas automáticas elicitadas por su
presencia, y siendo estas fáciles de predecir por estas contingencias estimulares. Por otro lado,
en el condicionamiento operante la emisión de una conducta no se dispara de forma
automática solo por un estímulo antecedente y existen diversos factores que pueden afectar a
la probabilidad de emisión (la predicción se vuelve probabilística), y, como mínimo, harán falta
tres elementos: respuesta operante (R), estímulo reforzador o consecuencia (Er) y estímulo
discriminante (Ed), que señala cuándo va a existir esa contingencia R-Er (Tarpy, 2000).
5
3. Tanto generalización como discriminación se pueden producir con todos los estímulos
que ejerzan control sobre la conducta. De forma que, aunque suene paradójico, se
pueden generalizar también estímulos discriminativos, generando que otros
estímulos similares al discriminativo puedan ser interpretados por el organismo como el
mismo, de cara a señalar una contingencia respuesta-consecuencia.
Nota
Puede ocurrir que otros estímulos similares tengan esa misma capacidad de provocar o inhibir
esa misma respuesta. Se dice, entonces, que el condicionamiento al estímulo se ha
generalizado a estos estímulos nuevos (Domjan, 2016).
La generalización de estímulos puede definirse como el proceso mediante el cual los individuos
ejecutan una respuesta aprendida en respuesta a un estímulo nuevo, pero similar, ya sea
EC o Ed, en función de si hablamos de condicionamiento clásico u operante (ver Figura 2).
6
Figura 2. Varios estímulos similares provocan la misma respuesta. Fuente: Domjan,2016 (adaptación).
Viaja
Perteneciente a una campaña europea para la prevención de los abusos sexuales y el maltrato
infantil, la regla de Kiko es sencilla: los niños no deberían permitir que otros niños o adultos
toquen partes de su cuerpo que suelen ir cubiertas por su ropa interior y no deberían tocar a
otros niños y/o adultos en esas zonas.
Ejemplo:
Cuando un niño adquiere confianza para estar con personas que no son sus padres, puede
ocurrir que lo generalice a cualquier adulto que pasa por la calle. Es entonces cuando se
pone en activo la capacidad de discriminación, proceso que veremos a continuación y que
consiste en limitar dicha generalización, ajustando el comportamiento en función de
variaciones estimulares concretas (con el profesor puedo irme, con adultos que no
conozco no puedo, etc.).
7
6.1.3. Discriminación del estímulo
A, B, C…
En una situación prototípica, se presentan dos tipos de estímulos discriminativos (Ed y EΔ,
también designados frecuentemente como Ed+ y Ed−):
• El Ed sirve de señal al individuo sobre el hecho de que al emitir una respuesta operante
recibirá sistemáticamente un determinado reforzador.
• El EΔ indica que, ante su presencia, la emisión de la misma respuesta no irá seguida de
ningún refuerzo, irá seguida de menor refuerzo o, incluso, de castigo.
En relación con los estímulos discriminativos es necesario destacar una serie de cuestiones:
• No son exclusivos, por lo que un mismo estímulo discriminativo puede servir para
modificar la probabilidad de emisión de diferentes respuestas.
• Un estímulo discriminativo solo modifica la probabilidad de las respuestas operantes
si mantiene una relación de contingencia con su consecuencia.
• El estímulo discriminativo no solo se debe interpretar como la presencia de una
consecuencia reforzante o aversiva a la respuesta, sino que indica el nivel de probabilidad
de las consecuencias tras la conducta (incluso de la ausencia de ella).
• Para que se haya condicionado el control discriminativo positivo de Ed necesariamente
han tenido que condicionarse uno o varios EΔ.
• Un estímulo discriminativo puede extinguirse de la misma forma que un EC, cuando la
respuesta operante deja de tener contingencia con la consecuencia.
8
Ejemplo:
En una cámara experimental, una paloma puede picar en dos teclas diferentes. Cuando pica
la tecla verde aparece un grano de pienso, mientras que cuando pica la tecla roja no ocurre
nada (el denominado entrenamiento go-no go).
En la vida cotidiana, si pretendemos hacer un viaje largo sin pasar por ningún peaje, es
posible que tengamos que hacer varias discriminaciones simultáneas de dos carteles
presentados a la vez en la carretera con el nombre de la misma ciudad, uno acompañado
con el símbolo del peaje y otro sin él (ver Figura 3).
Ambos estímulos (Ed y EΔ) se presentan en ensayos diferentes. El individuo debe aprender
que, ante el Ed, la emisión de la conducta será reforzada, mientras que la emisión de la misma
respuesta ante el EΔ no será reforzada.
Ejemplos:
En una cámara experimental, una paloma puede picar una tecla verde que será seguida de
un grano de pienso. En el siguiente ensayo esa misma tecla estará encendida de color
rojo y, si pica sobre ella, no ocurrirá nada.
Por otro lado, una situación prototípica de rabietas en un niño (ver Figura 4), como la que
vimos en la unidad anterior, corresponde a un entrenamiento de discriminación sucesiva.
Ante los padres, la rabieta es reforzada, mientras que en la escuela no tiene
consecuencias positivas, por lo que ha aprendido a emitir esa conducta de forma selectiva.
9
Reforzamiento diferencial
El reforzamiento diferencial consiste en establecer dos sistemas de reforzamiento ante dos
estímulos diferentes, de tal manera que ante un Ed1 se obtiene un Er1 por la emisión de la
respuesta R1 y ante el Ed2 se obtiene el Er2 si emite la respuesta R2 (Pérez-Fernández, 2015).
Ejemplo:
En una cámara experimental, cuando suena un tono (Ed1), si una rata pulsa una palanca
situada a la izquierda (R1), obtiene una bolita de pellet (Er1). Por otra parte, cuando
suena un ruido blanco (Ed2), si pulsa una palanca situada a la derecha (R2), tiene acceso
durante unos segundos a una solución con sacarosa (Er2). La conducta no tendrá ninguna
consecuencia si ante el tono pulsa la tecla derecha o si ante el ruido blanco pulsa la tecla
izquierda.
Discriminación condicional
Aunque, como hemos visto en el estudio experimental de la discriminación, se establecen
situaciones simples donde se disponen los estímulos discriminativos de manera invariante y
unívoca a las relaciones R-Er, en la realidad cotidiana esa función discriminante está
habitualmente determinada por la presencia de otros estímulos.
10
Se establecerá un fenómeno de discriminación condicional cuando en un control del estímulo
operante el rol y función de los estímulos discriminantes (Ed y EΔ) dependa de la presencia
de otro evento estimular, denominado estímulo condicional. Es decir, que un estímulo
determinado señale la activación o no de la secuencia R-Er solo cuando esté presente otro
estímulo adicional que con su presencia señala la validez coyuntural del señalizador. Pero
este estímulo condicional por sí solo no controla ninguna respuesta, sino que modula la
función del estímulo discriminativo, que es el que sí ejerce control sobre la conducta (Froxán,
2020).
Ejemplos:
Esta relación de control estimular puede complejizarse en una cadena de control de más
estímulos que cambien la función del estímulo condicional que, a su vez, cambia la función del
estímulo discriminativo. Estaríamos ante una situación denominada discriminación condicional
de segundo orden, en la cual estos estímulos condicionales de los propios estímulos
condicionales primarios se denominan selectores o informativos.
11
6.2. Factores que afectan al control por el estímulo
Sabías que:
Hay silbatos específicos para perros que emiten un sonido con frecuencia por encima de
los 20 kHz y que solo pueden ser escuchados por ellos.
Para que un estímulo discriminativo funcione como tal, debe ser correctamente percibido. Esto
implica que existe rango de estímulos discriminativos potenciales diferentes dependiendo de las
capacidades perceptivas del individuo. Lo que un organismo es capaz de ver o escuchar depende
de su especie y del ambiente en que evolucionó.
Ejemplos:
Los perros pueden oír sonidos con frecuencias de hasta 50 kHz, mientras que el ser
humano no es capaz de percibir más allá de los 20 kHz. Un sonido de 40 kHz
(tremendamente agudo) no podría funcionar como estímulo en un ser humano, pero sí en
un perro. Por otro lado, la mayoría de las aves (ver Figura 7) son capaces de percibir la luz
ultravioleta, percibiendo estímulos y características invisibles al ojo humano, teniendo
implicaciones en sus conductas de cortejo (diferenciando reflejos en el plumaje) o en sus
habilidades depredadoras a la hora de cazar roedores o insectos (siguiendo rastros
específicos).
12
6.2.2. Saliencia del estímulo
La saliencia de un estímulo hace referencia a cuán destacable es, ya sea en comparación con
el contexto o frente a otro estímulo con el que se presenta conjuntamente. Un estímulo será
más saliente dependiendo de su intensidad, su relevancia biológica, la capacidad sensorial,
etc.
Ejemplos:
Nuestro nombre pronunciado a volumen de conversación por otra persona es mucho más
saliente cuando estamos intentando dormir que en mitad de un concierto (ver Figura
8). Un texto en negro será mucho más saliente sobre un fondo amarillo que sobre un
fondo azul.
Figura 8. Saliencia del estímulo respecto al contexto, no es lo mismo en un concierto que tu dormitorio.
6.2.3. Discriminabilidad
Ejemplo:
13
6.2.4. Facilitación por experiencia previa en discriminación
Más allá de esta norma general, se tiene que matizar una serie de efectos específicos relacionados
con las experiencias previas (Pérez-Fernández, 2015):
• La experiencia previa respecto a estímulos de una misma dimensión (por ejemplo, colores-
colores) facilitará más el aprendizaje de discriminación respecto a esa misma dimensión,
es decir, intradimensionales, que con respecto a estímulos de otra dimensión (por
ejemplo, colores-sonidos), es decir, interdimensionales.
• El sobreaprendizaje en la inversión implica que el entrenamiento en una tarea de
discriminación que plantea determinadas funciones de Ed y EΔ facilita también el
aprendizaje futuro de unas funciones inversas de esos mismos estímulos (lo que antes
era Ed ahora es EΔ, y viceversa), aprendiendo esa discriminación más rápido en
comparación con quien no había tenido esa experiencia previa.
Ejemplo:
A la entrada de la sala de reuniones de una oficina hay dos interruptores de la luz, uno de
ellos, el de la izquierda, lleva muchos años sin funcionar (EΔ), y, en cambio, el de la
derecha es el que enciende las luces de la sala (Ed).
Figura 10. El aprender rápidamente la nueva disposición de interruptores (cambio en función Ed y EΔ) se debe al
efecto de sobreaprendizaje de la inversión.
14
6.2.5. El tipo de entrenamiento discriminativo
Respecto a las situaciones prototípicas de entrenamiento discriminativo simple presentadas
anteriormente, se puede establecer una eficacia diferencial entre sus diferentes
disposiciones, implicando mayor o menor velocidad de aprendizaje:
• La adquisición del aprendizaje es más lenta en los procedimientos sucesivos que en los
simultáneos.
• Si se usan consecuencias diferenciales (refuerzos distintos) para cada combinación de
estímulo discriminativo y respuesta se mejora el aprendizaje de la discriminación.
• El intervalo temporal de los ensayos en la adquisición del aprendizaje también tiene un
efecto beneficioso, reduciendo su eficacia si no se dejan unos segundos entre ensayo
y ensayo.
• Disponer el entrenamiento de forma que se minimicen las respuestas erróneas de EΔ,
reduciendo el número de errores y las reacciones emocionales vinculadas al castigo o
extinción del EΔ, centrarse en la correcta emisión de respuesta ante Ed, parece
favorecer la adquisición de una discriminación más precisa y fiable.
Recuerda
15
Ejemplo:
Desvanecimiento
Ejemplo:
Figura 11. Claves que se deberán retirar en algún punto del aprendizaje de la lectoescritura.
16
6.3.2. Encadenamiento y economía de fichas para adquirir nuevas conductas
Encadenamiento
Se pasa al siguiente eslabón cuando se domina el anterior. Cada conducta específica tiene
una doble función: como estímulo discriminativo para la siguiente conducta específica y como
estímulo reforzador de la anterior (Froxán, 2020).
Ejemplo:
Figura 12. Aprender ducharse de forma autónoma es secuencia conductual compleja que se puede descomponer
en conductas más sencillas y reforzarse por separado.
Economía de fichas
17
Ejemplo:
Podría abordarse el tiempo que se dedica a hacer los deberes de manera adecuada con
una economía de fichas como la reflejada en la Figura 13. Cada vez que se hace de la
manera oportuna, se gana una estrella y, si se tienen cinco estrellas al final de la
semana, consigue ver la película que elija en el fin de semana.
Ejemplo:
18
Reforzamiento diferencial de otras conductas (RDO)
Ejemplo:
En un RDO, una niña podría obtener un reforzador apetitivo consensuado (por ejemplo,
una piruleta) si, durante un cierto tiempo (una hora de clase), no presenta conductas
disruptivas (hablar, pegar al compañero, jugar…).
Nota
Una conducta es incompatible con otra cuando ambas no pueden ejecutarse al mismo
tiempo o una de ellas interfiere en la otra.
Consiste en reforzar una conducta que sea incompatible con la conducta no deseada. El
resultado es el incremento en la tasa de respuestas de la conducta incompatible, a la vez que
se produce por necesidad una reducción de la conducta no deseada.
19
Ejemplo:
En un RDI, a un niño que pide las cosas gritando se le podría reforzar su conducta cuando
las pidiese con voz normal. Es imposible que pueda hablar con volumen normal y volumen
alto al mismo tiempo, por lo que el niño reducirá (colateralmente al refuerzo de la otra
conducta) el hábito de gritar para solicitar cosas (ver Figura 15).
Figura 15. No puedes gritar al mismo tiempo que hablar en un tono normal, reforzar conductas incompatibles es
una buena forma de reducir la emisión de las conductas disruptivas.
Ejemplo:
20
Sobrecorrección por práctica positiva
Ejemplo:
A un niño que pega a sus compañeros se le podría poner como tarea que pida disculpas
a los compañeros agredidos y a las personas presentes y que practique repetidamente
una conducta socialmente aceptable adecuada a la situación.
Coste de respuesta
El coste de respuesta consiste en la pérdida de un reforzador apetitivo por haber emitido una
respuesta.
Ejemplo:
Tras un comportamiento inadecuado, un niño se queda sin ver la televisión o sin poder jugar
a la consola de videojuegos (ver Figura 16).
Figura 16. No poder utilizar la televisión o la consola como coste por haber realizado una conducta, implica un
castigo negativo eficaz para reducir esa conducta.
21
Tiempo fuera
Recuerda
Una variante del coste de respuesta es el tiempo fuera. Al individuo se le retiran todos los
reforzadores positivos durante un periodo de tiempo determinado.
Ejemplo:
Tras un comportamiento inadecuado, un niño ( ver Figura 17) se queda unos minutos
sin sus reforzadores (juguetes, compañeros, atención de la familia, etc.), lo que suele
implicar muchas veces sacar temporalmente al niño fuera del espacia donde se encontraba
(aula, habitación, recreo, etc.).
Extinción
Nota
22
Una manera muy eficaz de reducir la frecuencia de una conducta no deseable es ignorarla
cuando se emite. La conducta se extingue al no recibir ningún reforzador que la mantenga.
Ejemplo:
Ejemplo:
A un fumador se le podría pedir que fume de manera repetida varias horas seguidas,
inhalando cada pocos segundos y con muy poco tiempo de descanso entre cigarrillos.
Además, se le podría pedir que se centrase en los aspectos desagradables que percibe
mientras hace la conducta (ver Figura 18).
Figura 18. El propio mecanismo biológico reforzante de la nicotina es intermitente y se basa más en la regularidad
del consumo que en la intensidad, por eso corto plazo fumar mucho puede llegar a ser aversiva y más si se
focaliza la atención en lo desagradable.
23
Resumen
En el condicionamiento operante hay dos procesos relacionados con los estímulos con una
importante influencia sobre el control de la conducta. Estos procesos se ubican en un continuo
de polos enfrentados:
24
Técnicas de reforzamiento para reducir conductas
Técnicas de castigo
25
Mapa de contenidos
26
Recursos bibliográficos
Bibliografía básica
Bibliografía complementaria
Otros recursos
Pellón, R. (2013). Watson, Skinner y algunas disputas dentro del conductismo. Revista
Colombiana de Psicología, 22(2), 389-399.
https://revistas.unal.edu.co/index.php/psicologia/article/view/41317
Ribes, E., Torres, C., Barrera, A. y Mayoral, A. (1997). Control discriminativo con estímulos
compuestos en programas temporales de reforzamiento. Mexican Journal of Behavior
Analysis, 23 (1), 25-51.
https://revistas.unam.mx/index.php/rmac/article/download/27084/25206
27