REFORZAMIENTO
El Reforzamiento es el principio fundamental de la conducta
operante. Describe el procedimiento mediante el cual se incrementa la
frecuencia de una ejecución operante. Es la operación que incrementa
la probabilidad de la respuesta dados un estímulo discriminativo y
otro reforzador y es siempre una relación de contingencia:
ED R ER
Así, podemos decir que cuando el estímulo que sucede a la
ejecución ha incrementado la frecuencia de ésta, decimos que ha
ocurrido el reforzamiento. El término reforzar debe limitarse a la
descripción de la presentación del estímulo reforzante sin incluirse
el cambio posterior en la frecuencia de la conducta.
Podemos definir el reforzamiento, tan sólo, como el efecto
de incremento o mantenimiento sobre la conducta; es el arreglo para la
presentación del evento reforzante o la remoción de un evento aversivo
como consecuencia de un comportamiento, lo cual origina un incremento
o mantenimiento en la conducta.
La gente dice comúnmente, por ejemplo, que la comida de un
perro es una recompensa para una conducta, pero es mejor referirse
técnicamente como reforzamiento. La diferencia principal entre el
término coloquial recompensa y el término técnico reforzamiento reside
en que el primero se usa con gran vaguedad mientras que el segundo es
un término preciso referido al proceso de condicionamiento operante.
Se habla, por ejemplo, de darle a un niño un dulce para recompensarlo
por su buena conducta o de arrojarle un pez a una foca para
recompensarla cuando concluye alguna ejecución muy elaborada.
Técnicamente, el término reforzamiento se referiría al acontecimiento
que tiene lugar inmediatamente después de un acto concreto.
CONDICIONAMIENTO
Se usa este término, por lo general, para denotar un cambio
en la conducta refleja o de la operante a resultas del reforzamiento.
Así, cuando se menciona que una ejecución operante ha sido
condicionada significa que su frecuencia de ocurrencia ha sido
incrementada por reforzamiento. En el condicionamiento operante, se
puede elevar o disminuir la frecuencia de ejecuciones operantes con
procesos de reforzamiento.
NATURALEZA DE LOS REFORZADORES
El reforzador o estímulo reforzante es el acontecimiento que
incrementa la frecuencia de la ejecución a la que sigue de modo
inmediato. Un mismo estímulo puede tener efectos diversos sobre la
conducta. Para elevar la frecuencia de una ejecución hacemos que la
suceda un reforzador, ER (estímulo reforzante en condicionamiento
operante); y el reforzamiento habrá sido efectivo si aumenta la
probabilidad de la respuesta.
Dentro del trabajo de modificación de la conducta, una de las
aspiraciones más importantes es la creación de nuevos reforzadores,
que permitan sustituir a los reforzadores arbitrarios con los que se
inicia el trabajo, estableciendo así los denominados reforzadores
condicionados (o reforzadores aprendidos). Estos (pueden ser objetos
o estímulos) deben preceder a reforzardores incondicionados. Tal
apareamiento debe realizarse el número de veces necesario, que varía
de sujeto a sujeto, objeto a objeto y condición a condición. Se puede
decir que se posee un reforzador condicionado cuando este puede
sustituir al reforzador incondicionado que se utiliza, y que sigue
siendo capaz de mantener la conducta puesto que no disminuye
sensiblemente su frecuencia. Los reforzadores pueden ser
incondicionados (primarios), condicionados (secundarios) y
generalizados o simbólicos:
Reforzadores Primarios:
Son aquellos que no dependen de la historia del sujeto, sino
de las características biológicas; son comunes a todos los sujetos de
la especie y tienen un carácter altamente adaptativo, guardando
relación directa con la supervivencia del sujeto y la especie.
Reforzadores Secundarios:
Al contrario que los Primarios, éstos no tienen relación
directa con la supervivencia y dependen, más bien, de la historia
individual del sujeto.
Reforzadores Generalizados:
Son todos aquellos reforzadores que mientras más son
presentados no reducen su efectividad, sino que, se mantiene. Son
independientes de la intensidad o frecuencia que tienen y tienen una
relación estrecha con la historia individual.
A continuación estudiaremos los dos procedimientos básicos
de reforzamiento: reforzamiento positivo y el reforzamiento negativo.
Ambos tienen la finalidad de incrementar o mantener una conducta
REFORZAMIENTO POSITIVO
Se entiende por reforzamiento positivo al efecto conseguido,
con un procedimiento en particular, que consiste en administrar una
consecuencia tan pronto se emite una conducta determinada. El
reforzamiento positivo se distingue porque produce consistentemente
una aumento en la probabilidad de presentación de la conducta.
En la vida diaria de todo ser humano, el reforzamiento
positivo ocurre a lo largo de ella. Por ejemplo: un niño hace algo que
complace a sus padres, y éstos sonríen y responden con afecto;
entonces el niño repite la acción con mayor frecuencia. Un adulto
realiza un buen trabajo y su superior rinde una felicitación y le
proporciona un aumento de salario; si la persona continúa con su buen
rendimiento, la felicitación y el aumento de salario han sido
reforzadores positivos. Cuando pedimos algo con amabilidad, nuestro
pedido es satisfecho a menudo, y continuaremos, a posterior, con
solicitudes amables.
En cada ejemplo de reforzamiento positivo que se han
descrito, un objeto se presentó o un suceso ocurrió como consecuencia
de una conducta determinada, y la tasa de esa conducta se incrementó o
permaneció alta. Ese objeto o suceso, el estímulo, que viene como
consecuencia de la conducta, se denomina reforzador positivo. Y así
como hay una relación entre la conducta y el suceso de estímulo
consecuente, puede decirse que el reforzador positivo depende de la
conducta
Concluyendo que el procedimiento que mantiene o incrementa
la tasa de una respuesta al presentar contingentemente un estímulo
(reforzador positivo) a continuación de la respuesta es lo que
definimos como reforzamiento positivo.
Reforzador Positivo:
Cuando un estímulo, como un objeto o un evento, sigue a, o
es presentado como una consecuencia de una respuesta, y la tasa de esa
respuesta se incrementa o se mantienen como resultado, el estímulo se
denomina reforzador positivo. La atención, el reconocimiento de éxitos
y esfuerzos, los sucesos especiales y actividades son reforzadores
positivos para mucha gente.
Whaley y Malott (1983)afirman como regla general que todo
objeto o acontecimiento que ha demostrado ser un reforzador positivo
para una respuesta, con toda probabilidad, condicionará también toda
respuesta a la que siga regular e inmediatamente. De tal manera que si
son administrados sin ninguna intención explícita, y de modo puramente
accidental pueden condicionar ciertas conductas; este apareamiento de
reforzadores positivos y conductas, tuvo a bien llamar Skinner
conducta supersticiosa.
Uso efectivo de los procedimientos de reforzamiento positivo:
La investigación sustancial sobre el reforzamiento positivo
ha producido un conjunto de principios muy valiosos, que pueden
aplicarse para incrementar con efectividad las conductas que no
ocurran a una tasa lo suficientemente alta. Se sabe ahora que no
cualquier reforzador será efectivo en todas las situaciones, sino que
el reforzador seleccionado deberá tener propiedades cuya capacidad de
refuerzo se haya demostrado para el individuo concreto bajo
condiciones específicas. Para moldeamiento de conducta, se ha
aprendido la importancia de que el reforzamiento se programe con toda
la frecuencia posible, de preferencia cada vez que ocurre la respuesta
deseada, y que los factores sociales y de situación pueden afectar la
tasa de incremento de esa conducta.
REFORZAMIENTO NEGATIVO
A veces es difícil utilizar reforzamiento positivo para la
adquisición de una nueva conducta, porque debido a multitud de
razones, el sujeto no responde adecuadamente. En estos casos, es
necesario utilizar otra forma de reforzamiento, denominada
reforzamiento negativo. Se denomina reforzamiento negativo al aumento
de la probabilidad de la respuesta como consecuencia de la omisión de
un estímulo (objeto o evento).
A diferencia del reforzamiento positivo, ahora se retira un
objeto o evento que comúnmente antecede a la respuesta que interesa;
como consecuencia de tal exclusión, aumenta la frecuencia de la
respuesta. Sin embargo, no basta la simple ausencia del estímulo para
que la respuesta sea reforzada negativamente, sino que es fundamental
que la respuesta sea el medio a través del cual se retire o excluya
aquel objeto o evento. Es decir, la desaparición contingente del
estímulo debe ser una consecuencia de la conducta.
El reforzamiento negativo es un fenómeno universal. Hay
muchas situaciones de la vida cotidiana en las que se presenta; somos
reforzados cuando escapamos del calor del sol del mediodía, cuando
cerramos una ventana para evitar una corriente de aire, al responder a
un niño para escapar a su llanto, al encender el fuego para eludir el
frío, etc.
Vemos en los ejemplos anteriores que la conducta elimina
contingentemente a un estímulo aversivo (reforzador negativo). En el
reforzamiento negativo se echa mano de estímulos aversivos, de manera
tal que, que cuando el sujeto da la respuesta desaparece el estímulo
aversivo, y dicha respuesta se hace más probable.
Estímulo Aversivo:
Es un estímulo que tiene el efecto de reducir la tasa de una
conducta cuando se presenta como una consecuencia de esa conducta; es
un estímulo que el individuo se esforzará por evitar o eliminar.
Siendo así un objeto o evento desagradable. Cuando es eliminado, da un
incremento a la respuesta que precisamente causó su eliminación o
evitación.
Es difícil determinar estímulos aversivos, por lo general
son los que producen daño o molestia a los sujetos, aunque esto no
siempre ocurre. La manera de determinar si un estímulo es aversivo en
un sujeto es probándolo. Se han observado grandes diferencias a este
respecto, según los diversos sujetos y las distintas conductas y
situaciones; interviene bastante la historia individual de cada
sujeto.
El reforzamiento negativo en comparación con otros procedimientos:
Para usar el reforzamiento negativo, debe estar presente un
estímulo aversivo; entonces será posible reforzar una conducta
mediante la remoción del estímulo aversivo contingente a la emisión de
la conducta.
No obstante, es posible que cuando se empleen estímulos aversivos
ocurran efectos secundarios indeseables como escape, evitación y
agresión, las cuales a menudo destruyen las relaciones sociales de los
sujetos. Aspecto que debe tomarse muy en cuenta en la utilización de
estímulos aversivos.
A pesar de ello, existen casos que pueden justificar el uso
de reforzamiento negativo por encima del positivo, por ejemplo: hay
muchas personas que se negarán a hacer algo, aun cuando el intento
pueda producir ganancias financieras, mayor prestigio o alguna otra
forma de reforzamiento positivo poderoso; un billete de dinero no hará
que un joven se zambulla en agua fría, se pare sobre un par de
patines, monte en motocicleta o se interne en una caverna, pero el
ridículo ante sus amigos, lo que ellos pueden decirle a manera de
insulto o evocando a la cobardía, puede ser lo suficientemente
aversivo para que el sujeto desee eliminarlo y acepte el reto y
termine realizando la conducta negada.
Es importante hacer notar que tanto el reforzamiento
positivo como el negativo aumentan la probabilidad de la respuesta y
lo que los distingue es que, en el positivo, la consecuencia es un
estímulo que se presenta después de la conducta; en cambio, en el
negativo, la consecuencia de la adquisición conductual, es la
desaparición de un estímulo que se presentaba antes de la conducta
terminal.
Hay ocasiones en que son necesarias algunas contingencias
reforzadoras muy fuertes para ayudar a un individuo a vencer una
dificultad, para persuadirlo a que intente algo nuevo o haga un
esfuerzo en continuar su progreso de moldeamiento. En ocasiones, los
reforzadores positivos asequibles no son lo suficiente para motivar a
los individuos a hacer cosas que les resulten muy difíciles, y el
reforzamiento negativo puede que sea la única respuesta.
CONTROL DE ESTÍMULOS
Debido a que los estímulos están presentes cuando una
respuesta es reforzada, adquieren cierto control sobre ella, pues la
propia respuesta se hace más probable cuando tales estímulos están
presentes y menos cuando no lo están. Es decir, que cuando un estímulo
está siempre presente cuando se refuerza una conducta y ausente cuando
no se refuerza, la conducta se emite con mayor probabilidad ante dicho
estímulo que en cualquier otra situación. El sujeto, entonces,
distingue o discrimina el estímulo que acompaña al reforzamiento.
Por ello, se dice que hay control de estímulos cuando el
estímulo antecedente afecta sistemáticamente a la probabilidad de la
respuesta. Así, la forma o frecuencia de la respuesta es diferente
bajo un estímulo, o conjunto de estímulos “controlantes”, que bajo
otro. Estos estímulos controlantes se conocen como estímulos
discriminativos.
El control de estímulos se concentra en los estímulos
antecedentes. Se dice que existe cuando los estímulos antecedentes
específicos influencian la ocurrencia de la respuesta. Estos estímulos
antecedentes contingentes se denominan: estímulos discriminativos
(ED), señalan reforzamiento, y estímulos delta (ED), que señalan no
reforzamiento.
El procedimiento básico de control de estímulo implica tan
sólo la presentación del ED de control. A veces un solo ED controla
una sola respuesta (discriminación). Otra forma del procedimiento es
presentar muchos EDs que son diferentes en algunos aspectos y
similares en otros y que han de controlar una o múltiples respuestas
(generalización).
Estímulo Discriminativo (ED):
Es un estímulo en cuya presencia es posible que una
respuesta dada sea reforzada. Un ED opera para ocasionar una respuesta
particular en el sentido de que señala la posibilidad del
reforzamiento. Un estímulo es discriminativo cuando después de
diversos emparejamientos con estímulos consecuentes, su presentación o
remoción es acompañada de cambios confiables en la tasa de la
respuesta.
Estímulo Delta (ED):
Es un estímulo en cuya presencia no se refuerza una
respuesta dada. Un ED señala la ausencia de refuerzo y funciona para
“inhibir” o “suprimir” la respuesta. Si un estímulo discriminativo
logra que una respuesta sea reforzada, los demás estímulos presentes
son estímulos delta.
Discriminación:
En este proceso, un ED controla una respuesta que es
reforzada, debe existir la aparición de por lo menos un ED . De tal
manera que el sujeto discrimina los ED del ED para producir la
respuesta adecuada.
Así, por ejemplo: las señales dentro de un restaurante sobre el uso de
los servicios sanitarios queda definido, en una gran mayoría, por
señales de formas humanas, las cuales definen cual es de utilidad para
varones y cual para mujeres, dichas señales discriminan una respuesta
de ingresar al recinto específico para el otro sexo. El aprendizaje de
ciertas conductas como las del ejemplo se realizan por discriminación
y nuestra vida esta llena de este tipo de control de estímulo.
Generalización:
Consiste en presentar el reforzamiento de una respuesta,
asociado al mayor número posible de estímulos. Aquí, varios estímulos
discriminativos controlarán una respuesta. Por ejemplo: se ha enseñado
a un niño a decir “buenos días” a su padre, para lograr que esa
conducta se reproduzca con otros adultos, es decir, se generalice ante
la mayor cantidad de estímulos denominados “adultos”, basta con
reforzar sistemáticamente la respuesta “buenos días”, cada vez que se
emita ante cualquier adulto. Este tipo de procedimiento se emplea en
el proceso de socialización, donde aprendemos a emitir determinadas
conductas frente a diferentes miembros de la sociedad o grupos
sociales.
Formación de Conceptos:
Las respuestas que pertenecen a la categoría de muchos y variados
estímulos antecedentes y una respuesta apropiada, se denomina
concepto: rojez, elegancia, honestidad y muchas otras. Un concepto es
en realidad una propiedad crítica abstracta común a cierto número de
estímulos antecedentes. Esta propiedad crítica, técnicamente
denominada abstracción, ejerce el control del estímulo sobre una
respuesta particular. Consídérense las señales de tráfico u otros para
ilustrar esta situación:
A pesar de que cada señal difiere de otra, todas tienen una
propiedad en común: alientan diferentes conductas a seguir.
Considerando las categorías de conducta que la sociedad llama
“inteligente”, “responsable”, “civilizada”, etc. Se puede reconocer el
papel que desempeña el control de estímulo en el desarrollo de esas
conductas complicadas.
La formación de conceptos descansa tanto en la generalización (que se
efectúa dentro de la misma categoría) y en la discriminación (entre
categorías). Ambos, discriminación y generalización, participan de la
formación de conceptos.
FACTORES PARA ACRECENTAR LA EFECTIVIDAD DEL REFORZAMIENTO
La selección de reforzadores apropiados para el control de
conducta es sólo parte del proceso de reforzamiento, si se desea
acrecentar al máximo la efectividad del mismo es necesario considerar
algunos otros factores como la inmediación, cantidad de reforzamiento,
condiciones, programación, probación y exposición del reforzamiento.
Inmediación del Reforzamiento:
Un principio fundamental de la conducta es que el
reforzamiento inmediato es más efectivo que el retrasado (Skinner,
1938). El reforzamiento retrasado no es tan efectivo como el
inmediato, en parte porque le permite al organismo emitir una conducta
adicional entre la respuesta que se desea reforzar y la presentación
misma del reforzador; por tanto, la conducta intermedia también
es reforzada, con el resultado de que lo que es reforzado es la
respuesta seguida de alguna otra conducta, en vez de esa respuesta
sola (Reynolds, 1968).
Cantidad de Reforzamiento:
La decisión sobre que tanto reforzamiento se debe
suministrar depende de varios factores: el tipo de reforzador usado,
las condiciones de privación y el esfuerzo necesario para dar la
respuesta. Se debe tener en cuenta los conceptos de saciedad y
privación, que veremos más adelante.
Condiciones de Situación:
La inmediación, vista anteriormente, facilita la
discriminación. Cuando el reforzamiento se suministra de inmediato,
los individuos pueden identificar con mayor facilidad las conductas
que conducen al reforzamiento y las que no. Otro factor que puede
facilitar la discriminación es la especificación clara de las
condiciones ambientales, o estímulos, bajo las cuales se suministrará
el reforzamiento.
Programación:
La programación del reforzamiento implica la regla que sigue
el medio ambiente para la determinación de cual entre las numerosas
ocurrencias de una respuesta será reforzada. Si a un estudiante se le
nombra cada vez que levanta la mano, el acto de levantar la mano está
en un programa de reforzamiento continuo (en el que se refuerza cada
presentación de una respuesta). Sin embargo, es más probable que a los
estudiantes sólo se les llame de vez en cuando si levantan la mano;
entonces, el levantar la mano está en un programa de reforzamiento
intermitente (en el que se refuerzan algunas, pero no todas las
presentaciones de una respuesta).
Hay muchos programas de reforzamiento diferentes, y cada uno
tienen distintas propiedades o efectos. Diferentes programas pueden
ser ajustados a procedimientos diseñados para moldear, incrementar,
mantener o reducir la conducta.
PROBACIÓN Y EXPOSICIÓN DE REFORZAMIENTO
Hay procedimientos suplementarios para aumentar el poder de un
reforzador. En infinidad de ocasiones disponemos de un número muy
limitado de reforzadores, y por consiguiente debemos obtener el mayor
provecho posible de ellos. Sin embargo, por varias razones, no se
muestran todo lo efectivos que se desearía. Muchas veces basta la
probación y exposición de los reforzadores para elevar de manera
significativa su poder. Claro está que ello no constituye una regla,
pero antes de sustituir las reforzadores disponibles por otro, es
conveniente tratar de incrementar su eficacia a través de tales
procedimientos.
Probación del Reforzamiento:
Este procedimiento se utiliza cuando el sujeto tiene poca
familiaridad con el reforzador que se va a utilizar en especial, o
cuando el reforzador va a ser administrado fuera de su contexto usual.
La probación consiste en hacer que el sujeto se familiarice
directamente con el reforzador en la situación particular en que va a
ser reforzado, entrando en contacto directo con dicho reforzador.
Las personas pueden sentirse muy atemorizadas la primera vez que se
sostienen sobre unos patines, que suben a una montaña rusa o se
presentan frente a un auditorio. Sin embargo, todos conocemos a
personas para quienes estos sucesos han sido reforzadores. No cabe
duda que tales individuos se han adaptado con éxito a las situaciones;
los sucesos ya no son tan amenazadores puesto que ya han tenido
oportunidades de experimentarlos con la suficiente frecuencia.
A veces un individuo no ha experimentado con un objeto o un
evento, y por lo tanto sus propiedades reforzadoras potenciales le son
desconocidas. Ayllon y Arzin (1968) son quienes sugieren la regla del
muestreo (probación) de reforzador: “Antes de usar un estímulo o
suceso como reforzador, se requiere mostrar el reforzador en la
situación en la que habrá de usarse.
Exposición del Reforzamiento:
Se aplica cuando no es posible que el sujeto participe
activamente, como en el caso de la probación, en la familiarización
del reforzador. Entonces, se procede a exponerlo a las condiciones más
parecidas que se pueda a aquellas en las cuales se utiliza el
reforzamiento, e incluye, si es posible, a otra persona que esté
disfrutando del reforzador
PRIVACIÓN
Se refiere a la retención del reforzamiento durante un
espacio de tiempo o la reducción de su asequibilidad, diseñado para
incrementar la efectividad del refuerzo. Por ejemplo: cuando a un
animal se le priva de comida por un período de tiempo, al volver a
presentarse el alimento, este tiene mayor efectividad como reforzador.
Este es el caso empleado con el manejo de palomas y otros animales
para moldeamiento de conducta, entendiendo el nivel de privación de
comida, a la razón del número de horas transcurridas desde que el
animal comió por última vez, aludiendo al porcentaje en peso perdido
en relación con el peso corporal previo.
MOLDEAMIENTO DE CONDUCTAS
El moldeamiento es un procedimiento mediante el cual se
desarrollan las nuevas conductas; el reforzamiento sistemático de
aproximaciones sucesivas hacia el objetivo conductual.
Partiendo de una respuesta inicial, se refuerzan todas las
aproximaciones a la respuesta final, de manera sucesiva. A veces se le
denomina moldeamiento al SIP o a la instrucción individualizada.
Rinicial Rfinal
aproximaciones sucesivas
Aproximaciones Sucesivas:
Se denomina así a los elementos o subconjuntos de la conducta, cada
uno de los cuales se asemeja cada vez más estrechamente al
comportamiento final especificado.
El primer paso consiste en definir de la manera más precisa posible
cuál es la conducta final que se desea obtener, pues sin esta
definición es muy difícil operar con el procedimiento de
aproximaciones sucesivas. Una vez que se ha definido dicha conducta
terminal, se comienza por elegir una conducta más amplia dentro de la
cual esté incluida la que se ha previsto, o que tenga alguna semejanza
formal con ella. Luego de elegir aquella conducta que el sujeto debe
mostrar dentro de su repertorio, se la refuerza consistentemente hasta
que se presente con frecuencia. El paso siguiente consiste en
restringir la amplitud de esa conducta y hacerla cada vez más parecida
a la conducta deseada, mediante el reforzamiento diferencial. El
resultado del procedimiento es una nueva respuesta muy diferente de
aquella a partir de la cual se inició el moldeamiento; respuesta que
se agrega al repertorio funcional del sujeto.
Así, si deseamos que un perro brinque verticalmente, y como los perros
no siempre brincan hacia arriba, es necesario empezar con algunas
características que el perro emita regularmente, como alzar la cabeza,
o cualquier movimiento de despegar las patas del suelo. Dichas
conductas son reforzadas, y luego es posible ir cambiando el
reforzamiento hasta la consecución de la conducta final de saltar
verticalmente; técnica empleada bastante por entrenadores circenses y
caninos.
Reforzamiento Diferencial:
Es el reforzamiento de una respuesta bajo una condición de
estímulo, pero no de otra. Es el proceso de reforzar sólo una
respuesta y dejar de reforzar las demás respuestas de la misma clase,
produciéndose una diferenciación de la respuesta.
Se utiliza el reforzamiento diferencial para moldear e intensificar la
conducta de otros. Consiste en dos operaciones básicas: primero se
refuerza una respuesta dad, emitida en presencia de o bajo la
presentación de uno o más estímulos particulares. Seguidamente, la
misma respuesta no se refuerza (se coloca en extinción) si se emite en
ausencia del estímulo o del grupo de estímulos. Conforme la respuesta
se refuerza repetidas veces en la presencia de esos estímulos
particulares, los estímulos antecedentes comienzan a asumir el
control. Eventualmente, la respuesta tenderá a persistir en la
presencia de los estímulos, aunque ya no se la refuerce cada vez.
Siendo así, el reforzamiento diferencial una forma de obtener control
de estímulos.
El caso de adquisición de habilidades, como en el caso de
los deportes, se produce por reforzamiento diferencial; así un
futbolista empieza dándole a la pelota gran variedad de patadas,
ocasionalmente una de esas respuestas se ve reforzada diferencialmente
por un balón que se dirige hacia la portería, pasado tiempo de
reforzamiento diferencial se va diferenciando un tipo especial de
puntapié, que generalmente recibe reforzamiento positivo, y que
consigue como resultado un gran número de goles. El refuerzo que
desarrolla la habilidad debe ser inmediato; de no ser así, se pierde
la precisión del efecto diferencial. Además si las contingencias
diferenciales cambian, lo hace con ellas la topografía (forma) de la
conducta.
Algunos refuerzadores diferenciales hacen que una respuesta
sea más intensa o fuerte sin alterar de modo apreciable su topografía;
así, cuando debemos llamara a alguien que se encuentra lejos, nuestra
conducta verbal se ve reforzada cuando alcanza un cierto grado de
volumen.
También es propicio indicar que los ambientes donde se
utilizaría con mayor frecuencia la operación de reforzamiento
diferencial son aquellos en los que está presente más de un estímulo.
Por ejemplo, la situación en la que el timbre del teléfono se confunde
con el de la puerta:
E timbre telefónico R hola, en el
teléfono E hola
E timbre en la puerta R hola, en el
teléfono Ninguna respuesta
El levantar el auricular del teléfono cuando suena sólo será
reforzado al oír hablara a alguien. En consecuencia, después de muchos
tanteos de respuestas reforzadas en la presencia del timbre
telefónico, ese timbre se volverá discriminativos para contestar el
teléfono. Con el paso del tiempo, este timbre ocasionará la respuesta,
aun cuando de vez en cuando nadie conteste al “hola”.
MANTENIMIENTO DE CONDUCTAS
El propósito es lograr que una conducta se siga emitiendo
indefinidamente incluso bajo condiciones distintas a las de su
adquisición; es decir, que no se requiera seguir reforzando siempre
cada una y todas las conductas que se presentan. Cuando se considera
la conducta de un organismo teniendo en cuenta la complejidad de su
vida diaria, se precisa estar alerta a los refuerzos que mantienen su
conducta. Esto trata de una posibilidad prácticamente cerrada ya que
es muy difícil mantener un control absoluto sobre el sujeto que
permitiera prolongar el procedimiento original. Con todo se puede
perseguir tal objetivo a través del siguiente procedimiento:
Reforzamiento Intermitente:
Hablamos aquí de un programa de reforzamiento en el que se
refuerzan algunas, pero no todas las respuestas de un sujeto.
Significa que el reforzamiento consiste en presentar el reforzador de
manera discontinua. Gran parte de nuestra conducta es reforzada de
manera intermitente, tal el caso de que no siempre obtenemos
respuesta cuando llamamos por teléfono a un amigo que no siempre está
en casa. La educación en el colegio o universidad refuerza, también,
de manera intermitente, puesto que no es factible controlar todas las
conductas de los alumnos e ir reforzando todas las respuestas. Por
tanto, uno de los hechos por el cual, gran parte de nuestra conducta
es reforzada intermitentemente depende de una serie de hechos que no
son fácilmente predecibles.
Se ha demostrado, mediante pruebas con palomas en
laboratorio, que las conductas reforzadas intermitentemente son
bastante estable y muestran gran resistencia a la extinción, tal el
caso de una paloma que presentó más de 10 000 respuestas en la curva
de extinción. (Skinner); en los seres humanos eso puede observarse en
las conductas de sujetos adictos a los juegos de azar; no siempre se
gana al jugar cartas o tirar los dados, pero el ganar, de vez en
cuando, se presenta como un reforzador intermitente.
Es importante distinguir entre programas que son controlados
por la misma conducta y aquellos que son coordinados por un sistema
que se encuentra fuera del organismo. Consideramos así que el
reforzamiento intermitente puede programarse teniendo en cuenta el
número de respuestas o también el tiempo que transcurre, estos tipos
de reforzamiento intermitente se denominan de razón y de intervalo,
respectivamente. En ambos caso puede aplicarse un criterio fijo o uno
variable.
Programa de Razón:
En este programa, con base en el número de respuestas, el
refuerzo depende de la conducta del mismo organismo. Cuando el
reforzamiento se da cada vez que el sujeto cumple con el criterio o
número de respuestas que se ha establecido de antemano, hablamos
entonces de un programa de razón fija (RF). Este programa produce una
frecuencia muy alta de respuestas, con la condición de que la razón no
sea demasiado alta. En la vida cotidiana este programa se encuentra
bastante en la industria y en las ventas a comisión, aunque no sepan
que lo emplean, y es lo que denominan como “pago por pieza acabada”,
por ejemplo, cuando se le dice a un carpintero que será pagado cada
vez que entregue 10 sillas construidas; entonces la razón fija es de
10 (RF10).
Por otro lado, cuando hablamos de un programa de razón
variable (RV), el reforzamiento se continúa administrando de acuerdo
con el número de respuestas que da el sujeto, pero ahora en vez de
hacerlo en base a un número determinado de respuestas, se eligen
valores que difieren de reforzamiento a reforzamiento; el promedio de
dichos valores dará la razón del programa. Así, si tomamos al mismo
carpintero del anterior ejemplo, el cual será reforzado por el número
de sillas que construya, pero que será reforzado (pagado) con un
programa de razón variable; primero establecemos previamente los
distintos valores de reforzamiento: 1, 3, 4 y 8; lo cual significa que
el primer reforzamiento se dará cuando concluya la primera silla; el
segundo a la cuarta silla construida (3 sillas más); el tercero a la
octava silla (4 sillas más), y el cuarto a la decimosexta silla
fabricada (8 sillas más). El valor del programa de razón variable, se
designa por el promedio de las distintas razones que lo componen: 1,
3, 4 y 8, que en total suman 16 y cuyo promedio es 4; por tanto el
programa es de RV4.
Programa de Intervalo:
Si reforzamos la conducta a intervalos regulares, un
organismo como un ratón o una paloma se ajustará a un grado de
respuesta casi constante, determinado por la frecuencia del refuerzo.
Si le reforzamos cada minuto, el animal responde con rapidez; si lo
hacemos cada cinco minutos, mucho más lentamente. Este efecto es
similar en la conducta humana: el número de veces que llamamos a un
teléfono dependerá, en igualdad de circunstancias, de la frecuencia
con que obtengamos respuesta, es poco probable que nos veamos con
amigos y conocidos con los que raras veces lo pasamos bien, y que
escribamos a alguien que casi nunca contesta.
Por su parte, los programas de intervalo se definen en
función del tiempo, pero se refuerzan en base a la primera respuesta
que se obtiene luego de transcurrido el tiempo previsto; es decir, el
reforzamiento, cualquiera que sea el programa seguido (de razón o de
intervalo) siempre debe ser consecuencia de una respuesta. Al igual
que los programas de razón, los de intervalo pueden regularse de
manera fija o variable. En los programas de intervalo fijo IF, se
establece un valor en segundos o minutos, al término de las cuales se
refuerza la primera respuesta que se emite; así, por ejemplo, en un
IF3 se reforzará la primera respuesta que dé el sujeto luego de
transcurridos tres minutos, no antes. Si el sujeto tarda más de tres
minutos, el reforzamiento se pospondrá hasta el momento en que el
sujeto proporcione la respuesta.
Los programas de intervalo variable IV, se establecen de
manera semejante a los de RV. Elegidos de antemano diversos intervalos
de duración diferente, se refuerza siempre la primera respuesta
obtenida al cumplirse el intervalo respectivo y se designa el programa
en base al promedio de los valores correspondientes a los distintos
intervalos. Así, por ejemplo, podemos aplicar este programa fijando
distintos valores en tiempo: 1’, 4’, 3’ y 2’, o sea que reforzaremos
por primera vez a la respuesta formulada al pasar el minuto 1;
después, a la primera respuesta pasados cuatro minutos y así
sucesivamente. El valor de IV resultará del promedio de los valores,
es decir, IV2.5‘ en este caso. Suele ser muy difícil extinguir una
respuesta después de un refuerzo de este tipo, con relación al de IF.
En consecuencia, ambos programas de intervalo (fijo y
variable) se asemejan en dos cosas:
· El reforzamiento siempre se administra después de la primera
respuesta obtenida al transcurrir el intervalo de criterio.
· El reforzamiento siempre se programa en base al transcurso
del tiempo.
Utilización de los Programas de Intervalo y Razón:
Los programas de razón variable y fija, producen una
frecuencia muy alta de respuestas con relación a sus similares de
intervalo, ello porque controlan mayor cantidad de respuestas que los
otros. Con base en lo anterior es conveniente emplear programas de
razón cuando se desea que un sujeto emita una conducta con mucha
frecuencia. Entre los programas intervalo y razón, los variables
producen mayor ejecución que los de tipo fijo. Sin embargo, su
aplicación se hace difícil por la naturaleza misma de su programación,
pues hay que dedicar excesivo esfuerzo a la administración el
reforzamiento en base a valores cada vez distintos, en número de
respuestas o en tiempo.
Otra ventaja de los programas de razón sobre los de
intervalo, es que producen formas más constantes de respuesta; es
decir, el sujeto tiende a responder siempre a la misma velocidad. En
los programas de IF, siempre hay muy baja respuesta cuando se inicia
el intervalo, dado que al sujeto no le es necesario responder dentro
de él, sino a su finalización para obtener reforzamiento. Por ello,
siempre que haya interés en que un sujeto cumpla con determinada
frecuencia mínima de respuestas, se puede emplear programas de razón.
La limitación que existe radica en que existen ocasiones en que es
difícil calcular el número de respuestas debido a su naturaleza misma.
Un problema que presenta el programa de razón ha sido
demostrado en laboratorios, que demuestran que para un organismo
determinado y para una cantidad dada de refuerzos, existe una razón
límite más allá de la cual la conducta no puede sostenerse. El
resultado de sobrepasar esta razón conduce a un grado extremo de
extinción que se denomina abulia. Empiezan a aparecer largos períodos
de inactividad, no se trata de fatiga física; suele denominarse
“fatiga mental”, donde el organismo no dispone de ninguna conducta.
Bajo un reforzamiento de razón puede ocurrir el agotamiento
porque no existe ningún mecanismo autorregulador. Por el contrario, en
el reforzamiento de intervalo, cualquier tendencia a la extinción es
contrarrestada por el hecho de que, cuando la frecuencia de respuestas
declina, se recibe el próximo refuerzo a cambio de menos respuestas.
El programa de IV se protege a sí mismo: un organismo estabilizará su
conducta en una frecuencia de respuestas dad, bajo cualquier
intervalo.
OTROS PROGRAMAS DE REFORZAMIENTO
Es posible combinar un refuerzo de intervalo y otro de razón, de
manera que el refuerzo venga determinado tanto por el paso del tiempo
como por el número de respuestas emitidas sin reforzar. Hay tres
programas de reforzamiento adicionales, que pueden utilizarse en la
modificación de conducta, estos son: programas múltiples, programas
concurrentes y programas conjugados o proporcionales.
Programa Múltiple:
Está formado por dos o más programas simples tales como un
IV o RF. Cada uno de los programas va acompañado de un estímulo
distinto que se presenta a la iniciación del programa, de manera que
hay tanto estímulos como programas.
El reforzamiento se suministra, en cada programa, sobre la base del
criterio establecido; lo que caracteriza al programa múltiple es que
los distintos programas componentes se presentan sucesivamente. El
requisito para pasar de un programa a otro es haber cumplido el
anterior. El orden de presentación de los programas es totalmente
arbitrario, por lo que se puede ordenar de manera fija o totalmente al
azar.
Programa Concurrente:
Están formados, también, por dos o más programas. A
diferencia del múltiple, los programas no son sucesivos, sino
simultáneos; es decir, que el sujeto puede emitir dos respuestas
distintas que se refuerzan simultáneamente por programas
independientes, pero paralelos en el tiempo. Los reforzamientos
previstos en cada programa son independientes entre sí. Este tipo de
programa se utiliza cuando se desea reforzar más de una respuesta a la
vez, como ocurre en los programas de conducta social.
Programa Conjugado o Proporcional:
En estos programas, se establece una proporción entre cierta
medida de la conducta e cierta medida del reforzamiento. Por lo
general, estas medidas están dadas por la frecuencia del
reforzamiento, pero también pueden seguir propiedades tales como la
magnitud de la respuesta y la magnitud del reforzamiento. En este
programa, cuanto más responde el sujeto, más reforzamiento recibe, hay
una proporción directa entre conducta y reforzamiento. La relación
también puede ser inversa; dependiendo de los propósitos del programa.
Es adecuado permitir al sujeto establecer el criterio de reforzamiento
a través de la propia emisión de su conducta. Por ejemplo: si un niño
realiza dos ejercicios de matemáticas, recibe un caramelo; si realiza
cuatro, recibe dos caramelos, etc.
REDUCCIÓN DE CONDUCTAS
Todo lo revisado hasta ahora está enfocado a procedimientos
que incrementan una conducta determinada. Pero veremos ahora,
procedimientos que tienen propósito opuesto, es decir, debilitar y/o
reducir la probabilidad de la conducta. Estos procedimientos se
aplican cuando se desea que una respuesta desaparezca, que está dentro
del repertorio de conductas del sujeto.
Extinción (Interrupción del Reforzamiento):
Cuando una ejecución ya no opera sobre el medio de una
manera críticamente importante, ocurrirá con menos frecuencia y
terminará casi por desaparecer. Así, cuando la comida ya no es
presentada a la paloma, después de picotear el disco, en una caja de
Skinner, pronto la respuesta del picoteo ocurrirá con menos
frecuencia, hasta que la ejecución cese por completo. El simple hecho
de retener el reforzamiento (extinción) constituye la manera más
importante de hacer descender la frecuencia de una ejecución operante
previamente condicionada.
Este procedimiento consiste en suspender la entrega de
reforzamiento, es decir, suprimir las consecuencias que siguen a
determinada conducta. La suspensión del reforzamiento debe ser
completa, el reforzador ya no se debe administrar nunca para esa
respuesta. Sin embargo, al principio de la extinción se produce un
aumento transitorio en la conducta que disminuye luego rápidamente
(recuperación espontánea). Hay que esperar que el aumento inicial en
la frecuencia de la conducta pase, y empiece a operar la disminución
gradual que caracteriza a la extinción. Para aplicar la extinción es
necesario identificar el reforzador que mantiene la conducta, pues de
otra manera es imposible emplear este procedimiento.
La mayoría de las personas emplea extinción para reducir
determinadas conductas, aunque una gran mayoría sin saberlo: una madre
ignora los llantos de su hijo a fin de reducir esos mismos gritos, los
maestros no proporcionan buenas calificaciones o privilegios cuando
sus estudiantes no muestran un aprovechamiento satisfactorio, cuando a
una niña nunca le dan caramelos finalmente dejará de pedirlos.
Propiedades de la Extinción:
Cuando todo el reforzamiento se retira de modo permanente a
raíz de la emisión de una conducta específica, esa conducta deberá
disminuir gradualmente a su nivel anterior de reforzamiento, y tal vez
cesará por completo en última instancia. Hay algunas propiedades
generales y predecibles que caracterizan a una conducta a medida que
se la somete a extinción. Éstos incluyen aspectos temporales, el
incremento temporal de la tasa de respuesta y en la intensidad, la
agresión inducida por la extinción, y la recuperación espontánea.
Reducción Conductual Gradual:
Por lo común la extinción no tiene un efecto inmediato. Una
vez que se eliminan las consecuencias reforzadoras, la emisión de la
conducta continúa durante un lapso indeterminado de tiempo antes de
que desaparezca al final (Skinner, 1853). Se conocen diversos factores
que influencian la tasa a la que una conducta se reduce mediante la
extinción. Éstos incluyen el número de características reforzadas, el
programa con que se ha reforzado la respuesta en el pasado, el nivel
de privación del individuo, el esfuerzo necesario para crear la
respuesta, y el uso de combinaciones de procedimientos (Millenson,
1967).
En general, una conducta que en el pasado se ha emitido y reforzado
con frecuencia (conducta establecida), es mucho más resistente a la
extinción que otra que se ha emitido y reforzado raras veces.
Asimismo, una respuesta que ha sido reforzada en un programa
intermitente es más resistente a la extinción que otra que se ha
reforzado continuamente. Cuanto más privación tenga un individuo o
mientras más extenso sea el lapso de tiempo transcurrido desde que
recibió un reforzador dado, más tiempo habrá de seguir emitiéndose una
conducta bajo condiciones de extinción. Una respuesta que requiera de
un esfuerzo considerable se extinguirá con mayor rapidez que otras que
se emitan con facilidad. Cuando la extinción se usa en combinación con
el reforzamiento de una conducta alternativa o incompatible, la
respuesta disminuirá con mayor rapidez.
Incremento en la Tasa y en la Intensidad de la Respuesta:
Se han observado breves incrementos en la tasa y en la
intensidad de la respuesta inmediatamente después de la eliminación
del reforzamiento tanto en animales como en seres humanos (Kelly,
1969). Es probable que ocurran en especial cuando se ha reforzado a
una gran proporción de las respuestas. La primera vez que se ignora el
llanto de un niño, éste llorará con intensidad cada vez mayor hasta
que comience a descender y cese por completo finalmente.
Agresión Inducida:
Kelly (1969) realizó un estudio en el que reforzaba a
sujetos jalar una palanca de una máquina, al jalar la palanca se
recibía dinero en efectivo; la descontinuación de la entrega de dinero
dio lugar a que varios sujetos dieran patadas o golpes al aparato.
Un breve lapso de conducta agresiva también puede acompañar a la
extinción en sus fases iniciales (Skinner, 1953) Se ha demostrado que
la descontinuación del reforzamiento positivo produce agresión en las
palomas y respuestas similares en humanos.
Recuperación Espontánea:
Este fenómeno, también observado, con relación a la
extinción es la reaparición de la respuesta “extinguida” a
continuación de un lapso de tiempo pero sin ningún reforzamiento
intermedio de la respuesta, fue Skinner (1953) quien denominó esta
instancia con el nombre de recuperación espontánea. Aunque esta
propiedad particular es transitoria y la frecuencia de la respuesta
“recuperada” es muy limitada, el reconocimiento de su existencia puede
salvar a los manejadores de contingencia de realizar movimientos
equivocados
Uso Efectivo de la Extinción:
Se sabe que la extinción, usada a menudo en combinación con
otros procedimientos, es efectiva para reducir una gran variedad de
conductas, y es empleada bastante en casos de educación de niños,
comportamientos escolares, etc. Una ventaja apreciable de la
extinción, que implica tan sólo el no proporcionar reforzamiento, es
el no-requerimiento de estímulos aversivos, lo cual evita los efectos
negativos que a menudo son el resultado del uso del control aversivo.
La extinción requiere que todas las fuentes principales de
reforzamiento contingente a la respuesta sean eliminadas. El método
para determinar qué reforzadores mantienen a la conducta se basa en la
observación formal. Una vez definidos los reforzadores, se eliminan
por un lapso de tiempo. Si la conducta declina es posible que se hayan
identificado las contingencias reforzadoras. Para asegurar que los
reforzadores identificados están relacionados con la conducta de modo
funcional, pueden reintroducirse de nuevo temporalmente; si la
conducta se vuelve a presentar se puede confirmar la relación
contingencial de los reforzadores identificados con la respuesta.
Tiempo Fuera del Reforzamiento:
El Tiempo Fuera (TF) del reforzamiento es un procedimiento
de gran utilidad cuando, aun conociendo el reforzador que mantiene la
conducta, no podemos suspender su administración.
Lo que se hace entonces es sacar al sujeto de la situación cuando
emite la conducta que se desea suprimir; como consecuencia el sujeto
pierde contacto con los estímulos discriminativos, reforzadores
condicionados y reforzadores incondicionados. Este procedimiento
produce efectos más rápidos que la extinción, aun cuando tiene la
desventaja de que no modifica de manera directa la administración de
reforzadores en el medio y, por tanto, no otorga seguridad plena de
que la respuesta no vuelva a aparecer un tiempo después. Pero puede
aplicarse conjuntamente con control verbal, reforzamiento intermitente
o emplear el tiempo fuera parcial, en el que se retiran de la
situación los estímulos discriminativos y reforzadores condicionales e
incondicionales sin desplazar de la misma al sujeto.
Saciedad:
Este procedimiento se basa en el manejo apropiado del
reforzamiento. En este caso la supresión de la conducta se cimienta en
la utilización del propio reforzador que la mantiene: se aumenta en
forma considerable, como consecuencia o no de la conducta indeseable
que se mantiene, hasta que se sacia al sujeto, de manera que el
reforzador pierde su valor como tal. Así, cuando se sorprende a un
niño fumando un cigarrillo, una buena opción es proporcionarle tantos
cigarrillos para que fume, que luego termine mareado y con náuseas y
por no querer saber nada a cerca de los mismos.
COMENTARIOS
Muchos de los sucesos o estímulos que refuerzan nuestros
comportamientos ocurren de un modo natural y, en la mayoría de los
casos sin darnos cuenta, nadie dispone deliberadamente la aparición de
uno u otro reforzador. Pero una vez que comprendemos su potencial,
pueden ser aplicados en todas las áreas y momentos donde se
desenvuelve el ser humano; así: podemos mejorar nuestras relaciones
humanas con el simple hecho de emplear gestos y palabras (sonrisas,
ademanes, control verbal, etc.) como reforzadores en muchas
situaciones de contacto, podemos mejorar el rendimiento de los
estudiantes y trabajadores con el simple juego de los tipos de
reforzamiento, podemos lograr que personas que sufren discapacidades
físicas y mentales reingresen a nuestra sociedad y desarrollen varias
habilidades que parecen que no pudieran realizarlas, podemos aplicar
el reforzamiento social en todo ámbito humano, etc. En fin la ciencia
de la conducta puede ayudar a construir una mejor sociedad y un mundo
mejor.
Es preciso señalar que es fundamental el manejo de los
reforzadores cuando se desea mantener o reducir una conducta, sabemos
que cualquier estímulo o evento puede ser un reforzador y que éste
reforzará cualquier respuesta a la que siga contingentemente. Por
ello, la detección de reforzadores y su manejo incrementan bastante la
aplicación del proceso de reforzamiento en cualquier conducta.
REFERENCIAS BIBLIOGRÁFICAS
Ardila, R. Análisis Experimental del Comportamiento: La Contribución
Latinoamericana. México: Trillas, 1974
Ribes, E. Técnicas de Modificación de Conducta. México: Trillas, 1974
Catania, C. Investigación Contemporánea en Condicionamiento Operante.
México: Trillas, 1978
Fernández, G. Ciencia de la Conducta. México: Trillas, 1977
Ferster. Principios de la Conducta.
Malott, R., Whaley, D. Psicología del Comportamiento. España:
Fontanella, 1983
Skinner, B.F. Ciencia y Conducta Humana. España: Fontanella, 1971
Sulzer, B., Mayer Roy, G. Procedimientos del Análisis Conductual
Aplicado Con Niños y Jóvenes. México: Trillas, 1983
Arzin, N. y Ayllon, T. 1968 op.cit. idem
Kelly. 1969 op. cit. ibidem
Millenson, J.R. 1967 op. cit. ibidem
Reynolds, G.S. 1968 op. cit. ibidem
Skinner, B.F. 1938 op. cit. ibidem
Skinner, B.F. 1953 op.cit. ibidem
http://groups.google.com.mx/group/cerac