Aprendizaje: principios y aplicaciones

CAPÍTULO 6

 

Aprendizaj e: principios

y aplicaciones

 

El aprendizaje es indispensable para entender el com­portamiento humano. Interviene prácticamente en todos los aspectos de la vida. En la infancia aprende­mos a mantenernos de pie, a caminar, a usar las ma­nos. Más tarde, aprendemos a correr, a jugar algún deporte y a utilizar el abrelatas. Aprendemos a leer, a escribir, a memorizar la información necesaria para aprobar los exámenes escolares. Aprendemos a lo­grar que las personas nos den lo que queremos pre­guntándoles, haciendo tratos, siendo agradables o lisonjeándoles. Hasta aprendemos a tenerle miedo al dentista o a los exámenes; después aprendemos a superar esos miedos. También aprendemos a apren­der. El aprendizaje puede definirse como un cambio relativamente permanente del comportamiento que se obtiene a partir de la experiencia.

No todas las conductas que aprendemos las ad­quirimos de la misma manera. Más aún, una misma puede aprenderse en diversas formas. Por ejemplo, aprendemos a tenerle miedo al dentista porque lo asociamos con la experiencia del dolor. Tal vez haya­mos adquirido este miedo, porque siempre que ma­nifestamos miedo nuestros padres o amigos nos prestan mucha atención y nos hacen sentir cómodos.

Quizá nunca hayamos ido con el dentista, pero he­mos aprendido a temerle al ver la reacción de otra persona frente a él. Estos ejemplos representan los tres tipos básicos del aprendizaje que han estudiado los psicólogos: condicionamiento clásico, condiciona-miento operante y modelación.

CONDICIONAMIENTO CLÁSICO

Como muchos otros descubrimientos, el que hizo Pavlov del principio del condicionamiento clásico fue accidental. Este científico ruso estaba estudiando el proceso de la digestión. Quería saber cómo se prepa­raba el estómago de un perro para digerir la comida, cuando se le da un alimento en la boca. Observó en­tonces que la simple vista o el olor de la comida eran suficiente para que el animal comenzara a salivar. Se sintió fascinado ante tales «secreciones naturales» que se producían antes de presentarle el alimento y deci­dió investigar la naturaleza del fenómeno que consi­deró psicológico.

 

El experimento de Pavlov

Pavlov (1927) comenzó sus experimentos haciendo sonar un diapasón y luego poniendo inmediatamen­te un poco de alimento en polvo en la boca del perro. Escogió el diapasón por tratarse de un estímulo neu­tral, es decir, no tenía nada que ver con la respuesta (salivación). Luego de aparear varias veces el sonido del diapasón con la comida, el perro empezaba a sa­livar en cuanto oía el sonido, aun cuando no le pu­sieran comida en la boca (Fig. 6.1). Pavlov demostró entonces que cualquier estímulo neutral provocará una respuesta no relacionada directamente con él, si se presenta varias veces antes del estímulo (en este caso, la comida) que normalmente produce la res-puesta (salivación).

Pavlov distinguió los diversos elementos de su experimento en la forma siguiente: con el adjetivo «incondicionado» designó los estímulos naturales y las respuestas automáticas e involuntarias. Entre ellas podemos mencionar ruborizarse, temblar, sorpren­derse o salivar. En el experimento, la comida era el estímulo no condicionado o incondicionado (El): un estímulo que da origen a cierta respuesta sin que haya entrenamiento previo. (Aun perro no tiene que ense­ñársele a salivar cuando huele carne.) La comida causa normalmente la salivación. Esta última es una respuesta no condicionada o incondicionada (RI): una respuesta que se realiza de modo natural y

Figura 6.1

Aparato de Pavlov con el cual se estudió la salivación condicionada en perros. El aparato mantiene al animal inmóvil, mientras el tubo que iba en su hocico depositaba la saliva en un brazo conectado al registro de la izquierda. Las gotas de saliva movían la pluma, obteniéndose así un registro perma­nente de las respuestas de salivación ante estímulos como la comida y la vista o sonidos asociados a ella.

automático cuando se presenta un estímulo incondi­cionado.

En condiciones normales, el sonido del diapasón no ocasiona la salivación. Al perro hay que enseñar-le, o condicionarlo, a asociar ese sonido con la comi­da. Un estímulo ordinariamente neutral que, después del entrenamiento, provoca una respuesta como la salivación recibe el nombre de estímulo condiciona-do (EC). La salivación que produce es una respuesta condicionada (RC). La respuesta condicionada no es espontánea, sino aprendida. Muchos estímulos pue­den condicionarse para que produzcan salivación: la vista de la comida, el hecho de que el experimenta­dor entre en el cuarto, el sonido de un diapasón, un destello luminoso. Condicionamiento clásico se le llama a este tipo de control que se ejerce sobre las res-puestas de una persona o animal, de manera que una respuesta anterior se asocie a un nuevo estímulo.

Podemos condicionar varias respuestas reflejas que usualmente se realizan en forma automática, a fin de que ocurran cada vez que se aplica el estímulo condicionado adecuado. Entre ellas se cuentan las respuestas generadas por las glándulas, como la sali­vación o el llanto, y las de los músculos internos, como las del estómago, por ejemplo. En general, se trata de reacciones controladas por el sistema nervioso autó­nomo y participan de modo importante en las emo­ciones.

Principios generales

del condicionamiento clásico

En términos generales, una respuesta debida al con­dicionamiento clásico se adquiere gradualmente. La respuesta aprendida se fortalece tras cada aparea-miento del estímulo artificial condicionad o y el estí­mulo natural no condicionado. En el experimento de Pavlov, cuanto más a menudo el diapasón era apa­reado con la comida, con mayor frecuencia el sonido del diapasón producía salivación (respuesta condi­cionada). La sincronía de la asociación entre el estímulo condicionado (el sonido) y el estímulo no condicionado (la comida) también influye en el apren­dizaje. Pavlov probó varios procedimientos de con­dicionamiento en los que cambió el tiempo transcurrido entre el estímulo condicionado y el no condicionado. Algunas veces presentaba el sonido antes de ofrecerle la comida al perro. Otras veces lo presentaba al mismo tiempo que la comida. En gene-

 

ral, observó que el condicionamiento clásico era más confiable y eficaz, cuando presentaba el estímulo con­dicionado poco antes que el no condicionado. Des-cubrió asimismo que lograba resultados óptimos, si presentaba el estímulo condicionado un segundo antes que el no condicionado.

En el mismo conjunto de experimentos, Pavlov estudió también los fenómenos de generalización y discriminación. La generalización tiene lugar cuan‑

do un animal responde a un segundo estímulo parecido al estímulo original condicionado. Cuando Pavlov condicionaba un perro a salivar al ver un círculo (estímulo condicionado), el perro salivaba también cuando veía un óvalo. Había generalizado la respuesta para incluir un estímulo similar. Más tarde Pavlov logró lo contrario: le enseñó al perro a responder sólo al círculo, apareando siempre la carne en polvo con el círculo, pero nunca con el

 

 

 

John B. Watson y Rosalie Rayner (1920) demostraron cómo podría aplicarse el condicionamiento a un lactante humano. Hicieron experimentos con un niño de once meses que se llamaba Albert y que mostraba buen ajuste psicológico. Le mostraron muchos objetos: una rata, un conejo, bloques, un saco de pieles y una peluda máscara de Santa Claus. Albert no manifestó el menor temor ante esos objetos; se trataba de estímulos neutrales de la respuesta de miedo.

Watson y Rayner decidieron condicionar al niño para que temiera a las ratas. Comenzaron colo­cando una rata lanuda frente a él. Albert estiraba la mano para tocarla; cada vez que lo hacía, uno de los ayudantes de Watson hacía sonar, detrás de la cabeza del niño, una barra metálica. La primera vez que lo hizo, el niño cayó hacia adelante y ocultó la cabeza debajo de una almohada. La siguiente vez que estiró la mano para tocar la rata y que la barra metálica sonó, comenzó a llori­quear. El ruido —estímulo no condicionado— produjo una respuesta natural, no condicionada: la respuesta de miedo. Tras unos cuantos apareamientos, la rata se convirtió en un estímulo condicio­nado que ocasionaba una respuesta condicionada, el miedo.

Después que Watson y Rayner condicionaron a Albert para que temiera a las ratas, le presenta-ron un conejo. Ahora el niño reaccionaba con miedo ante este animal. Los investigadores compro­baron que el grado de temor que sentía ante otros estímulos neutrales dependía de cuánto se parecieran a la rata blanca y lanuda. La respuesta condicionada del miedo se había generalizado e incluía también al conejo. Otros objetos lanudos de color blanco, como la bata del investigador y la máscara de Santa Claus también hacían llorar al niño que trataba de escapar cada vez que Watson y Rayner le mostraban esos objetos, aunque la respuesta no era tan fuerte como cuando veía al conejo.

Una de las críticas más frecuentes contra la demostración del miedo condicionado en el peque­ño Albert es el hecho de que Watson y Rayner lograron enseñarle a tener miedo a un niño antes saludable y equilibrado. Los investigadores supieron al menos con un mes de anticipación que Albert abandonaría el experimento y, pese a ello, no hicieron el menor intento por acabar o solu­cionar Sus miedos condicionados (Harris, 1979). Hoy los investigadores con principios éticos no repetirían el mismo estudio por los posibles daños psíquicos que pueden causara un niño de corta edad.

Una de las discípulos de Watson, Mary Cover Jones (1924, 1974) ideó un procedimiento para atenuar los temores de las personas. Peter era un niño que le tenía mucho miedo a los conejos. Jones le ayudó a eliminarlo extinguiendo y apareando el objeto temido (el conejo) con experiencias placenteras como comer helado de crema o recibir especial atención por parte de los adultos.

 

óvalo. Así le enseñó al animal a discriminar: la capa­cidad de responder de manera diferente ante estímu­los diversos.

La generalización y la discriminación son proce­sos complementarios y forman parte de la vida dia­ria del hombre. Por ejemplo, supongamos que una persona se acostumbra a asociar el sonido del tala­dro del dentista (estímulo condicionado) con una re-acción nerviosa (respuesta condicionada). Tras varios contactos con el taladro, se dará cuenta de haber ge­neralizado esa sensación molesta con el sonido de otros taladros. Más tarde, posiblemente aprenda a discriminar entre el sonido del taladro del dentista y el de otros taladros.

Una respuesta obtenida por condicionamiento clá­sico, como cualquier otra clase de conducta, está su-jeta al cambio. Pavlov descubrió que, si dejaba de presentarle al animal comida después del sonido del diapasón, el sonido poco a poco perdía su efecto en él. Luego de golpear varias veces el diapasón sin darle comida, el perro ya no asociaba el sonido con la lle­gada de la comida: el sonido del diapasón perdía la capacidad de provocar la respuesta de salivación. A este efecto Pavlov le dio el nombre de extinción, por-que la respuesta condicionada había desaparecido paulatinamente.

Pese a que podemos extinguir una respuesta lo-grada por condicionamiento clásico, ello no significa que el sujeto la haya olvidado por completo. Trans­currido un periodo durante el cual no se ofrece el es­tímulo condicionado, la respuesta previamente extinguida puede reaparecer cuando volvamos a pre­sentar el mismo estímulo. Esta recuperación espon­tánea no hace que la respuesta condicionada recobre toda la fuerza que tenía antes de la extinción. Por ejemplo, la cantidad de salivación que produjo el perro durante la recuperación espontánea fue mu­cho menor que la generada durante el periodo del condicionamiento. Más aún, al presentar el sonido varias veces sin la comida, se fue perdiendo gradual-mente la respuesta de salivación.

Un buen ejemplo de la extinción y de la recupera­ción espontánea es el siguiente. Cada vez que esta­mos duchándonos y que disminuye la presión del agua, sentimos que repentinamente aumenta la tem­peratura del agua. Aprendemos a asociar el estímulo normalmente neutral de una disminución de la pre­sión del agua con la reacción automática de sobresal­to ante el aumento repentino de agua caliente. Aun

cuando finalmente mandemos reparar los tubos para que el agua caliente deje de fluir cuando disminuye la presión, tal vez debamos ducharnos varias veces antes de dejar de reaccionar ante un cambio de pre­sión. Con el tiempo se consigue extinguir la reacción de sobresalto. Después nos marchamos de casa du­rante algún tiempo. Al retorno, volveremos a sobre-saltarnos cada vez que cambie la presión del agua. Y luego dejaremos de emitir esa respuesta, luego de tomar varias duchas sin que haya aumentos repenti­nos de agua caliente.

Condicionamiento clásico y comportamiento humano

El condicionamiento clásico fue descubierto en ex­perimentos de laboratorio con animales; pero como hemos visto, sus principios se aplican también al ser humano.

Gracias a su aplicación, O. Hobart Mowrer y su esposa Mollie (1938) encontraron una solución prác­tica al problema de enuresis (micción involuntaria que ocurre por las noches). Una de las razones de este problema es que los niños no despiertan durante la noche cuando tienen llena la vejiga. Más bien se ori­nan en la cama mientras duermen. Los esposos Mowrers diseñaron un aparato conocido con el nom­bre de cama y almohada. Está equipado con dos ho­jas metálicas perforadas con hoyos pequeños y conectada por cables a las mantas y sábanas de la cama del niño. Cuando durante el sueño el niño hu­medece la sábanas con las primeras gotas de orina, el circuito se cierra, hace funcionar la alarma y despier­ta al niño. Entonces éste puede ir al baño La alarma es el estímulo incondicionado que produce la respues­ta no condicionada de despertarse. La sensación de vejiga llena es el estímulo condicionado que, antes del condicionamiento, no despertaba al niño. Tras aparear varias veces la alarma (estimule no condi­cionado) con la vejiga llena (estímulo condicionado), sin ayuda de la alarma el niño despertará, ante la sen­sación de una vejiga llena. Esta técnica resultó muy eficaz en el tratamiento de la enuresis.

Estudia atentamente en la figura 6-2 los elemen­tos de este ejemplo de condicionamiento y después compáralos con el experimento de Pavlov.

Aversiones del gusto. Supongamos que tienes una cita con una persona del sexo opuesto en un restau-

 

DOS EJEMPLOS DEL CONDICIONAMIENTO CLÁSICO

Estímulo Respuesta

Experimento de Pavlov

   
ANTES

DEL CONDICIONAMIENTO

Tono (estimulo neutral)

No produce la respuesta de salivación

Salivación (RNC)

Comida (ENC)

 
DURANTE

EL CONDICIONAMIENTO

Tono (EC)

y

Salivación (RNC)

comida (RNC)
DESPUÉS

DEL CONDICIONAMIENTO

  Salivación (RC)
Tono(EC)
Experimento de Mowrer    

ANTES              .

DEL CONDICIONAMIENTO

Vejiga llena

No produce la respuesta de despertar

Despenar (KNC)

(estímulo neutral)

Alarma (ENC)

 

DURANTE

EL CONDICIONAMIENTO

Vejiga llena (EC) Despertar (RNQ
y

alarma (ENC)

DESPUÉS

DEL CONDICIONAMIENTO

Vejiga llena (EC) Despertar (RC)
 

 

Figura 6.2

El proceso del condicionamiento clásico consta de tres fases: antes del entrenamiento, el entrenamiento mismo y después de él. El sujeto reacciona al estímulo neutral (EC) emitiendo una respuesta condicionada.

 

rante de lujo. Tal vez decidas probar un entremés muy caro que nunca antes comiste, caviar por ejemplo. Después de la cena, asistes a un concierto y te empie­zas a sentir muy mal del estómago. Probablemente

adquieras una aversión del gusto: nunca podrás ver el caviar sin que al menos experimentes náuseas.

La reacción de náusea ante el caviar constituye un ejemplo de condicionamiento clásico. Lo que lo

 

hace sumamente interesante para los teóricos del aprendizaje es que, cuando el hombre u otros anima-les se enferman, parecen llegar a la siguiente conclu­sión: «Seguramente me hizo mal algo que comí», aunque lleven horas sin probar bocado. En el caso anterior, difícilmente la sala del concierto donde te enfermaste se convertirá en el estímulo condiciona-do. Tampoco otros estímulos del restaurante: los di­bujos del tapiz o la clase de cubiertos con que comiste. Más aún, los psicólogos pueden predecir incluso qué parte de la comida será el estímulo condicionado: probablemente culpes a un platillo nuevo que nunca antes habías comido. Por tanto, si te enfermas des­pués de una comida con ensalada, bistec y caviar, lo más seguro es que aprendas a odiar el caviar, aun-que este platillo no sea la causa de tu malestar.

John García y R. A. Koelling (1966) fueron los pri­meros en demostrar este fenómeno en las ratas. Las metieron en una jaula provista de un tubo que conte­nía agua de sabores. Cada vez que una rata bebía de ella, las luces se iluminaban y se oían golpecitos lige­ros. Después dividieron las ratas en dos grupos. A

Figura 6.3

Una rata que oprime una barra dentro de una caja de Skinner. Éste es un ambiente artificial donde las luces, los sonidos, los premios y castigos pueden darse y controlarse y donde algunos de los comportamientos del animal, entre ellos la acción de oprimir una barra, se registran mediante conmutado-res automáticos.

algunas se les aplicaba una descarga eléctrica des­pués que bebían. Todas estas ratas mostraron el con­dicionamiento clásico tradicional: las luces y los sonidos se convirtieron en estímulos condicionados, y trataban de evitarlos para no recibir descargas eléc­tricas. A otro grupo de ratas no se les aplicaron des-cargas, sino que se les inyectó una droga que las hacía vomitar después de beber, de que se encendían las luces y producían los golpecitos. Estos animales ad­quirieron una aversión, no a las luces ni a los soni­dos, sino sólo al sabor del agua.

Esta relación especial entre comida y enfermedad se utilizó en un estudio (Gustavson y otros, 1974) en que se hizo que un grupo de coyotes odiaran el sabor del cordero, al suministrarles una droga que les pro­vocaba nauseas cuando las devoraban. Se trata de una aplicación muy útil, porque a los que crían ove­jas en la región occidental de Estados Unidos les gus­taría acabar con los coyotes que depredan sus rebaños, si bien los ecologistas se oponen al extermi­nio de los coyotes. Los experimentadores comproba­ron que podían adiestrar a estos animales para que comieran otras clases de carne, de modo que pudie­ran convivir pacíficamente con las ovejas.

CONDICIONAMIENTO OPERANTE

Supongamos que un perro recorre el vecindario, ol­fateando árboles, hurgando en la basura, buscando ardillas que cazar. Una persona muy amalbe lo ve y le arroja un hueso desde la puerta de la cocina. Al día siguiente, en su recorrido el animal seguramente se detendrá frente a la misma puerta, si es que no va directamente a ella. Si la misma persona le da otro hueso al día siguiente, y así sucesivamente, con el tiempo el perro se convertirá en un asiduo visitante.

Supongamos que un niño está triste porque su hermanita parece acaparar la atención de su madre. Comienza a manifestar su enojo y agredir a su her­mana. De inmediato la madre deja de prestar aten­ción a su hija para regañarlo. Aunque la atención de ella es negativa, al niño parece gustarle; poco tiempo después, vuelve a molestar a su hermana y recibe un regaño de su madre.

Las dos historias anteriores son un ejemplo del condicionamiento operante, es decir, del aprendizaje realizado a partir de las consecuencias del compor-

 

tamiento. El adjetivo «operante» se usa porque el sujeto (el perro callejero y el niño de los ejemplos) operan sobre el ambiente o producen algún cambio en él, obteniendo un resultado que influye en el he-cho de que en el futuro obren o no de la misma ma­nera. Según el efecto de los comportamientos operantes, el sujeto los repetirá o suprimirá con tal de obtener premios o evitar el castigo.

El condicionamiento operante difiere del condi­cionamiento clásico en dos aspectos muy importan-tes. Primero, para que se realice, es preciso que el sujeto observe determinadas conductas que produ­cen algunas consecuencias. El control del aprendiza-je está enteramente en sus manos. Si se niega a colaborar, el aprendizaje no se lleva a cabo.

Una segunda diferencia entre ambos tipos de con­dicionamiento se refiere a las clases de conducta que se adquieren. En el condicionamiento clásico, el aprendizaje se consuma mejor tratándose de un com­portamiento automático y reflejo. En cambio, el con­dicionamiento operante no se limita a las respuestas reflejas, sino que puede consistir en aprender una amplia gama de conductas voluntarias.

Reforzamiento

Burrhus F. Skinner (1974) es el psicólogo a quien se asocia más estrechamente con el condicionamiento operante. Él y sus colegas pensaban que los antece­dentes de los premios y castigos recibidos por el su-jeto influyen en casi todo su comportamiento. Supóngase que queremos enseñarle a un perro a sa­ludarnos con la pata. Una forma de lograrlo es darle una palmadita en la cabeza o un trozo de carne cada vez que levanta su pata hacia nosotros. La palmadita y el trozo de carne son un reforzador positivo. En este ejemplo, el perro entenderá el mensaje y volverá a saludarnos a su manera para obtener otro premio. El reforzamiento es un estímulo o hecho que incide en la probabilidad de que se repita una conducta. La naturaleza del reforzamiento depende del efecto que ejerza sobre el sujeto. Entre los ejemplos de reforza-dores a los que respondemos se encuentran la apro­bación social, el dinero y los privilegios especiales.

El perro dejará de saludarnos con la pata cuando olvidemos premiarlo por esa gracia y ya no le sumi­nistremos reforzamiento. Esa respuesta acabará por extinguirse pero tardará tiempo. De hecho, durante

 

Figura 6.4

La práctica es una parte importante en el proceso de aprender a tocar un instrumento musical. Los principiantes pasan largas horas practicando escalas y tonos simples. Una vez que dominan los aspectos básicos, pueden empezar a tocar melodías más complejas.

 

algún tiempo después de que hayamos suspendido el premio, el animal probablemente se mostrará im­paciente, ladrará y nos alargará la pata con mayor insistencia que antes.

Programas de reforzamiento

Un factor importante del condicionamiento operan-te son el tipo y la frecuencia de reforzamiento. Po­dríamos suponer que la forma óptima de adquirir un comportamiento consiste en reforzar todas las res-puestas. A esto se le llama programa continuo. Sin embargo, los mejores resultados no se consiguen con este tipo de programa. Cuando el reforzamiento po­sitivo se proporciona de manera intermitente o en un programa parcial, las respuestas suelen ser más esta­bles y persistentes.

Pongamos, por ejemplo, el caso de dos máquinas de venta automática que se encuentran en la cafete­ría. Tú has visto que la primera de ellas siempre te proporciona la barra de dulce que seleccionaste. Nun­ca perdiste ninguna moneda; por el contrario, inva­riablemente recibiste un reforzamiento positivo (la barra de dulce). La segunda máquina es poco confia­ble. Algunas veces recibes la barra de dulce después de meterle monedas. Otras veces no obtienes nada: ni la barra de dulce ni el dinero. Ahora supongamos que cierto día descubres que la primera máquina no te proporciona la barra de dulce. ¿De cuál de las dos seguirás tratando de obtener el reforzamiento (la ba­rra de dulce)? Probablemente no escojas la máquina más confiable, pues creerás que no conseguirás de ella la barra de dulce por mucho que lo intentes. Lo más seguro es que sigas introduciendo monedas en la segunda máquina, porque sabes que algunas ve-ces funciona bien. No te extrañará que algunas veces falle y esperarás que, tras algunos intentos, te pro­porcione lo que escogiste.

El ejemplo anterior muestra de qué manera el reforzamiento intermitente hace que las respuestas sean generalmente más estables que un programa continuo.

Aunque el reforzamiento intermitente puede or­ganizarse de muchas maneras, en el laboratorio se han estudiado cuatro métodos (o programas) funda-mentales. Los programas pueden basarse en el nú­mero de respuestas correctas que el organismo emite entre los reforzamientos (programas de razón) o en la cantidad de tiempo transcurrido antes de admi‑

nistrar el reforzamiento (programas de intervalo). En uno y otro caso, el reforzamiento puede aparecer en un programa regular (fijo) o variable. Los cuatro pro-gramas fundamentales resultan de la combinación de estas cuatro posibilidades. Las personas responden de modo distinto a cada uno de ellos.

En un programa de razón fija, el reforzamiento depende de la cantidad especificada de respuestas; por ejemplo, premiar una de cada cuatro respuestas. Este programa se aplica cuando el estudiante recibe una buena calificación luego de terminar cierta can­tidad de trabajo y cuando a una mecanógrafa le pa­gan por el número de páginas hechas. Se tiende a trabajar más con este tipo de programa, haciendo una breve pausa tras cada premio. Pero si es grande la cantidad de trabajo o el número de respuestas que han de concluirse antes del siguiente premio, el estu­diante o el trabajador a destajo muestran poco entu­siasmo y menos respuestas al inicio de cada ciclo, ya que les queda un largo camino por recorrer para re­cibir el siguiente reforzamiento.

Un programa de razón variable requiere que se emita un número promedio de respuestas por cada reforzamiento. En lugar de un número fijo, como en el caso del programa anterior, las respuestas que se necesitan para el reforzamiento cambia de una vez a la siguiente. Las máquinas tragamonedas constitu­yen un buen ejemplo de razón variable, listan pro­gramadas para premiar luego de un número variable de intentos. A los jugadores no les interesa esta ca­racterística y siguen introduciendo monedas a un rit­mo estable, creyendo (erróneamente) que cuantas más metan mayores probabilidades tendrán de ganar. Los operadores de los casinos alientan esta respuesta obsequiándoles fichas a los novatos. En términos ge­nerales, los programas de razón variable tienden a hacer que el sujeto trabaje o responda a un alto ritmo constante.

En un programa de intervalo fijo, el reforzamien­to se administra al cabo de un periodo previamente determinado. Puede darse después de determinado número de minutos, horas o días, pero el intervalo siempre es el mismo. Cuando se recurre a esta clase de programa, las personas suelen disminuir la res-puesta inmediatamente después del reforzamiento, pero al acercarse el final del intervalo aumenta rápi­damente el ritmo de la respuesta. Los empleados a quienes se les paga los jueves se sentirán más moti­vados para ir a trabajar en las mañanas de ese día

 

CAPÍR1LO 6 / APRENDIZAJE: PRINCIPIOS Y APLICACIONES

 

Figura 6.5

El pichón muestra las señales de perturbación emocional que suelen observarse en la extinción de una respuesta de condicionamiento operante. Lo adiestraron para obtener comida del hoyo cuadrado picoteando la llave colocada en el hoyo redondo. Cuando el experimentador apagó el circuito que hacía funcionar el mecanismo, el animal picoteaba la llave unos momentos y luego, al no encontrar comida, comenzaba a saltar alrededor y a agitar las alas.

 

(día del pago) que el viernes (el día después del pago). Por lo regular, el ausentismo es mucho menor en los días de pago.

En un programa de intervalo variable, el tiempo en que se obtendrá el reforzamiento varía a lo largo del procedimiento condicionador. Un ejemplo sería la llamada telefónica de un posible empleador, lla­mada que esperamos pero sin que sepamos cuándo la recibiremos. Seguramente durante horas correre­mos a contestar el teléfono, para que ningún miem­bro de la familia conteste antes, a pesar de que no sepamos si la llamada es o no el reforzador (la llama-da del empleador). Sin importar cuánto tiempo siga­mos observando este comportamiento, no podremos aumentar las probabilidades de escuchar su voz. Continuamos contestando el teléfono, porque sabe­mos que tarde o temprano recibiremos la tan ansiada llamada. De manera semejante, una paloma que está sometida a un programa de intervalo variable, ten­derá a picotear la llave mucho más regularmente que la que siga un programa de intervalo fijo, por-que ignora cuánto tiempo tardará en recibir el refor­zamiento.

En resumen, los programas de razones se fundan en números de respuestas mientras que los de interva‑

los se basan en el tiempo. En términos generales, las respuestas se aprenden mejor y son más resistentes a la extinción cuando sé refuerzan recurriendo a un programa de razón variable y no a uno de razón fija. No obstante, si queremos que el reforzamiento sea eficaz (tratándose incluso del castigo), ha de aplicar-se siempre al mismo tipo de comportamiento aun-que no necesariamente deba darse cada vez que se realiza. En las relaciones humanas, la mayor parte de los reforzadores siguen un programa variable por la complejidad de la conducta y porque es imposible predecir cómo interactuará la gente.

Señales

En el condicionamiento operante, los estímulos que se asocian con un premio o castigo se convierten en señales de un comportamiento en particular. Por ejemplo, aprendemos a cruzar la calle sólo cuando el semáforo está en verde y contestamos el teléfono sólo cuando suena. Estas señales indican simplemente que, si cruzamos la calle o contestamos el teléfono, obtendremos un reforzador que consiste en llegar sin problemas al otro lado de la calle o en escuchar una voz en el teléfono.

 

Del mismo modo que los organismos generalizan y discriminan los estímulos condicionados del con­dicionamiento clásico, también hacen lo mismo con los estímulos que sirven de señales en el condiciona-miento operante. Por ejemplo, el niño a quien se le ha premiado por decir «perrito» cada vez que ve al perro basset de la familia generalizará y dirá esa mis­ma palabra cuando vea una oveja, una vaca o un ca­ballo. Estos animales se parecen lo bastante a ese tipo de animal como para transformarse en señales de que «perrito» producirá el premio. La discriminación se realiza cuando «perrito» deja de producir un premio en estos casos. El niño aprende a limitar el uso de la palabra a los perros y a responder de manera dife­rente cuando vea una oveja, el ganado o caballos.

Puesto que las señales son guías para obtener pre­mios y castigos en el futuro, a menudo se convierten en premios o sanciones por sí mismos. En tales casos, a la señal se le llama reforzador condicionado por-que, en ausencia del proceso de condicionamiento, sería un estímulo neutral sin valor positivo ni negati­vo para la persona. A través del condicionamiento, casi todo estímulo puede adquirir prácticamente cual­quier valor.

Un experimentador (Wolfe, 1963) demostró lo anterior con un grupo de chimpancés. Las fichas de póquer no tienen valor alguno para estos animales: no pueden comerse y tampoco es muy divertido ju­gar con ellas. No obstante, el experimentador se sir­vió del condicionamiento operante para enseñarles a

 

 

Figura 6.6

Uso del Chimp-o-Mat para «comprar« cacahuates y plátanos con fichas de póquer, obtenidas al jalar hacia abajo una barra pesada. Por medio del condicionamiento operante, este chimpancé había aprendido a apreciar un objeto que no era comestible ni servía para divertirse.

 

apreciarlas tanto como el ser humano aprecia el di­nero. Les dio un «Chimp-O-Mat», aparato que dis­tribuía cacahuates o plátanos, que son reforzadores primarios o naturales (a los chimpancés les gustan estos alimentos). Si querían obtener comida, debían empujar hacia abajo una barra muy pesada para ob­tener fichas de póquer y luego meterlos en la ranura de la máquina. Con el tiempo las fichas se convirtie­ron en los reforzadores condicionados. Su valor era evidente ya que los chimpancés trabajaban para con-seguirlos, los ahorraban y, algunas veces, intentaban robárselos a los otros.

No sólo entre los animales hallamos ejemplos de este fenómeno. Las sonrisas tienen poco valor para los recién nacidos, y las palabras de aprobación care­cen de significado para ellos. Pero con el tiempo aprenden que esas expresiones y sonidos significan que un adulto va a tomarlos en brazos, a mecerlos y, quizá, a alimentarlos (reforzadores primarios). Las sonrisas y los sonidos de aprobación son señales de un premio. Después de cierto tiempo, los niños co­mienzan a apreciar las sonrisas, el elogio y otras mo­dalidades de aprobación social por sí mismos.

Control aversivo

Muchas veces con el término «reforzamiento» desig­namos exclusivamente las consecuencias agradables de un comportamiento. Los psicólogos, en cambio, lo utilizan para referirse a cualquier cosa que acre­ciente la frecuencia de una conducta. Las consecuen­cias desagradables o aversivas (en contraste con las placenteras) influyen gran parte de nuestra actividad diaria. El control aversivo denota este tipo de condi­cionamiento o aprendizaje. Hay dos formas en que los hechos desagradables, o estímulos aversivos, in-fluyen en el comportamiento: como reforzadores ne­gativos o como sanciones.

Reforzamiento negativo. En el reforzamiento nega­tivo, un estímulo doloroso o desagradable se elimina o no se aplica en absoluto si se realiza cierta clase de comportamiento. La supresión de las consecuencias negativas aumenta la frecuencia de un comporta-miento. Hay dos tipos de aprendizaje por reforza-miento negativo que los psicólogos han estudiado a fondo: condicionamiento de escape y condiciona‑

 

Figura 6.7

Una rata realiza la elección correcta en una prueba realizada en la plataforma de salto de Lashley. El aprendizaje es rápido en este aparato, porque una decisión incorrecta acarrea consecuencias negativas: la rata se golpea la nariz contra la puerta cerrada (la de franjas horizontales, en este caso) y cae a la red colocada debajo.

 

Figura 6.8

Análisis de los factores que influyen en la relación entre el comportamiento de un niño y el de sus padres (de la parte izquierda a la derecha y de la parte superior a la inferior). El niño está a punto de realizar una actividad positiva reforzadora (jugar en el lodo), pero sus padres emiten una conducta (le prohíben jugar en el lodo). El niño castiga esa prohibición con un estímulo aversivo (un violento berrinche). Su prohibi­ción pierde fuerza y terminan accediendo. A continuación la terminación del berrinche aversivo refuerza esta conducta de los padres. El berrinche del niño ha sido reforzado positivamente con el hecho de jugar en el lodo. El resultado de este proceso de condicionamiento es que ahora hay mayores probabilidades de que el niño haga berrinches y de que los padres le permitan jugar en el lodo. El nuevo comportamiento puede generalizarse a otras situaciones nuevas que sean semejantes.

 

no le guste. Este tipo de aprendizaje se denomina condicionamiento de escape, porque la conducta le ha permitido al niño no comer el hígado.

En el condicionamiento de evitación, con el com­portamiento se logra que no ocurra una situación des-agradable. Por ejemplo, si en el pasado los lloriqueos y las náuseas del niño han hecho que la madre ni si-quiera le sirva el hígado, estaremos frente a un con­dicionamiento de evitación; el niño habría evitado de antemano las consecuencias desagradables.

El castigo. La forma más evidente del control aversi­vo no es el reforzamiento negativo, sino el castigo. Si quieres que un perro deje de tocarte con la pata cuan-do desea que le prestes atención, deberás prestársela y al mismo tiempo darle en el lomo un golpe con un periódico. A estas acciones se les llama sanciones.

Igual que en el caso de los reforzadores, los he­chos o acciones que sirven de sanciones se basan en el efecto que produzcan en el sujeto. En el ejemplo de condicionamiento operante con que se inicia la sección sobre este tema, las reprensiones de la madre que debían ser sanciones fueron en realidad reforza-dores por el efecto en el niño, quien deseaba su atención. Tal vez enviarlo a su cuarto cada vez que molestara a su hermana hubiera sido un castigo apro­piado; este estímulo desagradable habría hecho que no repitiera su conducta negativa.

En el castigo, la consecuencia desagradable se presenta y disminuye la frecuencia del comporta-miento que la ocasionó. El reforzamiento negativo y el castigo operan en sentido contrario: en el primero se repite el comportamiento de escape o evitación y en el segundo el comportamiento que se castiga deja de repetirse.

Los psicólogos han encontrado varias desventa­jas en el empleo de estímulos aversivos para modifi­car la conducta. Ante todo, pueden causar efectos secundarios indeseables: ira, agresión y miedo. Y además, en vez de tener que modificar esa conducta, tal vez haya que cambiar dos o más. Por ejemplo, los niños cuyos padres recurren al castigo físico (las zu­rras) para controlar la desobediencia posiblemente después habrán de resolver el problema de una ma­yor agresividad en contra de otros niños.

Un segundo problema de los estímulos aversivos radica en que la gente aprende a evitar a la persona que les produce consecuencias negativas. En los ca­sos de padres o maestros que castigan con frecuen‑

cia, los niños aprenden a mantenerse alejados de ellos. Una consecuencia de ello es que los padres y maes­tros tendrán menos oportunidad de corregir la con­ducta incorrecta de los hijos y alumnos. Por lo demás, el castigo tiende a suprimir y no a erradicar las con­ductas indeseables.

FACTORES QUE INFLUYEN
EN EL APRENDIZAJE

Los estudios sobre formas más complejas del apren­dizaje han revelado que varios factores los favorecen o dificultan. Entre ellos cabe mencionar la retroali­mentación, la transferencia y la práctica.

Retroalimentación

La retroalimentación consiste en averiguar los resul­tados de una acción o desempeño. Sin ella, cabe la posibilidad de repetir tantas veces los mismos erro-res que podría adquirirse incorrectamente una habi­lidad: nunca sabríamos si nos hemos equivocado o no. Y aun cuando obráramos de manera correcta, no recibiríamos reforzamiento para seguir haciéndolos. Por ejemplo, si te pusieras audífonos siempre que practicas un instrumento musical, nunca sabrías la calidad con que ejecutas una pieza.

Transferencia

Muchas veces una habilidad que ya se aprendió ayu­da a adquirir otra. Si aprendiste a tocar la guitarra, te será bastante fácil aprender a tocar la mandolina. En estos casos transfieres destrezas que ya dominas, como leer las notas y convertirlas en respuestas de los dedos. Cuando las respuestas previamente apren­didas ayudan a aprender una nueva destreza, a esto se le llama transferencia positiva.

Si una destreza ya aprendida obstaculiza el apren­dizaje de otra, se dice que ha habido transferencia negativa. A un estadounidense le será más difícil con­ducir en Inglaterra que a un inglés que apenas em­pieza a aprender a manejar. En Inglaterra, el volante se encuentra en el lado derecho del automóvil y se conduce por la izquierda de las calles. La habilidad consistente en conducir al estilo americano dificulta

 

la realización de nuevas tareas mentales y motoras. A menudo las respuestas de los estadounidenses son totalmente contrarias a lo que se necesita.

Práctica

La práctica, es decir, la repetición de una tarea, con­tribuye a integrar las respuestas. Es el elemento cla­ve que produce un movimiento suave y fluido de una respuesta a la siguiente.

Dado que la práctica tarda tiempo, los psicólogos quieren saber cómo utilizar el tiempo lo más eficien­temente posible. Han comprobado que, cualquiera que sea el tipo de habilidad que se está aprendiendo, casi siempre es mejor espaciar la práctica y no reali­zarla toda de una sola vez.

La práctica puede hacerse imaginando que uno está ejercitándose en una habilidad. Los atletas se imaginan efectuando los tiros de golf una y otra vez o que lanzan un balón de básquetbol para mejorar su tiro. A esto los psicólogos lo llaman práctica mental. Aunque no es tan eficaz como la práctica real, es mejor que nada.

ESTRATEGIAS DE APRENDIZAJE

Sería difícil resolver un problema si tuviera que re-aprenderse el proceso de solución cada vez que se presente uno. Por fortuna, cuando se aprende a re­solver un problema, algunas de las experiencias rela­cionadas con el proceso se transfieren a otros problemas semejantes. Una vez que se aprenden cier­tas estrategias para llegar a la resolución y algunas técnicas de aprendizaje, las cosas se facilitan en la siguiente ocasión. Las consecuencias influyen en las estrategias, lo mismo que en reacciones menos com­plejas. Si una estrategia da buenos resultados, la perso­na o el animal tenderán a utilizarla la siguiente vez. Muchos principios adquiridos para hacer frente a la vida son útiles, otros más bien constituyen un obstáculo.

Aprendiendo a aprender

Harry Harlow (1949) demostró que los animales pue­den aprender a aprender: aprenden a aplicar estrate‑

gias para resolver problemas y tareas similares. Dio a un mono el problema de encontrar una ciruela pasa que estaba debajo de una de dos tapas, Una roja y una verde. La ciruela pasa siempre estaba escondida bajo la tapa verde. El experimentador cambiaba cons­tantemente de lugar las tapas y por ello el mono tar­daba un poco en darse cuenta de que el color era lo importante, no la ubicación.

Una vez que el mono aprendía a escoger invaria­blemente la tapa de color verde, el experimentador modificaba el problema. Ahora el animal debía esco­ger entre tapas de forma triangular y circular. La ci­ruela pasa siempre se hallaba debajo de la tapa circular, y de nuevo el experimentador cambiaba el lugar de las tapas en cada intento. Una vez más el mono realizó varios intentos antes de aprender que la forma de la tapa, no su ubicación, indicaba dónde estaba la fruta. Tras resolver varios problemas de este tipo, comenzó a aprender que la diferencia entre las dos tapas era la clave del problema. Con el tiempo lograba resolver cualquier problema de doble opción, cometiendo generalmente dos errores a lo Sumo.

El aprendizaje de estrategias y principios es ex­tremadamente importante en el comportamiento humano. En la escuela se practican habilidades como la lectura de libros, la preparación de trabajos escri­tos y la realización de exámenes. Muchas veces lo que se aprende será menos importante y útil que lo que se aprende acerca del proceso adquisitivo en gene­ral. Así, aprender a extraer información de un libro servirá siempre, trátese de un libro de física, de gra­mática o de cocina. Del mismo modo que el mono de Harlow aprendió un método general para resolver rápidamente problemas concretos, también nosotros podemos adquirir una estrategia general para apren­der determinados trozos de información.

Desvalidez y pereza

Los psicólogos han demostrado que las estrategias generales del aprendizaje inciden en la relación con el ambiente. Por ejemplo, si alguien pasa por nume­rosas experiencias en las cuales sus acciones no tie­nen el menor efecto en su mundo, aprenderá una estrategia general de desvalidez o pereza (impotencia). Martin Seligman llevó a cabo experimentos para demostrar cómo la des validez aprendida a parece en los animales. Sujetó a varios perros en un arnés del cual no podían escapar y luego les aplicó una serie

 

Flgura 6.9

Harry Harlow presentó a un grupo de monos varios pares de tapas como las de la figura y los hizo aprender estrategias para determinar cuál tapa de cada par cubría un bocado de comida. Luego de resolver algunos centenares de este tipo de problema, los monos aprendieron a aplicar la misma estrategia para encontrar el bocado debajo de cada nuevo par de tapas.

de descargas a intervalos regulares. Después de al­gunos días de administrarles este tratamiento, desa­tó a los perros. Ahora podían escapar de las descargas o evitarlas enteramente con sólo saltar una valla para llegar a un compartimiento seguro. Más de la mitad de los animales no logró aprender a saltar. Cuando se realizaron pruebas en animales a los cuales no se les había aplicado descarga alguna, casi todos ellos aprendieron a saltar para escapar. Por lo visto, mu­chos de los perros del primer grupo habían aprendi­do a no moverse y soportar las descargas, resignados al hecho de que sería en vano cualquier intento por escapar.

Experimentos posteriores revelaron que el ser humano reacciona de la misma manera. En la prime­ra etapa de un estudio (Hiroto, 1974), algunos estu­diantes universitarios aprendían a apagar un ruido desagradable y fuerte, mientras que otros no tenían control sobre él. Más tarde, todos fueron puestos en una situación donde bastaba que movieran una pa‑

lanca para detener un ruido parecido. Sólo los que habían tenido control sobre el ruido aprendieron a tirar de ella. El resto de los estudiantes ni siquiera se tomó la molestia de probar.

Es evidente cómo podemos aplicar los resultados anteriores a la vida diaria. No podremos poner todo nuestro empeño y energía en una empresa cualquie­ra, si no aprendemos que nuestras acciones «/’influ­yen en la situación. Cuando los premios se consiguen sin esfuerzo de nuestra parte, el individuo nunca aprenderá a trabajar (pereza aprendida). Y simple-mente desistirá cuando sobreviene el dolor por más que tratemos de evitarlo.

En opinión de Seligman, la desvalidez aprendida es una de las causas principales de la depresión. Re-visó después la teoría (Abramson, Seligman y Teas-dale, 1978; Miller y Seligman, 1982), de modo que ahora está más completa y detallada que su teoría inicial, la cual se basaba fundamentalmente en estu­dios con animales de laboratorio. Sostiene que, cuan-do el ser humano no puede controlar los eventos de su vida, generalmente responde en una de las siguien­tes formas: puede sentirse menos motivado para actuar y, por tanto, desiste. Tal vez le sea difícil apren­der a producir otros resultados y deje de pensar. Pue­de experimentar una disminución de su autoestima; así que tendrá pensamientos negativos acerca de sí mismo. Y, finalmente, también puede sufrir una de-presión.

Seligman identificó tres elementos importantes de la desvalidez: estabilidad, gJobalidade intemalidad. La estabilidad designa la creencia de que el estado de desvalidez se deba a una característica permanen­te. Por ejemplo, un estudiante que reprueba en un examen de matemáticas tal vez decida que el proble­ma es temporal («Salí mal en el examen de matemá­ticas porque estaba enfermo») o estable («Nunca he tenido ni tendré éxito en los exámenes de matemáti­cas»). De manera análoga, pensará que el problema es específico («No soy bueno para los exámenes de matemáticas») o global («Soy un tonto»). Tanto la estabilidad como la globalidad se centran en el estu­diante, es decir, en las causas internas del fracaso. El estudiante pudo haber pensado que el problema no era interno, sino externo («No era un buen examen de matemáticas»). Los que atribuyen resultados negativos a sus propias deficiencias seguramente sufran depresión, junto con sentimientos de culpabi­lidad. Y sufrirán una severa depresión quienes atri-

 

PSICOLOGÍA EN EL MUNDO CONTEMPÓRANEO

Cómo moldear comportamientos complejos en los animales. Los psicólogos se valen del moldea-miento para condicionar patrones conductuales muy complicados en los animales. Han logrado enseñarles a los pichones a jugar ping-pong y tocar canciones en un piano pequeño. Durante la Primera Guerra Mundial, los ingleses adiestraron a gaviotas para que descubrieran los submarinos enemigos en el Canal de la Man‑

cha. Para realizar el adiestramiento, enviaban sus propios submarinos hacia el canal, dejando caer comida en la superficie del mar. Las gaviotas pronto comenzaron a seguir los submarinos desde el aire sin la presen­cia de la comida, y el hecho de que volaran gaviotas sobre el canal era una señal de la posible presencia de submarinos alemanes.

Durante la Segunda Guerra Mundial, B. F. Skinner participó en un proyecto que consistía en entrenar a pichones para que guiaran los misiles hacia los blancos enemigos. Los pichones fueron reforzados gradual-mente para que picotearan las imágenes de los blancos enemigos proyectados sobre una pantalla. Aunque estas «armas secretas» realizaban la maniobra con mucha exactitud, nunca se utilizaron en combate En fecha más reciente, la armada estadounidense adiestró a los delfines para detectar al enemigo y las minas submarinas. A los leones submarinos se les ha enseñado a recuperar cohetes antisubmarinos para que la armada pueda evaluar su capacidad destructora.

 

 

 

buyan sus problemas a deficiencias personales y con­sideren que éstas constituyen rasgos permanentes que se aplican a todos los casos.

La revisión de la teoría de Seligman es importan-te por ser un buen ejemplo de las nuevas tendencias del conductismo. Conforme los teóricos del aprendi­zaje han empezado a estudiar los seres humanos más que los animales, se dan cuenta de que algunos de los viejos modelos del comportamiento son demasia­do simplistas porque se centran exclusivamente en lo que las personas hacen. También es importante lo que piensan.

APRENDIZAJE DE HABILIDADES
COMPLEJAS

Cuando se adquiere una habilidad (bordado, foto-grafía, lanzar un balón de basquetbol o hablar en for­ma persuasiva), se aprende algo más que una nueva relación individual entre estímulo y respuesta. Se aprenden varias de ellas y la manera de integrarlas a una unidad más grande que fluye armoniosamente. Los psicólogos estudian de manera exhaustiva la for­ma en que se adquieren nuevas respuestas y se in­corporan a habilidades complejas.

El moldeamiento es un proceso en virtud del cual se emplea el reforzamiento para crear nuevas respues­tas a partir de las ya existentes. Con este método un experimentador enseñó a una rata a hacer algo que nunca antes había hecho y que jamás haría si no se le hubiera enseñado. Puede moldearla para que, por ejemplo, levante una bandera en miniatura. El ani­mal tiene la estructura física adecuada para pararse sobre sus patas traseras y utilizar su boca para jalar una cuerda que levante una bandera en miniatura, pero en el momento actual no lo hace. Y como segu­ramente no ejecutará maniobra tan difícil por mero accidente, el experimentador comienza premiándola por cualquier acción semejante a las respuestas de­seadas, administrando después el reforzamiento para obtener aproximaciones sucesivas —cada vez más cercanas— al comportamiento deseado. Lo mismo sucede con el canario que elige un papelito (cuyo contenido predice la suerte), o bien toca una campa­nita o se pone un sombrerito para recibir como pre­mio un alpiste y después regresar a su jaula.

Imagina una rata que recorre una mesa en cuyo centro se halla la bandera. El animal observa todo con atención y finalmente olfatea el asta. De inme­diato el experimentador refuerza la respuesta y le da al animal una píldora de comida. Después, olfatea frecuentemente el asta con la esperanza de recibir otra pildora, pero el experimentador aguardad hasta que

 

Flgura 6.10

Los psicólogos moldean el comportamiento por medio del reforzamiento para crear nuevas respuestas a partir de las anteriores. Esta maestra está moldeando el comportamiento al enseñarle a una preescolar discapacitada a andar en bicicleta.

la rata levante una pata antes de darle otro premio. El proceso prosigue: el experimentador refuerza las respuestas apropiadas y luego espera otras más cer­canas a la que desea enseñarle. Con el tiempo la rata termina sosteniéndose en las patas traseras y mor­disqueando el cordón. Al instante recibe el premio y empieza a jalar rápidamente la cuerda. Así ha que-dado moldeada una nueva respuesta.

Se ha aplicado el moldeamiento para enseñar ha­bilidades lingüísticas a los niños con deficiencias. Al principio los psicólogos los premian por emitir soni­dos tan simples como «ma». Más tarde se les premia sólo cuando emiten palabras completas como «sopa» y luego por producir oraciones completas como «Sopa, por favor». Con este método muchos niños

han logrado aprender a usar los rudimentos del len-guaje (Lovass y otros, 1967).

Combinación de respuestas: encadenamiento

Si queremos aprender una habilidad, debemos inte­grar varias respuestas nuevas. Las que se emiten una tras otra en una secuencia se organizan en cadenas de respuestas. Cada respuesta produce la señal para emitir la siguiente. Por ejemplo, para clavar un clavo en una madera con un martillo se integra esta cade­na de respuestas: se toma el martillo, se toma el cla­vo, se coloca en posición el clavo, se mueve el martillo, se golpea el clavo, se mueve el martillo, se golpea el clavo y así sucesivamente hasta que el clavo penetre totalmente en la madera. Cada golpe sobre el clavo es una señal de que estamos realizando bien la ma­niobra y cuando está al ras con la superficie de la madera sabemos que ya no se requieren más res-puestas.

En el aprendizaje, las cadenas de respuestas se organizan en patrones más grandes de respuestas. Por ejemplo, la compleja habilidad de nadar consta de tres grandes cadenas que se combinan para confor­mar el patrón total del nado: una cadena de bracea-das, una cadena de respiración y una cadena de pataleo. Tras muchas horas de práctica, el nadador ya no necesita pensar en los pasos de esta habilidad. El comportamiento de nado se rige por su propio rit­mo: las cadenas de respuestas fluyen espontáneamen­te en cuanto se mete en el agua.

A menudo hay que aprender las respuestas sim­ples antes de dominar el patrón complejo. Si no sabe pegarle al clavo con un martillo, menos podrá cons­truir una casa. Por tanto, antes de poder realizar una habilidad en particular, hay que aprender todas las destrezas o pasos subordinados que la hacen posible.

MODELACIÓN

Hasta ahora tenemos la impresión de que hay tan sólo dos tipos de aprendizaje: las respuestas emociona-les, condicionadas por la estrecha asociación de un estímulo neutral con otro no condicionado; las res-puestas operantes, que se aprenden por medio de pre-

 

Figura 6.11

Cuando se aprende una habilidad, las respuestas que se emiten en secuencia se Integran en cadenas y éstas a su vez se organizan después en patrones de respuesta. La compleja habilidad del nado consta de tres partes fundamentales: brazada, respiración y pataleo.

mios o castigos. Sin embargo, las observaciones infor­males que se efectúan a lo largo de la vida sobre el apren­dizaje indican que no se limita a estas modalidades: de hecho, las más de las veces aprendemos imitando a otros. Esto se da especialmente tratándose de respues­tas sociales: en ellas aprendemos a comportarnos en una nueva situación observando la conducta de los demás. Cuando por primera vez asistimos a un concierto, no sabremos a dónde ir, cuándo entrar (especialmente si llegamos tarde a la función), cuándo aplaudir, cómo conseguir un mejor asiento después del primer inter­medio. Así pues, observamos a la gente, la imitamos y muy pronto somos verdaderos expertos.

Cabría suponer que también se realizan por imi­tación las formas más básicas del comportamiento,

cuando se requiere la respuesta apropiada para la supervivencia. El aprendizaje por tanteo (por inten­to y error) no es útil, si el castigo por no emitir la respuesta consiste en ser devorado por un depreda­dor. En conclusión, el comportamiento de evitación a veces se aprende por imitación.

Modelación es el término general con que se de signa este tipo de aprendizaje. Abarca tres tipos de efectos. En el caso más simple, el comportamiento aje no no hace más que aumentar las probabilidades de que hagamos lo mismo que ellos. Aplaudidnos cuan do la gente lo hace, dirigimos la vista hacia la parte superior de un edificio cuando todo mundo lo hace y copiamos los estilos y las expresiones verbales de quienes nos rodean. En este caso no se realiza apren­dizaje alguno, en el sentido de adquirir nuevas res puestas. Nos limitamos simplemente a emitir respuestas anteriores que tal vez utilizaríamos en casos similares.

El segundo tipo de modelación se llama aprendi­zaje por observación, o imitación. En él urja persona ve a un modelo realizar un comportamiento y más tarde logra reproducirlo con mucha fidelidad, aun-que no podía hacerlo antes de observar e1 modelo. Un ejemplo consiste en ver, por televisión o en una película, que alguien utiliza una herramienta desco­nocida y después manejarla uno mismo.

Un tercer tipo es la desinhibición. Cuando una persona ve a alguien llevar a cabo una actividad re-probable sin que lo castiguen, tal vez le sea más fácil reproducirla más tarde. Por ejemplo, supóngase que un individuo sufre fobia a las serpientes y ve a otro tomarlas con la mano. Tal espectáculo aliviará la fobia. Este procedimiento se emplea en el trabajo clínico.

¿Qué sucede cuando un observador aprende vien­do? Según los primeros teóricos, el hombre posee una especie de «instinto» de imitación y, efectivamente, es probable que algunos animales sí imiten de modo automático, especialmente cuando son muy jóvenes y tienen siempre tan buenos modelos cerda de ellos: su padres. Los teóricos del condicionamiento operan-te como Skinner sostienen que la imitación es ya una respuesta, la cual a menudo es reforzada porque da excelentes resultados. Dicho con otras palabras, el comportamiento ajeno cumple la función se estímu­lo discriminativo cíe una especie de comportamiento de pareamiento, que luego se refuerza porque influ­ye en el ambiente o porque otros tienden a reforzar dicho apareamiento (como cuando una madre elogia al hijo por imitar correctamente sus palabras).

 

más SOBRE PSICOLOGÍA

Aprendizaje espacial. Tanto el condicionamiento clásico como el operante giran en torno al tiempo. En la demostración del condicionamiento clásico efectuada por Pavlov, el sonido del diapasón antecedía a la comida. En el condicionamiento operante, el perro que recibe comida como premio después de alzar la pata aprende a «dar la mano».

Además de estas dos clases de condicionamiento, los psicólogos han estudiado una tercera modalidad —el aprendizaje espacial—que consiste en aprender la ubicación de los objetos en el ambiente. Los que lo estudian afirman que el ser humano explora su ambiente y se forma, mapas cognitivos internos. Estos mapas sirven para dominar los ambientes nuevos. ¿Recuerdas cuan confusa te parecía la escuela en tu primer día de clases? Pero rápidamente te formaste un mapa cognitivo, y este aprendizaje espacial explica por qué ahora podrías recorrerla con los ojos vendados.

Los psicólogos han descubierto que el aprendizaje espacial se da no sólo en el hombre, sino también en los animales. En su opinión, las mapas cognitivos explican el hecho de que los chimpancés aprenden pronto a encontrar la comida oculta en un área, las ratas aprenden a recorrer un laberinto y las abejas no se pierden en su regreso a la colmena.

¿REALIDAD O MITO?

La mayor parte de los psicólogos piensan que los alcohólicos pueden «aprender» a ser bebedores sociales.

Mito. En general, han sido en vano los intentos realizados por aplicar la modificación del comportamiento

a los alcohólicos y enseñarles a ser bebedores sociales. Los psicólogos piensan que el alcohólico simplemente no puede aprender a beber con moderación. Por tanto, los intentos de modificar su comportamiento casi siempre consisten en abstenerse totalmente de ingerir bebidas alcohólicas como primer e indispensable paso en el camino de la recuperación.

 

 

 

 

A utocontrol

En las economías de fichas, el investigador establece un complejo sistema de reforzadores para que las personas observen la conducta que él desea. Una de las tendencias más impor­tantes de la modificación del comportamiento consiste en pedirles que creen sus propios sistemas de premio y castigo para moldear sus pensamientos y acciones.

Antaño los conductistas limitaban sus estudios a la conducta observable y se esforzaban poco por observar o cambiar la forma de pensar de la gente. Más tarde, a medida que un mayor número de investigadores del comportamiento empezó a estudiar al ser humano (en vez de concentrarse exclusivamente en los animales), se comprobó que lo que la gente hace

 

no es más que una parte de la realidad. Por ejemplo, como vimos en páginas anteriores, Martin Seligman amplió recientemente su teoría de la desvalidez aprendida para explicar por qué algunos sufren depresiones durante mucho tiempo y otros parecen superarlas. En parte la diferencia, asegura Seligman, se basa en lo que pensamos, es decir, en la manera de interpretar nuestros fracasos.

Como en toda aplicación de la modificación del comportamiento, el primer paso del autocontrol consiste en definir el problema. Si alguien fuma demasiado, deberá alentársela a contar cuántos cigarros consume cada hora del día y a fijarse en qué tipo de situaciones lo impulsa a fumar. (¿Después de la comida? ¿Cuándo habla con los amigos? ¿Cuando condu­ce el automóvil?) De manera análoga, si alguien tiene una mala opinión de sí mismo, habrá de definir el problema más concretamente. Podría empezar contando la cantidad de sus comentarios y pensamientos de menosprecio para sí mismo. Los investigadores han com­probado que el simple hecho de que el individuo lleve este tipo de registro de su conducta lo impulsa a veces a cambiarla.

El siguiente paso puede consistir en establecer un contrato para un solo comportamien­to. Una persona a quien le encantaban los refrescos y le era difícil dedicarse al estudio deci­dió tomar un refresco sólo después de estudiar media hora. La adicción a este refresccj) mantuvo su fuerza, pero con este sistema aumentó drásticamente el tiempo que dedicaba a su estudio. Un contrato conductual consiste simplemente en seleccionar un reforzador (compa­prar una camisa nueva, ver el programa favorito de televisión) y condicionarlo a alguna acción necesaria pero desagradable (llegar a tiempo al trabajo, limpiar el piso de la cocina). Los contratos tienen mayores probabilidades de éxito, si se recurre a aproximaciones sucesi­vas: comenzar con una tarea fácil y gradualmente irla haciendo más difícil. Por ejemplo podrías empezar a estudiar diez minutos antes de premiarte y luego aumentar poco a poco el tiempo de estudio hasta llegar a una hora.

Los modificadores del comportamiento están diseñando y probando muchas otras técni­cas que nos ayudarán a aprender a controlarnos.

Cómo mejorar los hábitos de estudio

Un psicólogo diseñó un programa para ayudarles a los estudiantes a mejorar sus hábitos de estudio y lo probó en un grupo de voluntarios. A los alumnos se les indicó fijarse una hora en que irían a un pequeño cuarto de la biblioteca que nunca antes habían usado y que toma­ran únicamente los materiales que quisieran estudiar. Después debían trabajar sólo mien­tras persistiera su interés y ni un minuto más. En cuanto se dieran cuenta de que empezaban a inquietarse, a soñar despiertos, a adormilarse o aburrirse, debían tomar la decisión de dejar de estudiar. Ésta no era más que una condición. Tenían que leer una página más o resolver ctro problema simple antes de dejar la biblioteca. Aunque esto despertara en ellos el deseo de estudiar más, se les indicó que debían mantener la decisión de abandonar la biblioteca, irse a tomar una taza de café, visitar a un amigo o hacer cualquier otra cosa qui­quisieran.

Al día siguiente se les pidió repetir el mismo procedimiento, agregando una segunda página a lo que habían leído entre el momento de decidir marcharse y el momento en que realmente lo hacían. En el tercer día leían una página más y así sucesivamente. Los que siguieron este procedimiento observaron que con el tiempo podían estudiar periodos más largos que antes, que estudiaban mejor y que no les molestaba estudiar tanto.

¿Por qué dio buenos resultados este procedimiento? Muchos de los alumnos se obliga-ron a sí mismos a estudiar. Una técnica común consiste en acudir a la biblioteca para evitar

 

distracciones. El resultado puede ser pasar horas viendo un libro sin leerlo. La imposibili­dad de lograr algo y la incomodidad hacen del estudio un verdadero tormento. La bibliote­ca se convierte en el estímulo aversivo condicionado: los estudiantes la odian porque pasan allí mucho tiempo. Se diseñó el procedimiento para cambiar esa actitud.

El exigirles abandonar la biblioteca en cuanto se sintieran distraídos contribuyó a ate­nuar las emociones negativas y punitivas asociadas al estudio. Los alumnos dejaban de leer cuando aparecían esos sentimientos. El hecho de estudiar en un sitio nuevo suprimía el estímulo aversivo condicionado. Así, las respuestas aversivas no quedaron condicionadas a la asignatura ni a la sala, como sucedía cuando los estudiantes se imponían la obligación de trabajar.

Segundo, en el procedimiento se utilizaban las aproximaciones sucesivas. Los alumnos comenzaban leyendo una página después de empezar a aburrirse y poco a poco aumenta­ban la tarea. Con ello aminoraban la respuesta aversiva ante el estudio. La tarea ya no les parecía tan difícil.

Finalmente, cuando dejaban de trabajar, recibían dos tipos de reforzamiento positivo: tenían la satisfacción de saber que habían cumplido con el procedimiento y de haber termi­nado una tarea (a saber, una página más); ahora ya podían dedicarse a lo que realmente disfrutaban. De ese modo se premiaban o reforzaban a sí mismos por el estudio realizado (Fox, 1966). Éste es un procedimiento que no dudamos en recomendarte.

 

RESUMEN

 

 

 

  1. El aprendizaje es un cambio permanente del com­portamiento que resulta de la experiencia.
  2. El condicionamiento clásico fue descubierto por Ivan Pavlov. En esta forma de aprendizaje, un es­tímulo previamente neutral con el tiempo llega a producir una respuesta, por haber sido aparea-do con un estímulo que ya la provocaba. La ex­tinción de una respuesta de condicionamiento clásico se realiza cuando la respuesta condicio­nada deja de asociarse al estímulo no condicio­nado.
  3. El condicionamiento operante se realiza cuando las actividades de un organismo son reforzadas o castigadas. Se llama reforzador a toda conse­cuencia que aumente las probabilidades de una conducta. La extinción se da cuando la frecuen­cia de la conducta disminuye porque ya no se refuerza.
  4. Los programas de reforzamiento producen diver­sos patrones conductuales. Cuando el reforza-miento está subordinado al número de respuestas (programas de razón), el organismo tiende a res­ponder más rápidamente que cuando se basa en el tiempo (programas de intervalos). Si reforza­mos las respuestas de manera periódica (progra­mas fijos), el organismo tenderá a hacer una pausa después de recibir un premio. Si los refor­zamientos aparecen en periodos irregulares, el organismo mantendrá un ritmo uniforme de ac­tividad. Las respuestas reforzadas intermitente-mente desaparecen con mayor lentitud durante la extinción que las que recibieron un reforza-miento continuo.
  5. Por señales se entiende los estímulos que con el tiempo se han ido asociando a la obtención de

premios o castigos. Los organismos poseen la capacidad de generalizar y discriminar las seña-les. Una señal se convierte en un reforzador con­dicionado, cuando por sí misma cumple la función de premio o castigo.

  1. Control aversivo significa aplicar elementos des-agradables para influir en el comportamiento. En el castigo, el hecho negativo se produce a raíz de la respuesta y disminuye la frecuencia de ésta. En el condicionamiento de escape y evitación, la respuesta tiene el efecto de cancelar el hecho des-agradable. En el reforzamiento negativo, decre­ce la frecuencia de una respuesta que pone fin a un evento desagradable.
    1. Los factores que influyen en el aprendizaje son retroalimentación, transferencia y práctica.
    2. Con el descubrimiento de algunas estrategias, los organismos pueden aprender a aprender. Una es­trategia con que se resuelve un problema o se aprende algo puede aplicarse después a situa­ciones posteriores de carácter semejante. Los or­ganismos aprenden las estrategias de desvalidez o pereza, si viven situaciones donde su compor­tamiento no influye en los acontecimientos.
    3. Si se quiere aprender una habilidad complicada, es preciso dominar y coordinar varias respues­tas nuevas. El aprendizaje de habilidades se fa­cilita por imitación y moldeamiento. Para aprender una habilidad, hay que integrar las nuevas respuestas en cadenas, las cuales a su vez se organizan después y constituye patrones de respuestas.
    4. La modelación es una especie de aprendizaje que resulta de la imitación.

 

PREGUNTAS DE REPASO

 

 

 

  1. ¿Qué tipo de aprendizaje se realiza cuando una respuesta anterior queda vinculada a un nuevo estímulo? ¿Qué términos utilizó Pavlov para de signar los siguientes elementos de sus experimen­tos con perros: comida, la respuesta de salivación del animal al ver la comida, el sonido del diapa­són, la respuesta de salivación al oír el sonido del diapasón? ¿Con qué palabra designó el hecho de golpear varias veces el diapasón sin darle comi­da al perro?
  2. ¿Qué psicólogo es uno de los que más han con­tribuido al desarrollo del condicionamiento ope­rante? ¿Qué tipo de condicionamiento pone de relieve que el estímulo produce la respuesta?
  3. ¿Qué nombre se da a las respuestas positivas? ¿Qué nombre se da a las respuestas negativas? Mencione dos técnicas para lograr que se repita un comportamiento y otras dos que evitan que se repita.
  4. Menciona los cuatro programas del reforzamien­to elaborados por Skinner.
  5. Da algunos ejemplos de reforzadores primarios. ¿Qué tipo de reforzador es el dinero?
  6. Los estímulos aversivos pueden utilizarse en dos formas. ¿Cuáles son? ¿En qué se distinguen?
  7. ¿Cómo desarrolló Martin Seligman la teoría de la desvalidez en los animales? Una persona que haya aprendido la desvalidez tenderá más a sufrir depresión. Si alguien se siente deprimido y desvalido después de un examen escolar, ¿cuáles son las dos cosas en que seguramente pen­sará?
  8. ¿En qué proceso se refuerza al sujeto por lograr aproximaciones cada vez más cercanas a la con­ducta deseada? ¿Qué nombre se da a la secuen­cia en que una respuesta produce la señal para emitir la siguiente respuesta?
  9. ¿Cuáles son los tres tipos de modelación?

 

de estudiar

capítulo, deberás ser capaz de:

explicar el concepto de procesamie de información.

identificar y explicar los diversos tip sistemas de memoria.

explicar las teorías de la memoria. describir las unidades y los tipos del pensamiento.

definir la solución de problemas

 

 

Captación de Atención selec características

Almacenamiento de información Almacenamiento sensorial • Memoria a corto plazo • Memoria a largo plazo • La memoria y el cerebro Recuperación de información Reconocimiento • Aplicación de la psicología: testimonio de testigos ocula

  • El recuerdo • Olvido • Aplicación de

 

psicología: estado de ánimo

  • Cómo mejorar la memoria Procesamiento central de información Pensamiento • Solución de problemas • Creatividad

Deja un comentario