Aprendizaje: principios y aplicaciones

CAPÍTULO 6

Aprendizaj e: principios

y aplicaciones

El aprendizaje es indispensable para entender el comportamiento humano. Interviene prácticamente en todos los aspectos de la vida. En la infancia aprendemos a mantenernos de pie, a caminar, a usar las manos. Más tarde, aprendemos a correr, a jugar algún deporte y a utilizar el abrelatas. Aprendemos a leer, a escribir, a memorizar la información necesaria para aprobar los exámenes escolares. Aprendemos a lograr que las personas nos den lo que queremos preguntándoles, haciendo tratos, siendo agradables o lisonjeándoles. Hasta aprendemos a tenerle miedo al dentista o a los exámenes; después aprendemos a superar esos miedos. También aprendemos a aprender. El aprendizaje puede definirse como un cambio relativamente permanente del comportamiento que se obtiene a partir de la experiencia.

No todas las conductas que aprendemos las adquirimos de la misma manera. Más aún, una misma puede aprenderse en diversas formas. Por ejemplo, aprendemos a tenerle miedo al dentista porque lo asociamos con la experiencia del dolor. Tal vez hayamos adquirido este miedo, porque siempre que manifestamos miedo nuestros padres o amigos nos prestan mucha atención y nos hacen sentir cómodos.

Quizá nunca hayamos ido con el dentista, pero hemos aprendido a temerle al ver la reacción de otra persona frente a él. Estos ejemplos representan los tres tipos básicos del aprendizaje que han estudiado los psicólogos: condicionamiento clásico, condiciona-miento operante y modelación.

CONDICIONAMIENTO CLÁSICO

Como muchos otros descubrimientos, el que hizo Pavlov del principio del condicionamiento clásico fue accidental. Este científico ruso estaba estudiando el proceso de la digestión. Quería saber cómo se preparaba el estómago de un perro para digerir la comida, cuando se le da un alimento en la boca. Observó entonces que la simple vista o el olor de la comida eran suficiente para que el animal comenzara a salivar. Se sintió fascinado ante tales «secreciones naturales» que se producían antes de presentarle el alimento y decidió investigar la naturaleza del fenómeno que consideró psicológico.

El experimento de Pavlov

Pavlov (1927) comenzó sus experimentos haciendo sonar un diapasón y luego poniendo inmediatamente un poco de alimento en polvo en la boca del perro. Escogió el diapasón por tratarse de un estímulo neutral, es decir, no tenía nada que ver con la respuesta (salivación). Luego de aparear varias veces el sonido del diapasón con la comida, el perro empezaba a salivar en cuanto oía el sonido, aun cuando no le pusieran comida en la boca (Fig. 6.1). Pavlov demostró entonces que cualquier estímulo neutral provocará una respuesta no relacionada directamente con él, si se presenta varias veces antes del estímulo (en este caso, la comida) que normalmente produce la res-puesta (salivación).

Pavlov distinguió los diversos elementos de su experimento en la forma siguiente: con el adjetivo «incondicionado» designó los estímulos naturales y las respuestas automáticas e involuntarias. Entre ellas podemos mencionar ruborizarse, temblar, sorprenderse o salivar. En el experimento, la comida era el estímulo no condicionado o incondicionado (El): un estímulo que da origen a cierta respuesta sin que haya entrenamiento previo. (Aun perro no tiene que enseñársele a salivar cuando huele carne.) La comida causa normalmente la salivación. Esta última es una respuesta no condicionada o incondicionada (RI): una respuesta que se realiza de modo natural y

Figura 6.1

Aparato de Pavlov con el cual se estudió la salivación condicionada en perros. El aparato mantiene al animal inmóvil, mientras el tubo que iba en su hocico depositaba la saliva en un brazo conectado al registro de la izquierda. Las gotas de saliva movían la pluma, obteniéndose así un registro permanente de las respuestas de salivación ante estímulos como la comida y la vista o sonidos asociados a ella.

automático cuando se presenta un estímulo incondicionado.

En condiciones normales, el sonido del diapasón no ocasiona la salivación. Al perro hay que enseñar-le, o condicionarlo, a asociar ese sonido con la comida. Un estímulo ordinariamente neutral que, después del entrenamiento, provoca una respuesta como la salivación recibe el nombre de estímulo condiciona-do (EC). La salivación que produce es una respuesta condicionada (RC). La respuesta condicionada no es espontánea, sino aprendida. Muchos estímulos pueden condicionarse para que produzcan salivación: la vista de la comida, el hecho de que el experimentador entre en el cuarto, el sonido de un diapasón, un destello luminoso. Condicionamiento clásico se le llama a este tipo de control que se ejerce sobre las res-puestas de una persona o animal, de manera que una respuesta anterior se asocie a un nuevo estímulo.

Podemos condicionar varias respuestas reflejas que usualmente se realizan en forma automática, a fin de que ocurran cada vez que se aplica el estímulo condicionado adecuado. Entre ellas se cuentan las respuestas generadas por las glándulas, como la salivación o el llanto, y las de los músculos internos, como las del estómago, por ejemplo. En general, se trata de reacciones controladas por el sistema nervioso autónomo y participan de modo importante en las emociones.

Principios generales

del condicionamiento clásico

En términos generales, una respuesta debida al condicionamiento clásico se adquiere gradualmente. La respuesta aprendida se fortalece tras cada aparea-miento del estímulo artificial condicionad o y el estímulo natural no condicionado. En el experimento de Pavlov, cuanto más a menudo el diapasón era apareado con la comida, con mayor frecuencia el sonido del diapasón producía salivación (respuesta condicionada). La sincronía de la asociación entre el estímulo condicionado (el sonido) y el estímulo no condicionado (la comida) también influye en el aprendizaje. Pavlov probó varios procedimientos de condicionamiento en los que cambió el tiempo transcurrido entre el estímulo condicionado y el no condicionado. Algunas veces presentaba el sonido antes de ofrecerle la comida al perro. Otras veces lo presentaba al mismo tiempo que la comida. En gene-

ral, observó que el condicionamiento clásico era más confiable y eficaz, cuando presentaba el estímulo condicionado poco antes que el no condicionado. Des-cubrió asimismo que lograba resultados óptimos, si presentaba el estímulo condicionado un segundo antes que el no condicionado.

En el mismo conjunto de experimentos, Pavlov estudió también los fenómenos de generalización y discriminación. La generalización tiene lugar cuan‑

do un animal responde a un segundo estímulo parecido al estímulo original condicionado. Cuando Pavlov condicionaba un perro a salivar al ver un círculo (estímulo condicionado), el perro salivaba también cuando veía un óvalo. Había generalizado la respuesta para incluir un estímulo similar. Más tarde Pavlov logró lo contrario: le enseñó al perro a responder sólo al círculo, apareando siempre la carne en polvo con el círculo, pero nunca con el

John B. Watson y Rosalie Rayner (1920) demostraron cómo podría aplicarse el condicionamiento a un lactante humano. Hicieron experimentos con un niño de once meses que se llamaba Albert y que mostraba buen ajuste psicológico. Le mostraron muchos objetos: una rata, un conejo, bloques, un saco de pieles y una peluda máscara de Santa Claus. Albert no manifestó el menor temor ante esos objetos; se trataba de estímulos neutrales de la respuesta de miedo.

Watson y Rayner decidieron condicionar al niño para que temiera a las ratas. Comenzaron colocando una rata lanuda frente a él. Albert estiraba la mano para tocarla; cada vez que lo hacía, uno de los ayudantes de Watson hacía sonar, detrás de la cabeza del niño, una barra metálica. La primera vez que lo hizo, el niño cayó hacia adelante y ocultó la cabeza debajo de una almohada. La siguiente vez que estiró la mano para tocar la rata y que la barra metálica sonó, comenzó a lloriquear. El ruido —estímulo no condicionado— produjo una respuesta natural, no condicionada: la respuesta de miedo. Tras unos cuantos apareamientos, la rata se convirtió en un estímulo condicionado que ocasionaba una respuesta condicionada, el miedo.

Después que Watson y Rayner condicionaron a Albert para que temiera a las ratas, le presenta-ron un conejo. Ahora el niño reaccionaba con miedo ante este animal. Los investigadores comprobaron que el grado de temor que sentía ante otros estímulos neutrales dependía de cuánto se parecieran a la rata blanca y lanuda. La respuesta condicionada del miedo se había generalizado e incluía también al conejo. Otros objetos lanudos de color blanco, como la bata del investigador y la máscara de Santa Claus también hacían llorar al niño que trataba de escapar cada vez que Watson y Rayner le mostraban esos objetos, aunque la respuesta no era tan fuerte como cuando veía al conejo.

Una de las críticas más frecuentes contra la demostración del miedo condicionado en el pequeño Albert es el hecho de que Watson y Rayner lograron enseñarle a tener miedo a un niño antes saludable y equilibrado. Los investigadores supieron al menos con un mes de anticipación que Albert abandonaría el experimento y, pese a ello, no hicieron el menor intento por acabar o solucionar Sus miedos condicionados (Harris, 1979). Hoy los investigadores con principios éticos no repetirían el mismo estudio por los posibles daños psíquicos que pueden causara un niño de corta edad.

Una de las discípulos de Watson, Mary Cover Jones (1924, 1974) ideó un procedimiento para atenuar los temores de las personas. Peter era un niño que le tenía mucho miedo a los conejos. Jones le ayudó a eliminarlo extinguiendo y apareando el objeto temido (el conejo) con experiencias placenteras como comer helado de crema o recibir especial atención por parte de los adultos.

óvalo. Así le enseñó al animal a discriminar: la capacidad de responder de manera diferente ante estímulos diversos.

La generalización y la discriminación son procesos complementarios y forman parte de la vida diaria del hombre. Por ejemplo, supongamos que una persona se acostumbra a asociar el sonido del taladro del dentista (estímulo condicionado) con una re-acción nerviosa (respuesta condicionada). Tras varios contactos con el taladro, se dará cuenta de haber generalizado esa sensación molesta con el sonido de otros taladros. Más tarde, posiblemente aprenda a discriminar entre el sonido del taladro del dentista y el de otros taladros.

Una respuesta obtenida por condicionamiento clásico, como cualquier otra clase de conducta, está su-jeta al cambio. Pavlov descubrió que, si dejaba de presentarle al animal comida después del sonido del diapasón, el sonido poco a poco perdía su efecto en él. Luego de golpear varias veces el diapasón sin darle comida, el perro ya no asociaba el sonido con la llegada de la comida: el sonido del diapasón perdía la capacidad de provocar la respuesta de salivación. A este efecto Pavlov le dio el nombre de extinción, por-que la respuesta condicionada había desaparecido paulatinamente.

Pese a que podemos extinguir una respuesta lo-grada por condicionamiento clásico, ello no significa que el sujeto la haya olvidado por completo. Transcurrido un periodo durante el cual no se ofrece el estímulo condicionado, la respuesta previamente extinguida puede reaparecer cuando volvamos a presentar el mismo estímulo. Esta recuperación espontánea no hace que la respuesta condicionada recobre toda la fuerza que tenía antes de la extinción. Por ejemplo, la cantidad de salivación que produjo el perro durante la recuperación espontánea fue mucho menor que la generada durante el periodo del condicionamiento. Más aún, al presentar el sonido varias veces sin la comida, se fue perdiendo gradual-mente la respuesta de salivación.

Un buen ejemplo de la extinción y de la recuperación espontánea es el siguiente. Cada vez que estamos duchándonos y que disminuye la presión del agua, sentimos que repentinamente aumenta la temperatura del agua. Aprendemos a asociar el estímulo normalmente neutral de una disminución de la presión del agua con la reacción automática de sobresalto ante el aumento repentino de agua caliente. Aun

cuando finalmente mandemos reparar los tubos para que el agua caliente deje de fluir cuando disminuye la presión, tal vez debamos ducharnos varias veces antes de dejar de reaccionar ante un cambio de presión. Con el tiempo se consigue extinguir la reacción de sobresalto. Después nos marchamos de casa durante algún tiempo. Al retorno, volveremos a sobre-saltarnos cada vez que cambie la presión del agua. Y luego dejaremos de emitir esa respuesta, luego de tomar varias duchas sin que haya aumentos repentinos de agua caliente.

Condicionamiento clásico y comportamiento humano

El condicionamiento clásico fue descubierto en experimentos de laboratorio con animales; pero como hemos visto, sus principios se aplican también al ser humano.

Gracias a su aplicación, O. Hobart Mowrer y su esposa Mollie (1938) encontraron una solución práctica al problema de enuresis (micción involuntaria que ocurre por las noches). Una de las razones de este problema es que los niños no despiertan durante la noche cuando tienen llena la vejiga. Más bien se orinan en la cama mientras duermen. Los esposos Mowrers diseñaron un aparato conocido con el nombre de cama y almohada. Está equipado con dos hojas metálicas perforadas con hoyos pequeños y conectada por cables a las mantas y sábanas de la cama del niño. Cuando durante el sueño el niño humedece la sábanas con las primeras gotas de orina, el circuito se cierra, hace funcionar la alarma y despierta al niño. Entonces éste puede ir al baño La alarma es el estímulo incondicionado que produce la respuesta no condicionada de despertarse. La sensación de vejiga llena es el estímulo condicionado que, antes del condicionamiento, no despertaba al niño. Tras aparear varias veces la alarma (estimule no condicionado) con la vejiga llena (estímulo condicionado), sin ayuda de la alarma el niño despertará, ante la sensación de una vejiga llena. Esta técnica resultó muy eficaz en el tratamiento de la enuresis.

Estudia atentamente en la figura 6-2 los elementos de este ejemplo de condicionamiento y después compáralos con el experimento de Pavlov.

Aversiones del gusto. Supongamos que tienes una cita con una persona del sexo opuesto en un restau-

DOS EJEMPLOS DEL CONDICIONAMIENTO CLÁSICO

		*Estímulo*	*Respuesta*
Experimento de Pavlov
ANTES DEL CONDICIONAMIENTO		Tono (estimulo neutral)	No produce la respuesta de salivación Salivación (RNC)
		Comida (ENC)

DURANTE EL CONDICIONAMIENTO		Tono (EC) y	Salivación (RNC)
		comida (RNC)
DESPUÉS DEL CONDICIONAMIENTO			Salivación (RC)
		Tono(EC)
Experimento de Mowrer
	ANTES . DEL CONDICIONAMIENTO	Vejiga llena	No produce la respuesta de despertar Despenar (KNC)
		(estímulo neutral) Alarma (ENC)

	DURANTE EL CONDICIONAMIENTO	Vejiga llena (EC)	Despertar (RNQ
		y alarma (ENC)
	DESPUÉS DEL CONDICIONAMIENTO	Vejiga llena (EC)	Despertar (RC)

Figura 6.2

El proceso del condicionamiento clásico consta de tres fases: antes del entrenamiento, el entrenamiento mismo y después de él. El sujeto reacciona al estímulo neutral (EC) emitiendo una respuesta condicionada.

rante de lujo. Tal vez decidas probar un entremés muy caro que nunca antes comiste, caviar por ejemplo. Después de la cena, asistes a un concierto y te empiezas a sentir muy mal del estómago. Probablemente

adquieras una aversión del gusto: nunca podrás ver el caviar sin que al menos experimentes náuseas.

La reacción de náusea ante el caviar constituye un ejemplo de condicionamiento clásico. Lo que lo

hace sumamente interesante para los teóricos del aprendizaje es que, cuando el hombre u otros anima-les se enferman, parecen llegar a la siguiente conclusión: «Seguramente me hizo mal algo que comí», aunque lleven horas sin probar bocado. En el caso anterior, difícilmente la sala del concierto donde te enfermaste se convertirá en el estímulo condiciona-do. Tampoco otros estímulos del restaurante: los dibujos del tapiz o la clase de cubiertos con que comiste. Más aún, los psicólogos pueden predecir incluso qué parte de la comida será el estímulo condicionado: probablemente culpes a un platillo nuevo que nunca antes habías comido. Por tanto, si te enfermas después de una comida con ensalada, bistec y caviar, lo más seguro es que aprendas a odiar el caviar, aun-que este platillo no sea la causa de tu malestar.

John García y R. A. Koelling (1966) fueron los primeros en demostrar este fenómeno en las ratas. Las metieron en una jaula provista de un tubo que contenía agua de sabores. Cada vez que una rata bebía de ella, las luces se iluminaban y se oían golpecitos ligeros. Después dividieron las ratas en dos grupos. A

Figura 6.3

Una rata que oprime una barra dentro de una caja de Skinner. Éste es un ambiente artificial donde las luces, los sonidos, los premios y castigos pueden darse y controlarse y donde algunos de los comportamientos del animal, entre ellos la acción de oprimir una barra, se registran mediante conmutado-res automáticos.

algunas se les aplicaba una descarga eléctrica después que bebían. Todas estas ratas mostraron el condicionamiento clásico tradicional: las luces y los sonidos se convirtieron en estímulos condicionados, y trataban de evitarlos para no recibir descargas eléctricas. A otro grupo de ratas no se les aplicaron des-cargas, sino que se les inyectó una droga que las hacía vomitar después de beber, de que se encendían las luces y producían los golpecitos. Estos animales adquirieron una aversión, no a las luces ni a los sonidos, sino sólo al sabor del agua.

Esta relación especial entre comida y enfermedad se utilizó en un estudio (Gustavson y otros, 1974) en que se hizo que un grupo de coyotes odiaran el sabor del cordero, al suministrarles una droga que les provocaba nauseas cuando las devoraban. Se trata de una aplicación muy útil, porque a los que crían ovejas en la región occidental de Estados Unidos les gustaría acabar con los coyotes que depredan sus rebaños, si bien los ecologistas se oponen al exterminio de los coyotes. Los experimentadores comprobaron que podían adiestrar a estos animales para que comieran otras clases de carne, de modo que pudieran convivir pacíficamente con las ovejas.

CONDICIONAMIENTO OPERANTE

Supongamos que un perro recorre el vecindario, olfateando árboles, hurgando en la basura, buscando ardillas que cazar. Una persona muy amalbe lo ve y le arroja un hueso desde la puerta de la cocina. Al día siguiente, en su recorrido el animal seguramente se detendrá frente a la misma puerta, si es que no va directamente a ella. Si la misma persona le da otro hueso al día siguiente, y así sucesivamente, con el tiempo el perro se convertirá en un asiduo visitante.

Supongamos que un niño está triste porque su hermanita parece acaparar la atención de su madre. Comienza a manifestar su enojo y agredir a su hermana. De inmediato la madre deja de prestar atención a su hija para regañarlo. Aunque la atención de ella es negativa, al niño parece gustarle; poco tiempo después, vuelve a molestar a su hermana y recibe un regaño de su madre.

Las dos historias anteriores son un ejemplo del condicionamiento operante, es decir, del aprendizaje realizado a partir de las consecuencias del compor-

tamiento. El adjetivo «operante» se usa porque el sujeto (el perro callejero y el niño de los ejemplos) operan sobre el ambiente o producen algún cambio en él, obteniendo un resultado que influye en el he-cho de que en el futuro obren o no de la misma manera. Según el efecto de los comportamientos operantes, el sujeto los repetirá o suprimirá con tal de obtener premios o evitar el castigo.

El condicionamiento operante difiere del condicionamiento clásico en dos aspectos muy importan-tes. Primero, para que se realice, es preciso que el sujeto observe determinadas conductas que producen algunas consecuencias. El control del aprendiza-je está enteramente en sus manos. Si se niega a colaborar, el aprendizaje no se lleva a cabo.

Una segunda diferencia entre ambos tipos de condicionamiento se refiere a las clases de conducta que se adquieren. En el condicionamiento clásico, el aprendizaje se consuma mejor tratándose de un comportamiento automático y reflejo. En cambio, el condicionamiento operante no se limita a las respuestas reflejas, sino que puede consistir en aprender una amplia gama de conductas voluntarias.

Reforzamiento

Burrhus F. Skinner (1974) es el psicólogo a quien se asocia más estrechamente con el condicionamiento operante. Él y sus colegas pensaban que los antecedentes de los premios y castigos recibidos por el su-jeto influyen en casi todo su comportamiento. Supóngase que queremos enseñarle a un perro a saludarnos con la pata. Una forma de lograrlo es darle una palmadita en la cabeza o un trozo de carne cada vez que levanta su pata hacia nosotros. La palmadita y el trozo de carne son un reforzador positivo. En este ejemplo, el perro entenderá el mensaje y volverá a saludarnos a su manera para obtener otro premio. El reforzamiento es un estímulo o hecho que incide en la probabilidad de que se repita una conducta. La naturaleza del reforzamiento depende del efecto que ejerza sobre el sujeto. Entre los ejemplos de reforza-dores a los que respondemos se encuentran la aprobación social, el dinero y los privilegios especiales.

El perro dejará de saludarnos con la pata cuando olvidemos premiarlo por esa gracia y ya no le suministremos reforzamiento. Esa respuesta acabará por extinguirse pero tardará tiempo. De hecho, durante

Figura 6.4

La práctica es una parte importante en el proceso de aprender a tocar un instrumento musical. Los principiantes pasan largas horas practicando escalas y tonos simples. Una vez que dominan los aspectos básicos, pueden empezar a tocar melodías más complejas.

algún tiempo después de que hayamos suspendido el premio, el animal probablemente se mostrará impaciente, ladrará y nos alargará la pata con mayor insistencia que antes.

Programas de reforzamiento

Un factor importante del condicionamiento operan-te son el tipo y la frecuencia de reforzamiento. Podríamos suponer que la forma óptima de adquirir un comportamiento consiste en reforzar todas las res-puestas. A esto se le llama programa continuo. Sin embargo, los mejores resultados no se consiguen con este tipo de programa. Cuando el reforzamiento positivo se proporciona de manera intermitente o en un programa parcial, las respuestas suelen ser más estables y persistentes.

Pongamos, por ejemplo, el caso de dos máquinas de venta automática que se encuentran en la cafetería. Tú has visto que la primera de ellas siempre te proporciona la barra de dulce que seleccionaste. Nunca perdiste ninguna moneda; por el contrario, invariablemente recibiste un reforzamiento positivo (la barra de dulce). La segunda máquina es poco confiable. Algunas veces recibes la barra de dulce después de meterle monedas. Otras veces no obtienes nada: ni la barra de dulce ni el dinero. Ahora supongamos que cierto día descubres que la primera máquina no te proporciona la barra de dulce. ¿De cuál de las dos seguirás tratando de obtener el reforzamiento (la barra de dulce)? Probablemente no escojas la máquina más confiable, pues creerás que no conseguirás de ella la barra de dulce por mucho que lo intentes. Lo más seguro es que sigas introduciendo monedas en la segunda máquina, porque sabes que algunas ve-ces funciona bien. No te extrañará que algunas veces falle y esperarás que, tras algunos intentos, te proporcione lo que escogiste.

El ejemplo anterior muestra de qué manera el reforzamiento intermitente hace que las respuestas sean generalmente más estables que un programa continuo.

Aunque el reforzamiento intermitente puede organizarse de muchas maneras, en el laboratorio se han estudiado cuatro métodos (o programas) funda-mentales. Los programas pueden basarse en el número de respuestas correctas que el organismo emite entre los reforzamientos (programas de razón) o en la cantidad de tiempo transcurrido antes de admi‑

nistrar el reforzamiento (programas de intervalo). En uno y otro caso, el reforzamiento puede aparecer en un programa regular (fijo) o variable. Los cuatro pro-gramas fundamentales resultan de la combinación de estas cuatro posibilidades. Las personas responden de modo distinto a cada uno de ellos.

En un programa de razón fija, el reforzamiento depende de la cantidad especificada de respuestas; por ejemplo, premiar una de cada cuatro respuestas. Este programa se aplica cuando el estudiante recibe una buena calificación luego de terminar cierta cantidad de trabajo y cuando a una mecanógrafa le pagan por el número de páginas hechas. Se tiende a trabajar más con este tipo de programa, haciendo una breve pausa tras cada premio. Pero si es grande la cantidad de trabajo o el número de respuestas que han de concluirse antes del siguiente premio, el estudiante o el trabajador a destajo muestran poco entusiasmo y menos respuestas al inicio de cada ciclo, ya que les queda un largo camino por recorrer para recibir el siguiente reforzamiento.

Un programa de razón variable requiere que se emita un número promedio de respuestas por cada reforzamiento. En lugar de un número fijo, como en el caso del programa anterior, las respuestas que se necesitan para el reforzamiento cambia de una vez a la siguiente. Las máquinas tragamonedas constituyen un buen ejemplo de razón variable, listan programadas para premiar luego de un número variable de intentos. A los jugadores no les interesa esta característica y siguen introduciendo monedas a un ritmo estable, creyendo (erróneamente) que cuantas más metan mayores probabilidades tendrán de ganar. Los operadores de los casinos alientan esta respuesta obsequiándoles fichas a los novatos. En términos generales, los programas de razón variable tienden a hacer que el sujeto trabaje o responda a un alto ritmo constante.

En un programa de intervalo fijo, el reforzamiento se administra al cabo de un periodo previamente determinado. Puede darse después de determinado número de minutos, horas o días, pero el intervalo siempre es el mismo. Cuando se recurre a esta clase de programa, las personas suelen disminuir la res-puesta inmediatamente después del reforzamiento, pero al acercarse el final del intervalo aumenta rápidamente el ritmo de la respuesta. Los empleados a quienes se les paga los jueves se sentirán más motivados para ir a trabajar en las mañanas de ese día

CAPÍR1LO 6 / APRENDIZAJE: PRINCIPIOS Y APLICACIONES

Figura 6.5

El pichón muestra las señales de perturbación emocional que suelen observarse en la extinción de una respuesta de condicionamiento operante. Lo adiestraron para obtener comida del hoyo cuadrado picoteando la llave colocada en el hoyo redondo. Cuando el experimentador apagó el circuito que hacía funcionar el mecanismo, el animal picoteaba la llave unos momentos y luego, al no encontrar comida, comenzaba a saltar alrededor y a agitar las alas.

(día del pago) que el viernes (el día después del pago). Por lo regular, el ausentismo es mucho menor en los días de pago.

En un programa de intervalo variable, el tiempo en que se obtendrá el reforzamiento varía a lo largo del procedimiento condicionador. Un ejemplo sería la llamada telefónica de un posible empleador, llamada que esperamos pero sin que sepamos cuándo la recibiremos. Seguramente durante horas correremos a contestar el teléfono, para que ningún miembro de la familia conteste antes, a pesar de que no sepamos si la llamada es o no el reforzador (la llama-da del empleador). Sin importar cuánto tiempo sigamos observando este comportamiento, no podremos aumentar las probabilidades de escuchar su voz. Continuamos contestando el teléfono, porque sabemos que tarde o temprano recibiremos la tan ansiada llamada. De manera semejante, una paloma que está sometida a un programa de intervalo variable, tenderá a picotear la llave mucho más regularmente que la que siga un programa de intervalo fijo, por-que ignora cuánto tiempo tardará en recibir el reforzamiento.

En resumen, los programas de razones se fundan en números de respuestas mientras que los de interva‑

los se basan en el tiempo. En términos generales, las respuestas se aprenden mejor y son más resistentes a la extinción cuando sé refuerzan recurriendo a un programa de razón variable y no a uno de razón fija. No obstante, si queremos que el reforzamiento sea eficaz (tratándose incluso del castigo), ha de aplicar-se siempre al mismo tipo de comportamiento aun-que no necesariamente deba darse cada vez que se realiza. En las relaciones humanas, la mayor parte de los reforzadores siguen un programa variable por la complejidad de la conducta y porque es imposible predecir cómo interactuará la gente.

Señales

En el condicionamiento operante, los estímulos que se asocian con un premio o castigo se convierten en señales de un comportamiento en particular. Por ejemplo, aprendemos a cruzar la calle sólo cuando el semáforo está en verde y contestamos el teléfono sólo cuando suena. Estas señales indican simplemente que, si cruzamos la calle o contestamos el teléfono, obtendremos un reforzador que consiste en llegar sin problemas al otro lado de la calle o en escuchar una voz en el teléfono.

Del mismo modo que los organismos generalizan y discriminan los estímulos condicionados del condicionamiento clásico, también hacen lo mismo con los estímulos que sirven de señales en el condiciona-miento operante. Por ejemplo, el niño a quien se le ha premiado por decir «perrito» cada vez que ve al perro basset de la familia generalizará y dirá esa misma palabra cuando vea una oveja, una vaca o un caballo. Estos animales se parecen lo bastante a ese tipo de animal como para transformarse en señales de que «perrito» producirá el premio. La discriminación se realiza cuando «perrito» deja de producir un premio en estos casos. El niño aprende a limitar el uso de la palabra a los perros y a responder de manera diferente cuando vea una oveja, el ganado o caballos.

Puesto que las señales son guías para obtener premios y castigos en el futuro, a menudo se convierten en premios o sanciones por sí mismos. En tales casos, a la señal se le llama reforzador condicionado por-que, en ausencia del proceso de condicionamiento, sería un estímulo neutral sin valor positivo ni negativo para la persona. A través del condicionamiento, casi todo estímulo puede adquirir prácticamente cualquier valor.

Un experimentador (Wolfe, 1963) demostró lo anterior con un grupo de chimpancés. Las fichas de póquer no tienen valor alguno para estos animales: no pueden comerse y tampoco es muy divertido jugar con ellas. No obstante, el experimentador se sirvió del condicionamiento operante para enseñarles a

Figura 6.6

Uso del Chimp-o-Mat para ^«comprar^« cacahuates y plátanos con fichas de póquer, obtenidas al jalar hacia abajo una barra pesada. Por medio del condicionamiento operante, este chimpancé había aprendido a apreciar un objeto que no era comestible ni servía para divertirse.

apreciarlas tanto como el ser humano aprecia el dinero. Les dio un «Chimp-O-Mat», aparato que distribuía cacahuates o plátanos, que son reforzadores primarios o naturales (a los chimpancés les gustan estos alimentos). Si querían obtener comida, debían empujar hacia abajo una barra muy pesada para obtener fichas de póquer y luego meterlos en la ranura de la máquina. Con el tiempo las fichas se convirtieron en los reforzadores condicionados. Su valor era evidente ya que los chimpancés trabajaban para con-seguirlos, los ahorraban y, algunas veces, intentaban robárselos a los otros.

No sólo entre los animales hallamos ejemplos de este fenómeno. Las sonrisas tienen poco valor para los recién nacidos, y las palabras de aprobación carecen de significado para ellos. Pero con el tiempo aprenden que esas expresiones y sonidos significan que un adulto va a tomarlos en brazos, a mecerlos y, quizá, a alimentarlos (reforzadores primarios). Las sonrisas y los sonidos de aprobación son señales de un premio. Después de cierto tiempo, los niños comienzan a apreciar las sonrisas, el elogio y otras modalidades de aprobación social por sí mismos.

Control aversivo

Muchas veces con el término «reforzamiento» designamos exclusivamente las consecuencias agradables de un comportamiento. Los psicólogos, en cambio, lo utilizan para referirse a cualquier cosa que acreciente la frecuencia de una conducta. Las consecuencias desagradables o aversivas (en contraste con las placenteras) influyen gran parte de nuestra actividad diaria. El control aversivo denota este tipo de condicionamiento o aprendizaje. Hay dos formas en que los hechos desagradables, o estímulos aversivos, in-fluyen en el comportamiento: como reforzadores negativos o como sanciones.

Reforzamiento negativo. En el reforzamiento negativo, un estímulo doloroso o desagradable se elimina o no se aplica en absoluto si se realiza cierta clase de comportamiento. La supresión de las consecuencias negativas aumenta la frecuencia de un comporta-miento. Hay dos tipos de aprendizaje por reforza-miento negativo que los psicólogos han estudiado a fondo: condicionamiento de escape y condiciona‑

Figura 6.7

Una rata realiza la elección correcta en una prueba realizada en la plataforma de salto de Lashley. El aprendizaje es rápido en este aparato, porque una decisión incorrecta acarrea consecuencias negativas: la rata se golpea la nariz contra la puerta cerrada (la de franjas horizontales, en este caso) y cae a la red colocada debajo.

Figura 6.8

Análisis de los factores que influyen en la relación entre el comportamiento de un niño y el de sus padres (de la parte izquierda a la derecha y de la parte superior a la inferior). El niño está a punto de realizar una actividad positiva reforzadora (jugar en el lodo), pero sus padres emiten una conducta (le prohíben jugar en el lodo). El niño castiga esa prohibición con un estímulo aversivo (un violento berrinche). Su prohibición pierde fuerza y terminan accediendo. A continuación la terminación del berrinche aversivo refuerza esta conducta de los padres. El berrinche del niño ha sido reforzado positivamente con el hecho de jugar en el lodo. El resultado de este proceso de condicionamiento es que ahora hay mayores probabilidades de que el niño haga berrinches y de que los padres le permitan jugar en el lodo. El nuevo comportamiento puede generalizarse a otras situaciones nuevas que sean semejantes.

no le guste. Este tipo de aprendizaje se denomina condicionamiento de escape, porque la conducta le ha permitido al niño no comer el hígado.

En el condicionamiento de evitación, con el comportamiento se logra que no ocurra una situación des-agradable. Por ejemplo, si en el pasado los lloriqueos y las náuseas del niño han hecho que la madre ni si-quiera le sirva el hígado, estaremos frente a un condicionamiento de evitación; el niño habría evitado de antemano las consecuencias desagradables.

El castigo. La forma más evidente del control aversivo no es el reforzamiento negativo, sino el castigo. Si quieres que un perro deje de tocarte con la pata cuan-do desea que le prestes atención, deberás prestársela y al mismo tiempo darle en el lomo un golpe con un periódico. A estas acciones se les llama sanciones.

Igual que en el caso de los reforzadores, los hechos o acciones que sirven de sanciones se basan en el efecto que produzcan en el sujeto. En el ejemplo de condicionamiento operante con que se inicia la sección sobre este tema, las reprensiones de la madre que debían ser sanciones fueron en realidad reforza-dores por el efecto en el niño, quien deseaba su atención. Tal vez enviarlo a su cuarto cada vez que molestara a su hermana hubiera sido un castigo apropiado; este estímulo desagradable habría hecho que no repitiera su conducta negativa.

En el castigo, la consecuencia desagradable se presenta y disminuye la frecuencia del comporta-miento que la ocasionó. El reforzamiento negativo y el castigo operan en sentido contrario: en el primero se repite el comportamiento de escape o evitación y en el segundo el comportamiento que se castiga deja de repetirse.

Los psicólogos han encontrado varias desventajas en el empleo de estímulos aversivos para modificar la conducta. Ante todo, pueden causar efectos secundarios indeseables: ira, agresión y miedo. Y además, en vez de tener que modificar esa conducta, tal vez haya que cambiar dos o más. Por ejemplo, los niños cuyos padres recurren al castigo físico (las zurras) para controlar la desobediencia posiblemente después habrán de resolver el problema de una mayor agresividad en contra de otros niños.

Un segundo problema de los estímulos aversivos radica en que la gente aprende a evitar a la persona que les produce consecuencias negativas. En los casos de padres o maestros que castigan con frecuen‑

cia, los niños aprenden a mantenerse alejados de ellos. Una consecuencia de ello es que los padres y maestros tendrán menos oportunidad de corregir la conducta incorrecta de los hijos y alumnos. Por lo demás, el castigo tiende a suprimir y no a erradicar las conductas indeseables.

FACTORES QUE INFLUYEN
EN EL APRENDIZAJE

Los estudios sobre formas más complejas del aprendizaje han revelado que varios factores los favorecen o dificultan. Entre ellos cabe mencionar la retroalimentación, la transferencia y la práctica.

Retroalimentación

La retroalimentación consiste en averiguar los resultados de una acción o desempeño. Sin ella, cabe la posibilidad de repetir tantas veces los mismos erro-res que podría adquirirse incorrectamente una habilidad: nunca sabríamos si nos hemos equivocado o no. Y aun cuando obráramos de manera correcta, no recibiríamos reforzamiento para seguir haciéndolos. Por ejemplo, si te pusieras audífonos siempre que practicas un instrumento musical, nunca sabrías la calidad con que ejecutas una pieza.

Transferencia

Muchas veces una habilidad que ya se aprendió ayuda a adquirir otra. Si aprendiste a tocar la guitarra, te será bastante fácil aprender a tocar la mandolina. En estos casos transfieres destrezas que ya dominas, como leer las notas y convertirlas en respuestas de los dedos. Cuando las respuestas previamente aprendidas ayudan a aprender una nueva destreza, a esto se le llama transferencia positiva.

Si una destreza ya aprendida obstaculiza el aprendizaje de otra, se dice que ha habido transferencia negativa. A un estadounidense le será más difícil conducir en Inglaterra que a un inglés que apenas empieza a aprender a manejar. En Inglaterra, el volante se encuentra en el lado derecho del automóvil y se conduce por la izquierda de las calles. La habilidad consistente en conducir al estilo americano dificulta

la realización de nuevas tareas mentales y motoras. A menudo las respuestas de los estadounidenses son totalmente contrarias a lo que se necesita.

Práctica

La práctica, es decir, la repetición de una tarea, contribuye a integrar las respuestas. Es el elemento clave que produce un movimiento suave y fluido de una respuesta a la siguiente.

Dado que la práctica tarda tiempo, los psicólogos quieren saber cómo utilizar el tiempo lo más eficientemente posible. Han comprobado que, cualquiera que sea el tipo de habilidad que se está aprendiendo, casi siempre es mejor espaciar la práctica y no realizarla toda de una sola vez.

La práctica puede hacerse imaginando que uno está ejercitándose en una habilidad. Los atletas se imaginan efectuando los tiros de golf una y otra vez o que lanzan un balón de básquetbol para mejorar su tiro. A esto los psicólogos lo llaman práctica mental. Aunque no es tan eficaz como la práctica real, es mejor que nada.

ESTRATEGIAS DE APRENDIZAJE

Sería difícil resolver un problema si tuviera que re-aprenderse el proceso de solución cada vez que se presente uno. Por fortuna, cuando se aprende a resolver un problema, algunas de las experiencias relacionadas con el proceso se transfieren a otros problemas semejantes. Una vez que se aprenden ciertas estrategias para llegar a la resolución y algunas técnicas de aprendizaje, las cosas se facilitan en la siguiente ocasión. Las consecuencias influyen en las estrategias, lo mismo que en reacciones menos complejas. Si una estrategia da buenos resultados, la persona o el animal tenderán a utilizarla la siguiente vez. Muchos principios adquiridos para hacer frente a la vida son útiles, otros más bien constituyen un obstáculo.

Aprendiendo a aprender

Harry Harlow (1949) demostró que los animales pueden aprender a aprender: aprenden a aplicar estrate‑

gias para resolver problemas y tareas similares. Dio a un mono el problema de encontrar una ciruela pasa que estaba debajo de una de dos tapas, Una roja y una verde. La ciruela pasa siempre estaba escondida bajo la tapa verde. El experimentador cambiaba constantemente de lugar las tapas y por ello el mono tardaba un poco en darse cuenta de que el color era lo importante, no la ubicación.

Una vez que el mono aprendía a escoger invariablemente la tapa de color verde, el experimentador modificaba el problema. Ahora el animal debía escoger entre tapas de forma triangular y circular. La ciruela pasa siempre se hallaba debajo de la tapa circular, y de nuevo el experimentador cambiaba el lugar de las tapas en cada intento. Una vez más el mono realizó varios intentos antes de aprender que la forma de la tapa, no su ubicación, indicaba dónde estaba la fruta. Tras resolver varios problemas de este tipo, comenzó a aprender que la diferencia entre las dos tapas era la clave del problema. Con el tiempo lograba resolver cualquier problema de doble opción, cometiendo generalmente dos errores a lo Sumo.

El aprendizaje de estrategias y principios es extremadamente importante en el comportamiento humano. En la escuela se practican habilidades como la lectura de libros, la preparación de trabajos escritos y la realización de exámenes. Muchas veces lo que se aprende será menos importante y útil que lo que se aprende acerca del proceso adquisitivo en general. Así, aprender a extraer información de un libro servirá siempre, trátese de un libro de física, de gramática o de cocina. Del mismo modo que el mono de Harlow aprendió un método general para resolver rápidamente problemas concretos, también nosotros podemos adquirir una estrategia general para aprender determinados trozos de información.

Desvalidez y pereza

Los psicólogos han demostrado que las estrategias generales del aprendizaje inciden en la relación con el ambiente. Por ejemplo, si alguien pasa por numerosas experiencias en las cuales sus acciones no tienen el menor efecto en su mundo, aprenderá una estrategia general de desvalidez o pereza (impotencia). Martin Seligman llevó a cabo experimentos para demostrar cómo la des validez aprendida a parece en los animales. Sujetó a varios perros en un arnés del cual no podían escapar y luego les aplicó una serie

Flgura 6.9

Harry Harlow presentó a un grupo de monos varios pares de tapas como las de la figura y los hizo aprender estrategias para determinar cuál tapa de cada par cubría un bocado de comida. Luego de resolver algunos centenares de este tipo de problema, los monos aprendieron a aplicar la misma estrategia para encontrar el bocado debajo de cada nuevo par de tapas.

de descargas a intervalos regulares. Después de algunos días de administrarles este tratamiento, desató a los perros. Ahora podían escapar de las descargas o evitarlas enteramente con sólo saltar una valla para llegar a un compartimiento seguro. Más de la mitad de los animales no logró aprender a saltar. Cuando se realizaron pruebas en animales a los cuales no se les había aplicado descarga alguna, casi todos ellos aprendieron a saltar para escapar. Por lo visto, muchos de los perros del primer grupo habían aprendido a no moverse y soportar las descargas, resignados al hecho de que sería en vano cualquier intento por escapar.

Experimentos posteriores revelaron que el ser humano reacciona de la misma manera. En la primera etapa de un estudio (Hiroto, 1974), algunos estudiantes universitarios aprendían a apagar un ruido desagradable y fuerte, mientras que otros no tenían control sobre él. Más tarde, todos fueron puestos en una situación donde bastaba que movieran una pa‑

lanca para detener un ruido parecido. Sólo los que habían tenido control sobre el ruido aprendieron a tirar de ella. El resto de los estudiantes ni siquiera se tomó la molestia de probar.

Es evidente cómo podemos aplicar los resultados anteriores a la vida diaria. No podremos poner todo nuestro empeño y energía en una empresa cualquiera, si no aprendemos que nuestras acciones «/’influyen en la situación. Cuando los premios se consiguen sin esfuerzo de nuestra parte, el individuo nunca aprenderá a trabajar (pereza aprendida). Y simple-mente desistirá cuando sobreviene el dolor por más que tratemos de evitarlo.

En opinión de Seligman, la desvalidez aprendida es una de las causas principales de la depresión. Re-visó después la teoría (Abramson, Seligman y Teas-dale, 1978; Miller y Seligman, 1982), de modo que ahora está más completa y detallada que su teoría inicial, la cual se basaba fundamentalmente en estudios con animales de laboratorio. Sostiene que, cuan-do el ser humano no puede controlar los eventos de su vida, generalmente responde en una de las siguientes formas: puede sentirse menos motivado para actuar y, por tanto, desiste. Tal vez le sea difícil aprender a producir otros resultados y deje de pensar. Puede experimentar una disminución de su autoestima; así que tendrá pensamientos negativos acerca de sí mismo. Y, finalmente, también puede sufrir una de-presión.

Seligman identificó tres elementos importantes de la desvalidez: estabilidad, gJobalidade intemalidad. La estabilidad designa la creencia de que el estado de desvalidez se deba a una característica permanente. Por ejemplo, un estudiante que reprueba en un examen de matemáticas tal vez decida que el problema es temporal («Salí mal en el examen de matemáticas porque estaba enfermo») o estable («Nunca he tenido ni tendré éxito en los exámenes de matemáticas»). De manera análoga, pensará que el problema es específico («No soy bueno para los exámenes de matemáticas») o global («Soy un tonto»). Tanto la estabilidad como la globalidad se centran en el estudiante, es decir, en las causas internas del fracaso. El estudiante pudo haber pensado que el problema no era interno, sino externo («No era un buen examen de matemáticas»). Los que atribuyen resultados negativos a sus propias deficiencias seguramente sufran depresión, junto con sentimientos de culpabilidad. Y sufrirán una severa depresión quienes atri-

PSICOLOGÍA EN EL MUNDO CONTEMPÓRANEO

Cómo moldear comportamientos complejos en los animales. Los psicólogos se valen del moldea-miento para condicionar patrones conductuales muy complicados en los animales. Han logrado enseñarles a los pichones a jugar ping-pong y tocar canciones en un piano pequeño. Durante la Primera Guerra Mundial, los ingleses adiestraron a gaviotas para que descubrieran los submarinos enemigos en el Canal de la Man‑

cha. Para realizar el adiestramiento, enviaban sus propios submarinos hacia el canal, dejando caer comida en la superficie del mar. Las gaviotas pronto comenzaron a seguir los submarinos desde el aire sin la presencia de la comida, y el hecho de que volaran gaviotas sobre el canal era una señal de la posible presencia de submarinos alemanes.

Durante la Segunda Guerra Mundial, B. F. Skinner participó en un proyecto que consistía en entrenar a pichones para que guiaran los misiles hacia los blancos enemigos. Los pichones fueron reforzados gradual-mente para que picotearan las imágenes de los blancos enemigos proyectados sobre una pantalla. Aunque estas «armas secretas» realizaban la maniobra con mucha exactitud, nunca se utilizaron en combate En fecha más reciente, la armada estadounidense adiestró a los delfines para detectar al enemigo y las minas submarinas. A los leones submarinos se les ha enseñado a recuperar cohetes antisubmarinos para que la armada pueda evaluar su capacidad destructora.

buyan sus problemas a deficiencias personales y consideren que éstas constituyen rasgos permanentes que se aplican a todos los casos.

La revisión de la teoría de Seligman es importan-te por ser un buen ejemplo de las nuevas tendencias del conductismo. Conforme los teóricos del aprendizaje han empezado a estudiar los seres humanos más que los animales, se dan cuenta de que algunos de los viejos modelos del comportamiento son demasiado simplistas porque se centran exclusivamente en lo que las personas hacen. También es importante lo que piensan.

APRENDIZAJE DE HABILIDADES
COMPLEJAS

Cuando se adquiere una habilidad (bordado, foto-grafía, lanzar un balón de basquetbol o hablar en forma persuasiva), se aprende algo más que una nueva relación individual entre estímulo y respuesta. Se aprenden varias de ellas y la manera de integrarlas a una unidad más grande que fluye armoniosamente. Los psicólogos estudian de manera exhaustiva la forma en que se adquieren nuevas respuestas y se incorporan a habilidades complejas.

El moldeamiento es un proceso en virtud del cual se emplea el reforzamiento para crear nuevas respuestas a partir de las ya existentes. Con este método un experimentador enseñó a una rata a hacer algo que nunca antes había hecho y que jamás haría si no se le hubiera enseñado. Puede moldearla para que, por ejemplo, levante una bandera en miniatura. El animal tiene la estructura física adecuada para pararse sobre sus patas traseras y utilizar su boca para jalar una cuerda que levante una bandera en miniatura, pero en el momento actual no lo hace. Y como seguramente no ejecutará maniobra tan difícil por mero accidente, el experimentador comienza premiándola por cualquier acción semejante a las respuestas deseadas, administrando después el reforzamiento para obtener aproximaciones sucesivas —cada vez más cercanas— al comportamiento deseado. Lo mismo sucede con el canario que elige un papelito (cuyo contenido predice la suerte), o bien toca una campanita o se pone un sombrerito para recibir como premio un alpiste y después regresar a su jaula.

Imagina una rata que recorre una mesa en cuyo centro se halla la bandera. El animal observa todo con atención y finalmente olfatea el asta. De inmediato el experimentador refuerza la respuesta y le da al animal una píldora de comida. Después, olfatea frecuentemente el asta con la esperanza de recibir otra pildora, pero el experimentador aguardad hasta que

Flgura 6.10

Los psicólogos moldean el comportamiento por medio del reforzamiento para crear nuevas respuestas a partir de las anteriores. Esta maestra está moldeando el comportamiento al enseñarle a una preescolar discapacitada a andar en bicicleta.

la rata levante una pata antes de darle otro premio. El proceso prosigue: el experimentador refuerza las respuestas apropiadas y luego espera otras más cercanas a la que desea enseñarle. Con el tiempo la rata termina sosteniéndose en las patas traseras y mordisqueando el cordón. Al instante recibe el premio y empieza a jalar rápidamente la cuerda. Así ha que-dado moldeada una nueva respuesta.

Se ha aplicado el moldeamiento para enseñar habilidades lingüísticas a los niños con deficiencias. Al principio los psicólogos los premian por emitir sonidos tan simples como «ma». Más tarde se les premia sólo cuando emiten palabras completas como «sopa» y luego por producir oraciones completas como «Sopa, por favor». Con este método muchos niños

han logrado aprender a usar los rudimentos del len-guaje (Lovass y otros, 1967).

Combinación de respuestas: encadenamiento

Si queremos aprender una habilidad, debemos integrar varias respuestas nuevas. Las que se emiten una tras otra en una secuencia se organizan en cadenas de respuestas. Cada respuesta produce la señal para emitir la siguiente. Por ejemplo, para clavar un clavo en una madera con un martillo se integra esta cadena de respuestas: se toma el martillo, se toma el clavo, se coloca en posición el clavo, se mueve el martillo, se golpea el clavo, se mueve el martillo, se golpea el clavo y así sucesivamente hasta que el clavo penetre totalmente en la madera. Cada golpe sobre el clavo es una señal de que estamos realizando bien la maniobra y cuando está al ras con la superficie de la madera sabemos que ya no se requieren más res-puestas.

En el aprendizaje, las cadenas de respuestas se organizan en patrones más grandes de respuestas. Por ejemplo, la compleja habilidad de nadar consta de tres grandes cadenas que se combinan para conformar el patrón total del nado: una cadena de bracea-das, una cadena de respiración y una cadena de pataleo. Tras muchas horas de práctica, el nadador ya no necesita pensar en los pasos de esta habilidad. El comportamiento de nado se rige por su propio ritmo: las cadenas de respuestas fluyen espontáneamente en cuanto se mete en el agua.

A menudo hay que aprender las respuestas simples antes de dominar el patrón complejo. Si no sabe pegarle al clavo con un martillo, menos podrá construir una casa. Por tanto, antes de poder realizar una habilidad en particular, hay que aprender todas las destrezas o pasos subordinados que la hacen posible.

MODELACIÓN

Hasta ahora tenemos la impresión de que hay tan sólo dos tipos de aprendizaje: las respuestas emociona-les, condicionadas por la estrecha asociación de un estímulo neutral con otro no condicionado; las res-puestas operantes, que se aprenden por medio de pre-

Figura 6.11

Cuando se aprende una habilidad, las respuestas que se emiten en secuencia se Integran en cadenas y éstas a su vez se organizan después en patrones de respuesta. La compleja habilidad del nado consta de tres partes fundamentales: brazada, respiración y pataleo.

mios o castigos. Sin embargo, las observaciones informales que se efectúan a lo largo de la vida sobre el aprendizaje indican que no se limita a estas modalidades: de hecho, las más de las veces aprendemos imitando a otros. Esto se da especialmente tratándose de respuestas sociales: en ellas aprendemos a comportarnos en una nueva situación observando la conducta de los demás. Cuando por primera vez asistimos a un concierto, no sabremos a dónde ir, cuándo entrar (especialmente si llegamos tarde a la función), cuándo aplaudir, cómo conseguir un mejor asiento después del primer intermedio. Así pues, observamos a la gente, la imitamos y muy pronto somos verdaderos expertos.

Cabría suponer que también se realizan por imitación las formas más básicas del comportamiento,

cuando se requiere la respuesta apropiada para la supervivencia. El aprendizaje por tanteo (por intento y error) no es útil, si el castigo por no emitir la respuesta consiste en ser devorado por un depredador. En conclusión, el comportamiento de evitación a veces se aprende por imitación.

Modelación es el término general con que se de signa este tipo de aprendizaje. Abarca tres tipos de efectos. En el caso más simple, el comportamiento aje no no hace más que aumentar las probabilidades de que hagamos lo mismo que ellos. Aplaudidnos cuan do la gente lo hace, dirigimos la vista hacia la parte superior de un edificio cuando todo mundo lo hace y copiamos los estilos y las expresiones verbales de quienes nos rodean. En este caso no se realiza aprendizaje alguno, en el sentido de adquirir nuevas res puestas. Nos limitamos simplemente a emitir respuestas anteriores que tal vez utilizaríamos en casos similares.

El segundo tipo de modelación se llama aprendizaje por observación, o imitación. En él urja persona ve a un modelo realizar un comportamiento y más tarde logra reproducirlo con mucha fidelidad, aun-que no podía hacerlo antes de observar e1 modelo. Un ejemplo consiste en ver, por televisión o en una película, que alguien utiliza una herramienta desconocida y después manejarla uno mismo.

Un tercer tipo es la desinhibición. Cuando una persona ve a alguien llevar a cabo una actividad re-probable sin que lo castiguen, tal vez le sea más fácil reproducirla más tarde. Por ejemplo, supóngase que un individuo sufre fobia a las serpientes y ve a otro tomarlas con la mano. Tal espectáculo aliviará la fobia. Este procedimiento se emplea en el trabajo clínico.

¿Qué sucede cuando un observador aprende viendo? Según los primeros teóricos, el hombre posee una especie de «instinto» de imitación y, efectivamente, es probable que algunos animales sí imiten de modo automático, especialmente cuando son muy jóvenes y tienen siempre tan buenos modelos cerda de ellos: su padres. Los teóricos del condicionamiento operan-te como Skinner sostienen que la imitación es ya una respuesta, la cual a menudo es reforzada porque da excelentes resultados. Dicho con otras palabras, el comportamiento ajeno cumple la función se estímulo discriminativo cíe una especie de comportamiento de pareamiento, que luego se refuerza porque influye en el ambiente o porque otros tienden a reforzar dicho apareamiento (como cuando una madre elogia al hijo por imitar correctamente sus palabras).

más SOBRE PSICOLOGÍA

Aprendizaje espacial. Tanto el condicionamiento clásico como el operante giran en torno al tiempo. En la demostración del condicionamiento clásico efectuada por Pavlov, el sonido del diapasón antecedía a la comida. En el condicionamiento operante, el perro que recibe comida como premio después de alzar la pata aprende a «dar la mano».

Además de estas dos clases de condicionamiento, los psicólogos han estudiado una tercera modalidad —el aprendizaje espacial—que consiste en aprender la ubicación de los objetos en el ambiente. Los que lo estudian afirman que el ser humano explora su ambiente y se forma, mapas cognitivos internos. Estos mapas sirven para dominar los ambientes nuevos. ¿Recuerdas cuan confusa te parecía la escuela en tu primer día de clases? Pero rápidamente te formaste un mapa cognitivo, y este aprendizaje espacial explica por qué ahora podrías recorrerla con los ojos vendados.

Los psicólogos han descubierto que el aprendizaje espacial se da no sólo en el hombre, sino también en los animales. En su opinión, las mapas cognitivos explican el hecho de que los chimpancés aprenden pronto a encontrar la comida oculta en un área, las ratas aprenden a recorrer un laberinto y las abejas no se pierden en su regreso a la colmena.

¿REALIDAD O MITO?

La mayor parte de los psicólogos piensan que los alcohólicos pueden «aprender» a ser bebedores sociales.

Mito. En general, han sido en vano los intentos realizados por aplicar la modificación del comportamiento

a los alcohólicos y enseñarles a ser bebedores sociales. Los psicólogos piensan que el alcohólico simplemente no puede aprender a beber con moderación. Por tanto, los intentos de modificar su comportamiento casi siempre consisten en abstenerse totalmente de ingerir bebidas alcohólicas como primer e indispensable paso en el camino de la recuperación.

A utocontrol

En las economías de fichas, el investigador establece un complejo sistema de reforzadores para que las personas observen la conducta que él desea. Una de las tendencias más importantes de la modificación del comportamiento consiste en pedirles que creen sus propios sistemas de premio y castigo para moldear sus pensamientos y acciones.

Antaño los conductistas limitaban sus estudios a la conducta observable y se esforzaban poco por observar o cambiar la forma de pensar de la gente. Más tarde, a medida que un mayor número de investigadores del comportamiento empezó a estudiar al ser humano (en vez de concentrarse exclusivamente en los animales), se comprobó que lo que la gente hace

no es más que una parte de la realidad. Por ejemplo, como vimos en páginas anteriores, Martin Seligman amplió recientemente su teoría de la desvalidez aprendida para explicar por qué algunos sufren depresiones durante mucho tiempo y otros parecen superarlas. En parte la diferencia, asegura Seligman, se basa en lo que pensamos, es decir, en la manera de interpretar nuestros fracasos.

Como en toda aplicación de la modificación del comportamiento, el primer paso del autocontrol consiste en definir el problema. Si alguien fuma demasiado, deberá alentársela a contar cuántos cigarros consume cada hora del día y a fijarse en qué tipo de situaciones lo impulsa a fumar. (¿Después de la comida? ¿Cuándo habla con los amigos? ¿Cuando conduce el automóvil?) De manera análoga, si alguien tiene una mala opinión de sí mismo, habrá de definir el problema más concretamente. Podría empezar contando la cantidad de sus comentarios y pensamientos de menosprecio para sí mismo. Los investigadores han comprobado que el simple hecho de que el individuo lleve este tipo de registro de su conducta lo impulsa a veces a cambiarla.

El siguiente paso puede consistir en establecer un contrato para un solo comportamiento. Una persona a quien le encantaban los refrescos y le era difícil dedicarse al estudio decidió tomar un refresco sólo después de estudiar media hora. La adicción a este refresccj) mantuvo su fuerza, pero con este sistema aumentó drásticamente el tiempo que dedicaba a su estudio. Un contrato conductual consiste simplemente en seleccionar un reforzador (compaprar una camisa nueva, ver el programa favorito de televisión) y condicionarlo a alguna acción necesaria pero desagradable (llegar a tiempo al trabajo, limpiar el piso de la cocina). Los contratos tienen mayores probabilidades de éxito, si se recurre a aproximaciones sucesivas: comenzar con una tarea fácil y gradualmente irla haciendo más difícil. Por ejemplo podrías empezar a estudiar diez minutos antes de premiarte y luego aumentar poco a poco el tiempo de estudio hasta llegar a una hora.

Los modificadores del comportamiento están diseñando y probando muchas otras técnicas que nos ayudarán a aprender a controlarnos.

Cómo mejorar los hábitos de estudio

Un psicólogo diseñó un programa para ayudarles a los estudiantes a mejorar sus hábitos de estudio y lo probó en un grupo de voluntarios. A los alumnos se les indicó fijarse una hora en que irían a un pequeño cuarto de la biblioteca que nunca antes habían usado y que tomaran únicamente los materiales que quisieran estudiar. Después debían trabajar sólo mientras persistiera su interés y ni un minuto más. En cuanto se dieran cuenta de que empezaban a inquietarse, a soñar despiertos, a adormilarse o aburrirse, debían tomar la decisión de dejar de estudiar. Ésta no era más que una condición. Tenían que leer una página más o resolver ctro problema simple antes de dejar la biblioteca. Aunque esto despertara en ellos el deseo de estudiar más, se les indicó que debían mantener la decisión de abandonar la biblioteca, irse a tomar una taza de café, visitar a un amigo o hacer cualquier otra cosa quiquisieran.

Al día siguiente se les pidió repetir el mismo procedimiento, agregando una segunda página a lo que habían leído entre el momento de decidir marcharse y el momento en que realmente lo hacían. En el tercer día leían una página más y así sucesivamente. Los que siguieron este procedimiento observaron que con el tiempo podían estudiar periodos más largos que antes, que estudiaban mejor y que no les molestaba estudiar tanto.

¿Por qué dio buenos resultados este procedimiento? Muchos de los alumnos se obliga-ron a sí mismos a estudiar. Una técnica común consiste en acudir a la biblioteca para evitar

distracciones. El resultado puede ser pasar horas viendo un libro sin leerlo. La imposibilidad de lograr algo y la incomodidad hacen del estudio un verdadero tormento. La biblioteca se convierte en el estímulo aversivo condicionado: los estudiantes la odian porque pasan allí mucho tiempo. Se diseñó el procedimiento para cambiar esa actitud.

El exigirles abandonar la biblioteca en cuanto se sintieran distraídos contribuyó a atenuar las emociones negativas y punitivas asociadas al estudio. Los alumnos dejaban de leer cuando aparecían esos sentimientos. El hecho de estudiar en un sitio nuevo suprimía el estímulo aversivo condicionado. Así, las respuestas aversivas no quedaron condicionadas a la asignatura ni a la sala, como sucedía cuando los estudiantes se imponían la obligación de trabajar.

Segundo, en el procedimiento se utilizaban las aproximaciones sucesivas. Los alumnos comenzaban leyendo una página después de empezar a aburrirse y poco a poco aumentaban la tarea. Con ello aminoraban la respuesta aversiva ante el estudio. La tarea ya no les parecía tan difícil.

Finalmente, cuando dejaban de trabajar, recibían dos tipos de reforzamiento positivo: tenían la satisfacción de saber que habían cumplido con el procedimiento y de haber terminado una tarea (a saber, una página más); ahora ya podían dedicarse a lo que realmente disfrutaban. De ese modo se premiaban o reforzaban a sí mismos por el estudio realizado (Fox, 1966). Éste es un procedimiento que no dudamos en recomendarte.

RESUMEN

El aprendizaje es un cambio permanente del comportamiento que resulta de la experiencia.
El condicionamiento clásico fue descubierto por Ivan Pavlov. En esta forma de aprendizaje, un estímulo previamente neutral con el tiempo llega a producir una respuesta, por haber sido aparea-do con un estímulo que ya la provocaba. La extinción de una respuesta de condicionamiento clásico se realiza cuando la respuesta condicionada deja de asociarse al estímulo no condicionado.
El condicionamiento operante se realiza cuando las actividades de un organismo son reforzadas o castigadas. Se llama reforzador a toda consecuencia que aumente las probabilidades de una conducta. La extinción se da cuando la frecuencia de la conducta disminuye porque ya no se refuerza.
Los programas de reforzamiento producen diversos patrones conductuales. Cuando el reforza-miento está subordinado al número de respuestas (programas de razón), el organismo tiende a responder más rápidamente que cuando se basa en el tiempo (programas de intervalos). Si reforzamos las respuestas de manera periódica (programas fijos), el organismo tenderá a hacer una pausa después de recibir un premio. Si los reforzamientos aparecen en periodos irregulares, el organismo mantendrá un ritmo uniforme de actividad. Las respuestas reforzadas intermitente-mente desaparecen con mayor lentitud durante la extinción que las que recibieron un reforza-miento continuo.
Por señales se entiende los estímulos que con el tiempo se han ido asociando a la obtención de

premios o castigos. Los organismos poseen la capacidad de generalizar y discriminar las seña-les. Una señal se convierte en un reforzador condicionado, cuando por sí misma cumple la función de premio o castigo.

Control aversivo significa aplicar elementos des-agradables para influir en el comportamiento. En el castigo, el hecho negativo se produce a raíz de la respuesta y disminuye la frecuencia de ésta. En el condicionamiento de escape y evitación, la respuesta tiene el efecto de cancelar el hecho des-agradable. En el reforzamiento negativo, decrece la frecuencia de una respuesta que pone fin a un evento desagradable.
1. Los factores que influyen en el aprendizaje son retroalimentación, transferencia y práctica.
2. Con el descubrimiento de algunas estrategias, los organismos pueden aprender a aprender. Una estrategia con que se resuelve un problema o se aprende algo puede aplicarse después a situaciones posteriores de carácter semejante. Los organismos aprenden las estrategias de desvalidez o pereza, si viven situaciones donde su comportamiento no influye en los acontecimientos.
3. Si se quiere aprender una habilidad complicada, es preciso dominar y coordinar varias respuestas nuevas. El aprendizaje de habilidades se facilita por imitación y moldeamiento. Para aprender una habilidad, hay que integrar las nuevas respuestas en cadenas, las cuales a su vez se organizan después y constituye patrones de respuestas.
4. La modelación es una especie de aprendizaje que resulta de la imitación.

PREGUNTAS DE REPASO

¿Qué tipo de aprendizaje se realiza cuando una respuesta anterior queda vinculada a un nuevo estímulo? ¿Qué términos utilizó Pavlov para de signar los siguientes elementos de sus experimentos con perros: comida, la respuesta de salivación del animal al ver la comida, el sonido del diapasón, la respuesta de salivación al oír el sonido del diapasón? ¿Con qué palabra designó el hecho de golpear varias veces el diapasón sin darle comida al perro?
¿Qué psicólogo es uno de los que más han contribuido al desarrollo del condicionamiento operante? ¿Qué tipo de condicionamiento pone de relieve que el estímulo produce la respuesta?
¿Qué nombre se da a las respuestas positivas? ¿Qué nombre se da a las respuestas negativas? Mencione dos técnicas para lograr que se repita un comportamiento y otras dos que evitan que se repita.
Menciona los cuatro programas del reforzamiento elaborados por Skinner.
Da algunos ejemplos de reforzadores primarios. ¿Qué tipo de reforzador es el dinero?
Los estímulos aversivos pueden utilizarse en dos formas. ¿Cuáles son? ¿En qué se distinguen?
¿Cómo desarrolló Martin Seligman la teoría de la desvalidez en los animales? Una persona que haya aprendido la desvalidez tenderá más a sufrir depresión. Si alguien se siente deprimido y desvalido después de un examen escolar, ¿cuáles son las dos cosas en que seguramente pensará?
¿En qué proceso se refuerza al sujeto por lograr aproximaciones cada vez más cercanas a la conducta deseada? ¿Qué nombre se da a la secuencia en que una respuesta produce la señal para emitir la siguiente respuesta?
¿Cuáles son los tres tipos de modelación?

de estudiar

capítulo, deberás ser capaz de:

explicar el concepto de procesamie de información.

identificar y explicar los diversos tip sistemas de memoria.

explicar las teorías de la memoria. describir las unidades y los tipos del pensamiento.

definir la solución de problemas

Captación de Atención selec características

Almacenamiento de información Almacenamiento sensorial • Memoria a corto plazo • Memoria a largo plazo • La memoria y el cerebro Recuperación de información Reconocimiento • Aplicación de la psicología: testimonio de testigos ocula

El recuerdo • Olvido • Aplicación de

psicología: estado de ánimo

Cómo mejorar la memoria Procesamiento central de información Pensamiento • Solución de problemas • Creatividad

Comparte esto:

Deja un comentario Cancelar la respuesta