B.F. Skinner - Condiţionarea operantă




B. F. Skinner (1905-1990) a crescut într-un orăşel din Pennsylvania numit Susquehanna.
După terminarea liceului, a continuat studiile la Colegiul Hamilton în New York, terminând
cu calificative excepţionale în special la literatura engleză. Interesat de comportamentul uman şi animal, renunţă la meseria de scriitor şi urmează cursurile unui master în psihologie la Harvard. Aici îşi începe cercetările asupra învăţării, ulterior a lucrat şi predat la mai multe universităţi precum Minnesota, Indiana.
Teoria lui Skinner se subsumează behaviorismului, asemenea celei a lui Watson, ca urmare
psihologia ar trebui să se dedice studiului comportamentului manifest, observabil, măsurabil şi să nu mai facă referiri la stările mentale intangibile (scopuri, dorinţe, idealuri). El admitea că omul vine pe lume cu anumite înzestrări genetice, dar a fost preocupat în primul rând, de modul în care mediul influenţează comportamentul.
Deşi ca formare teoretică a preluat o parte din conceptele teoriei pavloviene Skinner critica
modul în care Pavlov şi-a ales stimulii, în cadrul experimentelor sale, considerând că aceştia
tind să inducă un anumit răspuns. Altfel spus, răspunsurile obţinute de Pavlov sunt de fapt
declanşate automat de stimuli cunoscuţi. Spre exemplu, ingerarea hranei declanşează automat salivarea precum un zgomot puternic declanşează automat ca răspuns tresărirea. Majoritatea acestor răspunsuri sunt cel mai probabil simple reflexe, iar acest comportament a fost numit de Skinner „comportament respondent” (Skinner, 1953).
Skinner se ocupă de comportamentele operante. Design-ul experimental utilizat în studiul
acestora diferă de modelul utilizat de Pavlov şi ceilalţi subiecţii, animale se mişcă liber şi
operează asupra mediului, spre deosebire de câinele lui Pavlov care era legat. Pentru a studia condiţionarea operantă, Skinner a construit un dispozitiv cunoscut sub denumirea de “cutia lui Skinner“. Acesta constă într-o cutie relativ mică, în care animalul este liber să se mişte. La unul din capetele cutiei se afla o bară care, prin apăsare eliberează în mod automat o cantitate de hrană sau apă. Animalul, de exemplu un şobolan, se plimba întâi în voie peste tot, până când din întâmplare, apăsa bara care elibera hrana - recompensă. Treptat animalul va apăsa bara tot mai frecvent. Astfel de comportamente se vor manifesta cu o probabilitate mai mare în viitor, deoarece au generat consecinţe favorabile. În opinia lui Skinner (1938), comportamentul care a condus la o reuşită va fi urmat de stimuli de întărire, care vor contribui la consolidarea sa viitoare. Experimente de acest gen i-au permis să susţină că frecvenţa răspunsurilor este importantă pentru învăţare. Astfel, dacă răspunsurile sunt întărite, va creşte frecvenţa apariţiei comportamentului respectiv. În acest studiu apăsările barei erau automat înregistrate pe un grafic, astfel încât experimentatorul nu trebuia să fie prezent întotdeauna. Datele erau prezentate sub forma unei curbe a învăţării.
În opinia lui Skinner, aceste comportamente operante joacă un rol mult mai mare în viaţa
oamenilor în comparaţie cu cele respondente. Atunci când ne spălăm pe dinţi, conducem
maşina sau citim o carte, comportamentul nostru nu este declanşat automat de un stimul
specific. Simpla vedere a unei cărţi nu declanşează cititul aşa cum o lumină puternică
declanşează automat clipitul. Citirea sau nu a cărţii este o opţiune condiţionată de consecinţele asociate în trecut acestui comportament. Dacă cititul cărţilor ne-a adus recompense, cum ar fi note mari la şcoală, e foarte probabil să cumpărăm şi să citim cărţi, dacă nu, nu. Prin urmare, comportamentul este determinat de consecinţele sale (Munn, Fernald & Fernald, 1974).
Învăţarea prin condiţionarea operantă presupune o serie de principii, anume:
Principiul întăririi şi stingerii. Adepţii lui Skinner au desfăşurat numeroase experimente,
demonstrând că încă din copilăria timpurie, comportamentul uman poate fi controlat prin
stimuli întăritori. Spre exemplu, la copiii mici creştea frecvenţa suptului atunci când în urma
acestei activităţi obţineau un lichid dulce în opoziţie cu un lichid acru (Lipsitt, 1975). Similar,
poate creşte frecvenţa zâmbetelor şi a vocalizării copiilor mici dacă aceste comportamente
sunt recompensate prin zâmbet, mângâiere şi atenţie. Recompensele utilizate în cadrul acestor experimente au fost complet diferite.
Recompense precum hrana şi îndepărtarea imediată a durerii sunt numite recompense
primare, acestea având proprietăţi recompensatorii „naturale”. Alţi stimuli recompensatori
cum sunt zâmbetul adultului, lauda sau atenţia acestuia sunt probabil recompense
condiţionate, eficienţa lor provine din frecventa lor asociere cu recompensele primare
(Skinner, 1953).
Comportamentul operant, asemenea celui respondent este supus stingerii. Spre exemplu,
deoarece copii fac anumite lucruri sau manifestă unele comportamente numai pentru a capta atenţia, comportamentele nedorite (plânsul excesiv, etc.) pot fi eliminate prin retragerea atenţiei la apariţia acestora. Comportamentul operant care, în aparenţă a fost înlăturat, poate să aibă o revenire spontană. Un băieţel ale cărui crize de plâns nejustificate au fost înlăturate prin retragerea atenţiei a început să le aibă din nou când s-a aflat într-o situaţie nouă (Williams, 1959).
Principiul întăririi imediate. Skinner (1953) a descoperit că putea să obţină răspunsuri cu
frecvenţe mai ridicate atunci când acestea erau recompensate imediat Un şobolan apasă mult mai frecvent bara dacă primit prompt o porţie de hrană de fiecare dată când a acţionat-o în trecut. Se pare că acest principiu este important şi în creşterea copiilor. Dacă un tată îşi exprimă bucuria imediat ce fiul său îi aduce ziarul, băiatul va fi motivat să repete
comportamentul seara următoare. Dacă în schimb, tatăl a fost preocupat de alte lucruri şi a
întârziat întărirea comportamentului fiului său timp de câteva minute, comportamentul
băiatului nu va fi întărit. Este important de reţinut că va fi consolidat exact acel comportament pe care-l manifestă copilul în momentul întăririi. Dacă un copil realizează o construcţie din cuburi în acel moment, aceasta este activitatea ce va fi întărită şi nu aducerea ziarului.

După cum am menţionat anterior, condiţionarea operantă poate fi descrisă fără vreo referinţă la un stimul declanşato, dar aceşti stimuli nu sunt deloc lipsiţi de importanţă. Stimulii care preced răspunsurile pot avea un control considerabil asupra lor. Spre exemplu, Skinner (1953) a recompensat un porumbel de fiecare dată când acesta şi-a întins gâtul. În acest moment, Skinner nu cunoştea vreun stimul iniţial, el a aşteptat pur şi simplu ca porumbelul să emită răspunsul şi apoi l-a recompensat. Ulterior, a recompensat răspunsul numai la apariţia unui semnal luminos. După câteva încercări, porumbelul îşi întindea gâtul mult mai frecvent la apariţia semnalului luminos decât în lipsa acestuia. Semnalul luminos a devenit stimul discriminativ, lumina controla comportamentul deoarece semnala momentul în care comportamentul fusese recompensat.
Skinner (1953) a exemplificat în nenumărate rânduri cum comportamentul de zi cu zi se poate asocia cu anumiţi stimuli discriminativi. Într-o livadă în care merele roşii sunt dulci şi toate celelalte sunt acre, roşeaţa merelor devine un stimul ce indică momentul în care culesul şi mâncatul fructului va produce rezultate favorabile.
Cu toate că stimulii discriminativi exercită un control considerabil, trebuie subliniat faptul că acest control nu este unul automat ca în cazul condiţionării respondente. În experimentele lui Pavlov de exemplu, stimulii anteriori declanşează automat răspunsuri, pe când în condiţionarea operantă, astfel de stimuli doar măresc probabilitatea apariţiei răspunsurilor. În cazul condiţionării operante precum şi în cazul condiţionării respondente, putem vorbi de un proces de generalizare a stimulilor (1953). Presupunem că o fetiţă a fost recompensată pentru vocalizarea “Da, da“ atunci când îl privea pe tatăl ei dar nu şi atunci când o privea pe mamă sau pe alţi membrii ai familiei. Tatăl devine astfel un stimul discriminativ. pe de altă parte, nu este ceva neobişnuit ca fetiţa să rostească silabele “Da, da” la vederea unui alt bărbat, a unui străin de pe stradă. În acest caz, spunem că stimulul s-a generalizat. Părinţii vor trebui s-o înveţe acum o discriminare mai atentă. Ei ar putea spune “Aşa este“ când ea rosteşte “Da, da“ în prezenţa tatălui ei dar nu şi atunci când se adresează altor bărbaţi.
S-a dovedit că atunci când copiii sunt recompensaţi pentru utilizarea unei părţi de vorbire,
cum ar fi pluralul substantivelor, ei vor începe să folosească noi plurale, chiar dacă nu au fost recompensaţi pentru acele cuvinte în mod particular. Recompensele influenţează nu doar răspunsuri particulare ci şi pe cele ce aparţin aceleiaşi clase generale.

Comportamentul operant nu funcţionează după principiul „totul sau nimic”, ci se învaţă de
obicei, în mod gradat, puţin câte puţin. Dacă punem un porumbel într-o cutie şi aşteptăm ca acesta să lovească cu ciocul locul dorit s-ar putea să aşteptăm zile în şir sau chiar săptămâni.
O mare parte din timp, porumbelul nici nu se apropie de locul respectiv, prin urmare va fi
nevoie să-i modelăm comportamentul. Mai întâi, îl vom hrăni atunci când se întoarce în
direcţia dorită, intensificând astfel frecvenţa acestui comportament. Apoi vom amâna hrănirea până când pasărea va face o mişcare cât de mică în direcţia dorită. În faza următoare, vom recompensa poziţii tot mai apropiate de locul dorit până când pasărea se va afla faţă în faţă cu acel loc. Acum putem recompensa mişcări ale capului, la început oferind hrană pentru orice mişcare de înaintare a capului, şi în cele din urmă recompensând pasărea numai atunci când loveşte cu ciocul locul respectiv. Prin această procedură modelăm treptat răspunsul dorit.
Modelarea se mai numeşte”metoda aproximărilor”, recompensa fiind oferită la aproximări din ce în ce mai apropiate de răspunsul dorit. Probabil şi învăţarea multor activităţi umane se realizează printr-un proces similar de modelare pas cu pas (Skinner, 1953). Deşi
comportamentul poate fi modelat pas cu pas el se dezvoltă şi în înlănţuiri mai lungi de
răspunsuri integrate numite înlănţuiri comportamentale. Spre exemplu, învăţarea unui dans.

Skinner a observat că, în general comportamentul nostru cotidian este întărit
intermitent şi nu continuu. Skinner fost interesat astfel de efectele diferitelor
programe de recompensare intermitentă. Recompensarea intermitentă se poate realiza după un program cu intervale fixe astfel încât organismul să primească o
recompensă pentru primul răspuns după o perioadă specifică de timp. Spre
exemplu, un porumbel primeşte hrana după lovirea cu ciocul a unui disc, dar va
trebui să aştepte trei minute înainte să-i fie recompensată următoarea lovitură,
apoi încă trei minute, ş.a.m.d. În general, după un program de acest gen, rata
răspunsurilor este destul de scăzută. Programele cu raţie fixă produc rate mai
crescute, ca şi când porumbelul primeşte hrană la fiecare a cincia lovitură.
Conform ambelor programe există totuşi o perioadă de confuzie înaintea
răspunsurilor recompensate. E ca şi cum organismul ştie că mai are multe de
făcut înaintea următoarei recompense.
O descoperire foarte importantă a lui Skinner se referă la constatarea conform căreia
comportamentul recompensat intermitent este mult mai dificil de stins în comparaţie cu cel recompensat continuu. Aşa se explică faptul că multe dintre comportamentele nedorite ale copiilor noştri sunt atât de greu de oprit. Dacă dorim să iniţiem învăţarea unei forme dorite de comportament este de dorit să începem cu recompensa continuă, aceasta s-a dovedit modalitatea cea mai eficientă pentru iniţierea unui comportamentului. Însă, dacă dorim să asigurăm durabilitatea comportamentului am putea la un moment dat să trecem la recompensa intermitentă (Crain, 2004).
Recompensa înseamnă întărirea unui răspuns, creşterea frecvenţei
acestuia, iar recompensele pozitive întăresc răspunsurile prin adăugarea
consecinţelor pozitive, cum sunt hrană, laudă sau atenţie. Răspunsurile
pot fi întărite însă şi prin răspunsurile negative, prin îndepărtarea unor
stimuli neplăcuţi sau aversivi, astfel întărim tendinţa de a scăpa de aceşti
stimuli.
În mod ciudat, atunci când aplicăm o pedeapsă, nu încercăm să întărim un
comportament ci să-l eliminăm. În opinia lui Skinner, pedeapsa este “cea
mai comună tehnică de control în viaţa modernă”. Însă, pedeapsa nu
funcţionează întotdeauna. Într-unul din primele sale experimente, Skinner
(1938) a descoperit că, pedepsind şobolanii pentru apăsarea unei bare
printr-un mecanism de lovire a lăbuţelor el a oprit răspunsul doar
temporar. În timp, pedeapsa nu a eliminat răspunsul mai repede decât
stingerea, alte studii au obţinut rezultate similare iar descoperirile se
conformează experienţei zilnice. Părinţii care îşi lovesc copiii reuşesc să obţină un anumit comportament o vreme dar vor descoperi că acel
comportament neadecvat reapare ulterior.
Skinner (1953) a obiectat împotriva pedepsei, în opinia sa aceasta produce
efecte secundare nedorite. Un copil pedepsit în şcoală poate în curând să
apară inhibat şi complexat. După Skinner, în unele situaţii, pedeapsa
poate elimina orice răspuns, mai ales atunci când pedeapsa este extrem
de dureroasă. De asemenea pedeapsa poate fi eficientă atunci când este
administrată prompt, iar organismul poate produce răspunsuri alternative
ce sunt recompensate. Cu toate acestea, efectele pedepsei sunt adesea
bulversante şi nedorite.
Skinner a recomandat să înlocuim pedeapsa cu stingerea. Skinnerienii
sugerează adesea combinarea stingerii comportamentului nedorit cu
întărirea pozitivă pentru comportamentul dorit. Într-un studiu, profesorii iau
ignorat pur şi simplu pe copiii unei grădiniţe de câte ori erau agresivi şi
au fost lăudaţi, li s-a acordat atenţie de fiecare dată când erau liniştiţi şi
cooperanţi. În cele din urmă, s-a ajuns la o grădiniţă de copii mai cuminţi.

Se spune uneori că Skinner a introdus teoria “ organismului fără conţinut“, examinând numai
răspunsurile evidente şi ignorând stările interne. Această afirmaţie este exactă dar şi puţin
simplificată. Skinner nu a negat existenţa lumii interne. A admis existenţa senzaţiilor, a
gândurilor. Gândirea este doar o manifestare mai slabă, mai puţin evidentă, acoperită de
comportament. De exemplu, putem să vorbim în linişte cu noi înşine sau putem să ne
planificăm în minte mişcările unui joc de şah, dar astfel de evenimente particulare nu aparţin psihologiei ştiinţifică decât în măsura în care găsim modalităţi prin care le putem face observabile, măsurabile (Skinner, 1974).
În privinţa emoţiilor, discuţia este similară. Skinner le admite existenţa, dar nu acceptă că
acestea ar putea cauza anumite comportamente. Răspunsurile emoţionale însele pot fi
explicate conform principiilor teoriei învăţării. Multe emoţii sunt produsul secundar al
diverselor evenimente neprevăzute care au fost întărite. Încrederea, spre exemplu, este un
produs secundar al întăririi pozitive frecvente. În mod contrar, devenim deprimaţi şi letargici atunci când comportamentele noastre nu sunt întărite. O analiză operantă ne ajută de asemenea să înţelegem de ce persistă modele variate de comportament emoţional. Dacă o fetiţă persistă în a se comporta agresiv, este important să se cunoască consecinţele acestui comportament. Oare acţiunile ei reuşesc să obţină atenţia sau jucăriile altor copii? Dacă da, agresivitatea ei este foarte posibil să continue.
Prin urmare, Skinner (1969) a crezut că putem înţelege emoţiile dacă le privim ca produse ale controlului mediului. Este inutil să considerăm emoţiile drept cauze intrapsihice aşa cum fac de exemplu, freudienii. Un freudian ar putea vorbi despre un om ca fiindu-i frică de sex din cauza unei pedepse anticipate de la o autoritate internă, superego-ul. Pentru Skinner, dacă vrem să înţelegem de ce o persoană evită sexul trebuie să căutăm în consecinţele trecute ale comportamentului sexual al acestuia. Skinner a afirmat că nu e necesar să căutăm în interiorul organismului cauze ale comportamentului. Comportamentul este controlat de mediul extern, aserţiune care a dus la o serie de didficultăţi îndeosebi raportat la conceptul de instinct. Instinctele, cum ar fi foamea sau setea, par să se refere la stări interne care motivează comportamentul. Skinner însuşi şi-a privat animalele de hrană şi apă pentru a face ca recompensele să fie mai eficiente. Dar Skinner (1974) a argumentat că nu e necesar să concepem instinctele drept stări interne fie ele mintale sau fiziologice. Pur şi simplu specificăm orele în care privăm un animal de hrană şi apă şi examinăm efectul acestei operaţii în frecvenţa răspunsurilor, spune el.

Aplicaţiile teoriei condiţionării operante sunt foarte ample şi în aproape toate domeniile. Deexemplu, utilizarea tehnicilor operante pentru a corecta problemele comportamentale
constituie o ramură importantă în domeniul sănătăţii mintale unde au fost folosite
tehnici operante pentru a trata o varietate de probleme, de la enurezis la fobii şi
timiditate. Un exemplu impresionant este munca lui Lovaas cu copiii autişti (1973,
1977). Copiii autişti sunt extrem de izolaţi şi se angajează în comportamente bizare
cum ar fi autostimularea. Mulţi sunt muţi iar alţii ecolalici, ei reprezintă un fel de ecou
a ceea ce vorbesc ceilalţi, iar alţii se angajează în comportamente auto-mutilante.
Lovaas (1977) a folosit tehnici operante pentru a controla comportamentul copiilor cu
scopul de a-l schimba. El a încearcat să elimine comportamentele social inadecvate şi
să întărească comportamentele social acceptate. Dacă un copil se angajează în
ecolalie , autostimulare sau comportament auto-mutilant, Lovaas îl pedepseşte sau îl
ignoră. Dacă copilul adoptă un comportament mai adecvat, cum ar fi vorbeşte corect,
Lovaas îi oferă o recompensă. La nivel verbal, copiii autişti se caracterizează prin
vocabularul lor restrâns şi evitarea vorbirii, prin urmare acest comportament va trebui
modelat treptat. La început, vor fi recompensaţi pentru sunete foarte puţin
asemănătoare cu cuvintele iar apoi pentru aproximări din ce în ce mai reuşite.
Învăţarea programată are la bază o serie de principii ale teoriei învăţării operante,
Skinner a inventat dispozitive de învăţare şi instrucţie programată. Dispozitivul de
învăţare era un aparat simplu care permitea citirea unui paragraf scurt, răspunderea la
câteva întrebări şi apoi, prin răsucirea unui buton, oferea un feedback privind
corectitudinea răspunsurilor. De fapt, dispozitivul în sine era mai puţin important în
raport cu materialul programat pe care îl conţinea, material prezentat în zilele noastre
într-o broşură simplă sau instalat într-un computer. Skinner (1969) descoperă că cea
mai bună metodă pentru iniţierea unui comportament nou este modelarea treptată a
acestuia. În al doilea rând, cel ce învaţă trebuie să fie activ, să dispună de libertate de
acţiune, aceasta fiind condiţia naturală a organismelor. În al treilea rând, feedback-ul
trebuie să fie imediat, Skinner descoperind că învăţarea mai rapidă este cea întărită
prompt. În instrucţia programată, elevii lucrează independent şi în ritmul propriu.
Capitolele de instrucţie sunt astfel programate încât să permită fiecărui elev să înceapă
la un nivel pe care îl poate rezolva cu uşurinţă. Nu se doreşte ca studentul să facă
multe greşeli la început pentru ca acestuia să nu îi lipsească întăritorul pozitiv în
procesul de învăţare. Aşa cum se întâmplă în cadrul modelării, se începe cu întărirea
răspunsurilor care se află în repertoriul comportamental al studentului pentru ca apoi
să crească gradat din acel punct. La nivel tehnic, instrucţia programată a întâmpinat
unele dificultăţi. De exemplu, uneori studenţii se grăbesc să parcurgă programele fără
a-şi însuşi materialul.
Cu siguranţă, prin rezultatele obţinute, Skinner a stârnit controverse pe mai multe fronturi.
Pentru unii, munca sa se pretează la practici autoritare, pentru că sugerează modalităţi de
control, de manipulare şi de programare a comportamentului altora. Răspunsul lui Skinner a fost acela că mediile sunt cele care controlează de fapt comportamentul şi depinde de noi cum folosim cunoaşterea acestui fapt. Putem crea medii care servesc scopurilor umane sau putem crea medii care nu se potrivesc acestor scopuri (Crain, 2004).
Teoreticienii dezvoltării, la rândul lor, intră adesea în dezbateri cu skinnerienii. Dintr-o
perspectivă mai obiectivă, putem discuta despre trei aspecte esenţiale în privinţa cărora
skinnerienii şi teoreticienii dezvoltării sunt în dezacord. În primul rând, teoreticienii
developmentalişti discută adesea despre evenimentele interne. Piaget a descoperit structuri mentale complexe chiar dacă nu se aştepta să descopere dovezi directe pentru toate acestea în
nici unul din cazuri în mod individual. Freudienii discută evenimentele interne cum ar fi
fanteziile inconştiente pe care nu le putem observa direct. În opinia lui Skinner, astfel de concepte ne abat de la progresul ştiinţific pe care îl facem atunci când ne dedicăm măsurării răspunsurilor evidente şi a stimulilor din mediu. Din această perspectivă, Skinner este considerat un extremist. După anul 1960, a existat un interes dramatic pentru cogniţie şi chiar un număr crescând de teoreticieni ai învăţării au început să ia în considerare evenimentele interne, cognitive chiar dacă acestea nu pot fi măsurate în mod direct (Crain, 2004).
În al doilea rând, teoreticienii dezvoltării şi skinnerienii au opinii diferite în privinţa
semnificaţiei şi importanţei stadiilor dezvoltării, perioade în care copiii organizează
experienţe în moduri foarte diferite. În teoria lui Piaget, spre exemplu, stadiul unui copil este o variabilă crucială, este un predictor al experienţei din care poate învăţa copilul. Un copil aflat în stadiul senzorio-motor nu va învăţa abilităţi ce implică limbajul, tot aşa cum un copil care începe să dobândească operaţii concrete nu va învăţa prea mult din lecturile referitoare la teorie abstractă.
În al treilea rând, şi cel mai important, principiul care îi desparte pe skinnerieni de
teoreticienii dezvoltării este legat de sursa schimbării comportamentului. Teoreticienii
dezvoltării susţin că, în momente cruciale, gândurile, sentimentele şi acţiunile emerg spontan din interior. Comportamentul nu este modelat exclusiv din exterior, de mediu. Gesell, spre exemplu, considera că maturizarea interioară este responsabilă pentru comportamentele copiilor, precum; statul în picioare, mersul, vorbirea.
Teoreticienii dezvoltării încearcă să conceptualizeze modul în care copiii cresc şi învaţă pe
cont propriu. În acelaşi timp, nimeni nu poate faptul că mediul întăreşte şi controlează
comportamentul într-o măsură considerabilă şi, adesea în modurile descrise de Skinner.

Comments