Uzvedības (operantā) kondicionēšana — definīcija, pastiprinājumi un sodi

Operant kondicionēšana ir mācīšanās veids, kurā indivīds maina savu uzvedību, ņemot vērā tās sekas. Tas nozīmē, ka cilvēks vai dzīvnieks iemācās — caur pieredzi — kādu rīcību atkārtot biežāk un kādu retāk, pamatojoties uz to, kas seko pēc uzvedības.

Galvenās uzvedības sekas operant kondicionēšanā ir:

  1. Pastiprinājums: notikums, kas palielina uzvedības biežumu, jo uzvedība tiek saistīta ar atalgojumu vai labvēlīgu rezultātu. (Šeit izmantojam terminu “pastiprinājums” plašā nozīmē.)
  2. Sods: notikums, kas samazina uzvedības biežumu, jo uzvedība tiek saistīta ar nepatīkamu seku.
  3. Izzušana: ja uzvedībai vairs neseko sekas (ne pastiprinājums, ne sods), tā laika gaitā parādās arvien retāk un var pilnībā izzust.

Pastiprinājumu un sodu veidi

Standarta klasifikācija atšķir, vai kāds stimuls tiek pievienots vai noņemts. Šeit termini “pozitīvs” un “negatīvs” apzīmē pievienošanu vai atņemšanu, bet ne vērtējumu.

  1. Pozitīvais pastiprinājums — kad par kādu uzvedību tiek saņemta atlīdzība, tā palielina šīs uzvedības biežumu. Skinnera kastes eksperimentā atlīdzība bija pārtikas veidā, kad žurka nospieda sviru.
  2. Negatīvs pastiprinājums (bieži saukts arī par “bēgšanu” vai “ataisiešanu”) — uzvedība palielinās, jo tiek noņemts nepatīkams stimuls. Piemēram, ja skaļš troksnis apstājas tikai tad, kad dzīvnieks veic noteiktu darbību, tas mācās šo darbību atkārtot, lai troksni izvairītos.
  3. Pozitīvs sods — tiek pievienots nepatīkams stimuls, kas samazina uzvedības biežumu (piem., skaļš troksnis vai elektrošoks eksperimentos; arī fiziska soda piemēri kā pēriens (bērnam).
  4. Negatīvs sods — tiek atņemts patīkams stimuls, kas samazina uzvedības biežumu (piem., bērna rotaļlietas atņemšana pēc nevēlamas uzvedības).

Galvenie procesi: izzušana, generalizācija, diskriminācija un formēšana

Izzušana notiek, ja pastiprinājums pārstāj sekot uzvedībai; sākotnēji uzvedība var palikt bieža (atzīmēta kā “atpalikšana”), bet vēlāk mazinās un izzūd. Generalizācija nozīmē, ka uzvedība, kas tika pastiprināta vienā situācijā, var parādīties arī līdzīgās situācijās. Diskriminācija ir pretējs — organisms iemācās atšķirt situācijas, kurās uzvedība tiek pastiprināta, no tām, kurās tā netiek.

Formēšana (shaping) ir metode, kurā sarežģīta uzvedība tiek izveidota, pakāpeniski pastiprinot tuvāko piegājienu uz vēlamo uzvedību. Skinnera darbi parādīja, cik efektīvi var apmācīt dzīvniekus ar pakāpeniskiem pastiprinājumiem.

Pastiprināšanas grafiki

Kāda uzvedība tiek nostiprināta atbilstoši tam, cik bieži un kad seko pastiprinājums. Galvenie grafiki:

  • Pastāvīgais pastiprinājums — katra pareizā rīcība tiek atlīdzināta; veicina ātru mācīšanos, bet arī ātru izzušanu, ja pastiprinājums pārstāj.
  • Neatbilstošs (intermitents) pastiprinājums — atlīdzība tiek dota tikai dažkārt. Tas veicina izturību un lēnāku izzušanu. Intermitentu grafiku veidi: fiksētā attiecība, mainīgā attiecība, fiksēta intervāla un mainīga intervāla grafiki, katrs ar atšķirīgām uzvedības sekām un ātrumu, kādā ieradums veidojas.

Vēsture un teorētiskie pamati

Operantu kondicionēšanas idejas pirmais atklāja Edvards Torndaiks, bet klasisko teorētisko izpēti un plašu eksperimentālu darbu veica B. F. Skinner. Torndaiks izmantoja likumu par efektu (law of effect), savukārt Skinner aprakstīja, kā pastiprinājumi un sodi sistemātiski maina uzvedību.

Atšķirība no klasiskās kondicionēšanas

Operant kondicionēšana atšķiras no Pavlova klasiskās kondicionēšanas. Klasiskā kondicionēšana nodarbojas ar automātisku, reflexuālu atbildi, ko izraisa noteikti signāli (piem., zvans un siekalu izdalīšanās), kamēr operant kondicionēšana nodarbojas ar brīvprātīgām darbībām, kuras maina to sekas. Klasiskās kondicionēšanas centrā ir stimulēšana un reakcija, bet operantā — rīcība un tās sekas; abu tipu procesi dažkārt mijiedarbojas.

Pielietojumi praksē

  • Izglītībā — pozitīvie pastiprinājumi (paldies, balvas, atzīmju sistēmas) tiek izmantoti, lai veicinātu vēlamu uzvedību un mācību aktivitāti.
  • Uzvedības terapijā — īpaši ABA (Applied Behavior Analysis), ko izmanto, piemēram, darba ar bērniem ar autisma spektru, izmantojot sistemātisku pastiprināšanu un formēšanu.
  • Dzīvnieku apmācībā — operant kondicionēšana ir pamats klikera treniņiem un citiem atalgojumu balstītiem apmācību metodēm.
  • Darba vadībā un motivācijā — atlīdzības sistēmas, bonusi un stimuli veicina produktivitāti, ja tiek lietoti saprātīgi un konsekventi.

Ētiskie un praktiskie apsvērumi

Sodu izmantošana var būt efektīva, bet tai ir riski: bailes, izvairīšanās, agresija un attiecību bojāšana. Pozitīvā pastiprināšana bieži vien ir drošāka un ilgtspējīgāka stratēģija. Praktiski padomi labākai operant kondicionēšanas lietošanai:

  • Reakcijas un pastiprinājuma savlaicīgums — pastiprinājums ir efektīvāks, ja tas seko uzvedībai ātri.
  • Konsekvence — īpaši mācīšanās sākumposmā; vēlāk var pāriet uz retāku, bet paredzamu pastiprinājumu (intermitentu).
  • Atbilstoša pastiprinājuma izvēle — pastiprinātājam jābūt nozīmīgam subjekta motivācijai.
  • Fades (pakāpeniska atbalsta samazināšana) — kad uzvedība nostiprināta, atlīdzību var samazināt vai mainīt, lai rīcība saglabātos neatkarīgi no biežas ārējas atlīdzības.

Apvienojot teorētiskas zināšanas ar ētisku praksi, operant kondicionēšana sniedz spēcīgu rīku uzvedības izpratnei un modificēšanai gan cilvēku, gan dzīvnieku jomā. Tomēr jāizmanto atbildīgi, izvērtējot gan efektivitāti, gan blaknes.

Operant kondicionēšana ir būtiska daļa no plašākas uzvedības zinātnes, un tās principi joprojām tiek izpētīti un pielietoti mūsdienu psiholoģijā, pedagoģijā un dzīvnieku apmācībā. Tā sniedz rāmju sapratnei par to, kā sekas ietekmē nākotnes rīcību.

Torndaika iedarbības likums

Operant kondicionēšanu, ko dažkārt dēvē par instrumentālo mācīšanos, pirmo reizi pētīja Edvards L. Torndaiks (Edward L. Thorndike, 1874-1949). Viņš novēroja kaķu uzvedību, mēģinot izbēgt no mājās gatavotām puzles kastēm. Kad kaķi pirmo reizi tika ielikti kastēs, tiem bija nepieciešams ilgs laiks, lai izbēgtu. Pieaugot pieredzei, veiksmīgas atbildes parādījās biežāk, kas ļāva kaķiem aizbēgt īsākā laikā. Savā ietekmes likumā Torndaiks izvirzīja teoriju, ka uzvedību, kurai seko apmierinošas sekas, ir tendence atkārtot, bet uzvedību, kas rada nepatīkamas sekas, ir mazāk iespējams atkārtot. Īsāk sakot, dažas sekas pastiprināja uzvedību un dažas sekas vājināja uzvedību. Izmantojot šo procedūru, Torndaiks izveidoja pirmās zināmās mācīšanās līknes.

B. F. Skiners (B. F. Skinner, 1904-1990) izstrādāja detalizētāku operantu kondicionēšanas analīzi. Skiners izgudroja operantu kondicionēšanas kameru, kas viņam ļāva izmērīt reakcijas ātrumu kā galveno atkarīgo mainīgo lielumu. Viņš izmantoja sviras nospiedumu vai taustiņu pīkstienu reģistrēšanu.

Operant kondicionēšanas principi:

  1. Diskriminācija, vispārināšana un konteksta nozīme.
    1. Mācīšanās notiek kontekstā.
    2. Lielākā daļa uzvedības ir stimulējoša: konkrēta reakcija rodas tikai tad, kad ir atbilstošs stimuls.
    3. Stimulu kontrole ir efektīva pat tad, ja stimulam respondentam nav nozīmes.
  1. Izzušana: operanta uzvedība izzūd, kad pastiprinājums pārstāj darboties.
    1. Pastiprinājumi notiek tikai tad, kad ir veikta atbilstoša reakcija, un pat tad tie var nenotikt. Tā rezultātā uzvedība neatslābst un neizbeidzas.
    2. Rezultāti daļēji ir atkarīgi no tā, cik bieži tiek saņemts pastiprinājums.
  1. Pastiprināšanas grafiki: ir ļoti svarīgi, kad tiek veikta pastiprināšana.
    1. Fiksētu intervālu grafiks: pastiprinātāji tiek pasniegti noteiktos laika periodos ar nosacījumu, ka tiek sniegta atbilstoša reakcija.
    2. Mainīgs intervāla grafiks: uzvedība tiek pastiprināta, pamatojoties uz vidējo laiku, kas pagājis kopš pēdējā pastiprinājuma. Attiecības grafiki: balstās uz reakciju attiecību pret pastiprinājumiem.
    3. Fiksēta intervāla grafiks: pastiprinājums tiek sniegts pēc tam, kad ir sniegts noteikts skaits atbilžu. Īpašais gadījums, kad pastiprinājums tiek sniegts pēc katras atbildes, tiek saukts par nepārtrauktu pastiprinājumu.
    4. Mainīgs intervāla grafiks: piegādes pastiprinājums ir balstīts uz noteiktu vidējo atbilžu skaitu.

Jautājumi un atbildes

J: Kas ir operantu kondicionēšana?


A: Operant kondicionēšana ir mācīšanās veids, kurā indivīds maina savu uzvedību, ņemot vērā uzvedības sekas (rezultātus).

J: Kādi ir četri operant kondicionēšanas konteksti?


A.: Četri operant kondicionēšanas konteksti ir pozitīvs pastiprinājums, negatīvs pastiprinājums, pozitīvs sods un negatīvs sods.

J: Kā darbojas pozitīvais pastiprinājums?


A: Pozitīvais pastiprinājums rodas tad, ja par kādu uzvedības veidu tiek saņemta atlīdzība, kas palielina uzvedības biežumu.

J: Kā darbojas negatīvais pastiprinājums?


A: Negatīvs pastiprinājums rodas, ja tiek noņemts nepatīkams stimuls, kas palielina uzvedības biežumu.

J: Kā darbojas pozitīvs sods?


A: Pozitīvais sods notiek tad, kad tiek pievienots stimuls, kā rezultātā uzvedība parādās retāk.
J: Kā darbojas negatīvs sods? A: Negatīvs sods tiek piemērots, ja tiek atņemts stimuls, kā rezultātā uzvedība parādās retāk.

J: Kurš pirmais atklāja operantu kondicionēšanu?


A.: Edvards Torndaiks pirmais atklāja operantu kondicionēšanu, un vēlāk to analizēja B. F. Skinners.

AlegsaOnline.com - 2020 / 2025 - License CC3