Kliker-trening

“Kliker trening” popularizirani je naziv za način rada sa životinjama prema principima operantnog uvjetovanja. Danas se sve više koristi u obuci ne samo pasa, već svih životinja.

Tko je zaslužan?
Ova metoda zapravo ima prilično dugu tradiciju, iako se, nažalost rad s psima i dan-danas zasniva na metodama potpuno suprotnim načinu na koji psi (i ostale životinje) uče. Za vrijeme II. svjetskog rata, Marian Breland Bailey (1920.-2001.), učenica profesora B. F. Skinnera i njen prvi suprug Keller Breland počinju trenirati golubove pismonoše. Godine 1943. osnivaju tvrtku Animal Behavior Enterprises (ABE) – prvu u svijetu koja je koristila ove metode. Drugi suprug Marian Breland, Bob Bailey, pomoću metode operantnog uvjetovanja i korištenjem klikera uspješno je radio sa više od 150 vrsta različitih životinja. U razdoblju od 50 godina treneri ABE-a su trenirali preko 15 000 životinja za potrebe vojske, policije, filma i reklama. Kasnije, bračni par Bailey surađuje s Karen Pryor koja je 1985. godine objavila knjigu Don’t shoot the dog!.

Tijekom svog rada treneri Animal Behavior Enterprises (ABE) pozitivnu su kaznu koristili samo 12 puta u 50 godina od ukupno 15 000 naučenih životinja!

Rad pretežno zasnovan na fizičkom kažnjavanju i negativnom potkrepljenju kakav se uglavnom koristi u tzv. klasičnom treningu nije im bio ni na kraj pameti. Za uspješan rad sa životinjama ključni su kriterij i vremensko usklađivanje. Bob Bailey tvrdi da je umjesto bilo kakave kazne pametnije koristiti pauzu (time-out). Također, trebali bismo se upitati jesmo li mi sami stvorili problem nedovoljnim ili loše vremenski usklađenim potkrepljenjem.

Bob Bailey nikada ne koristi tehniku fizičkog kažnjavanja, jer smatra da ljudi prečesto i na pogrešan način koriste tu metodu. Kada pozitivno potkrepljenje (“nagrada”) nije vremenski pravilno usklađeno, pas ne može pratiti, postaje zbunjen i ne razumije što od njega tražimo. Bob Bailey kaže: “Kažnjavanje sam u pravom smislu riječi koristio samo u situacijama od životnog značaja, s ciljem da spriječim potencionalno po život opasnu situaciju. Nikada ne bih koristio fizičko kažnjavanje na treningu poslušnosti, prvo zbog toga što nije neophodno, a drugo zbog toga što postoje bolji načini kojima se može postići željeni rezultat, uključujući i pouzdanost tog rezultata.” Stav ovog stručnjaka zasnovan je na znanstveno dokazanim činjenicama, iskustvu i rezultatima, a ne samo na ljubavi prema životinjama. Cijeli članak Boba Baileya o kažnjavanju pročitajte ovdje: Clicker Solutions Training Articles.

Kliker
Kliker je mala plastična sprava s metalnom trakicom po sredini koju kad pritisnemo prstom i otpustimo čujemo zvuk “klik”. Prednost klikera je u tome što je karakterističan “klik” brži i “prodorniji” od izgovaranja riječi pohvale, pa samim time pruža mogućnost da označimo ponašanje koje želimo pojačati (potkrijepiti). U kombinaciji s nečim što životinja smatra vrlo potkrepljujućim (od velikog značenja), kliker postaje moćan alat za oblikovanje ponašanja.

Kliker trening puno je više od samog pritiskanja klikera. Prije nego što započnete sa korištenjem klikera i konkretnim treninzima potrebno je naučiti i svladati teoriju i principe učenja. Kao što potvrđuje praksa, ta mala sprava i nije toliko bitna. Najvažniji je način učenja, sama filozofija i princip rada. Mnogim ljudima koji nemaju iskustva u radu s klikerom pomalo je nezgodno istovremeno držati psa, igračku, hranu i kliker pa zvuk klikera možemo zamijeniti riječju poput “Dobar!”, “Bravo!” i sl.

Prvi korak je povezivanje zvuka s nečim što psa motivira. U većini slučajeva to je omiljena poslastica, no nekim psima to je omiljena igračka. Kliknite i “nagradite” psa onoliko puta koliko je potrebno da psa poveže nagradu sa zvukom klikera. Tek tada možete početi koristiti kliker i uz pomoć njega iskomunicirali buduće željene radnje.

Da bi učvrstili željeno ponašanje odnosno radnju, pas nam radnju mora ponuditi. Neka ponašanja su prirodna, urođena kao na primjer sjedanje, lijeganje ili lajanje. Ne samo da su prirodna već se mogu i predvidjeti. Stavite psa u situaciju kada je najvjerojatnije da će se ponašanje desiti i pričekajte neko vrijeme. Za one nestrpljive te za radnje poput “daj šapu”, “mrtav” ili “prosi” koje nisu urođene postoji druga metoda. Takva ponašanja moraju biti izmamljena, a to je najlakše postići pomoću hrane. Kada pas izvrši radnju, taj trenutak označimo klikerom.

Verbalni signal, znak ili tzv. “naredba” dodaje se nakon što je pas naučio određenu radnju jer pas ne razumije značenje verbalnih signala (“naredbi”). Zapamtite, psi ne razumiju ljudski jezik. Riječ postaje razumljiva i dobiva smisao tek kada je povežemo s radnjom nakon učestalog ponavljanja. Dakle, najprije učite određenu radnju, potom je imenujte i dajte joj značenje (npr. signal “sjedni” znači spusti stražnjicu na pod). Kada pas u potpunosti usvoji vještinu, oslabite potkrjepljenje (ne nagrađujete svaku radnju) i tek tada možete početi s učenjem sljedeće.

Neki od termina

Averziv (aversive – nešto neugodno što pas želi izbeći

Izbacivanje ponašanja (extinction) – procedura u kojoj zadržavamo (uskraćujemo) potkrepljivač kako bi održali određeno ponašanje ili oslabili određeno ponašanje koje ne želimo. Na primjer: kada psa učimo da sjedne, nagradimo ga svaki put kada sjedne, a ignoriramo bilo koje drugo ponašanje.)

Jackpot – najbolja ili najobilnija nagrada koju dajemo samo kada je pas nešto odradio izuzetno dobro. Jackpot je potkrepljivač koji koristimo jednom unutar jedne određene sekvence učenja nekog ponašanja.

Klasični trening (traditional training) – tradicionalni oblik rada s psima, pomoću kojeg se psa fizički primorava da izvrši određeno ponašanje te često fizički korigira ukoliko ne surađuje.

Kriterij (criteria) – specifične željene reakcije (radnje, ponašanja) koje određuje trener. Klikerom ili nekim drugim markerom označimo moment čim pas postigne određeni kriterij. Kriterij osim fizičke radnje uključuje elemente poput kašnjenja, trajanja i udaljenosti. Da bi jasno znali postaviti kriterije, mora postojati plan rada.

Lančano povezivanje (chaining) – kombiniranje više različitih ponašanja u konstantnom nizu pomoću signala (znaka) te održavanje istih pomoću poticaja na kraju lanca ponašanja. Svaki signal služi kao marker, kao potkrepa prethodnom ponašanju i znak za sljedeće ponašanje (radnju).

Mamljenje (luring) – metoda kojom se životinja putem mamljenja navodi u određeni položaj. Mamac može biti hrana ili bilo što što je pas voljan pratiti. Treneri moraju biti oprezni kako bi na vrijeme postepeno izbacili mamac.

Marker – bilo kakav znak (obično zvučni, ali ne nužno) koji koristimo kako bi obilježili željeno ponašanje. Kliker je marker. “Bravo!” je marker; u radu s delfinima, zviždaljka je marker, u radu s gluhim životinjama, marker može biti bljeskanje svjetlom, znak rukom ili vibrirajuća ogrlica.

Negativno kažnjavanje (P-) (negative punishment) – sve što smanjuje učestalost, trajanje i/ili intenzitet ponašanja kada to oduzmemo životinji u istom trenutku ili odmah nakon što ispolji određeno ponašanje. Kada životinji oduzmemo nešto s ciljem da oslabimo ponašanje. Na primjer, kada pas tražeći pažnju skače na nas, a mi mu okrenemo leđa ili odemo u drugu prostoriju negativno ga kaznimo oduzimajući mu nešto što želi.

Negativno potkrepljenje (R-) (negative reinforcement) – opoziv pozitivnog kažnjavanja (averziva); oduzimanje nečeg da bi izbjegli (ili povećali učestalost) učvršćivanje neželjenog ponašanja. Na primjer, želimo naučiti psa da odstupi. Pokret tijelom prema psu ili npr. dodir i gurkanje psa neuvjetovana je pozitivna kazna. Vraćanjem unatrag i micanjem ruke s noge psa opozivamo pozitivnu kaznu i negativno potkrepljujemo.

Oblikovanje ponašanja (shaping) – postupak potkrepljivanja željenog ponašanja postepenim približavanjem željenom ponašanju (successive approximation).

Ponašanje (behaviour) – sve što životinja čini; radnja

Posljedica (consequence) – rezultat radnje. Posljedice često, ali ne uvijek utiču na buduće ponašanje čineći ga više ili manje vjerojatnim. Pet principa operantnog uvjetovanja opisuju moguće rezultate.

Potkrepljivač (reinforcer) –  sve što povećava učestalost, trajanje i/ili intenzitet ponašanja kada to damo ili oduzmemo životinji u istom trenutku ili odmah nakon što ispolji određeno ponašanje; nešto što životinja želi, za što će raditi kako bi nešto dobila

Primarni potkrepljivač (primary reinforcer) – potkrepljivač koji životinja treba da bi preživjela – hrana, voda, seks.

Pozitivno kažnjavanje (P+) (positive punishment) – sve što smanjuje učestalost, trajanje i/ili intenzitet ponašanja kada to prezentiramo životinji u istom trenutku ili odmah nakon što ispolji određeno ponašanje. Termin “pozitivno kažnjavanje” često se poistovjećuje s primjenom fizičke sile i vrlo neugodnim situacijama iako to ne mora nužno biti tako. Primjeri su udarci, tresenje za šiju, prejaki i nagli zvukovi, polijevanje vodom i sl., no blokiranje tijelom i gore naveden primjer dodirivanja rukom i gurkanje psa pri učenju da odstupi također su primjeri pozitivnog kažnjavanja.

Pozitivno potkrepljenje (R+) (positive reinforcement) – sve što povećava učestalost, trajanje i/ili intenzitet ponašanja kada to prezentiramo životinji u istom trenutku ili odmah nakon što ispolji određeno ponašanje. Ponašanje (radnja) je popraćeno nečim pozitivnim, ugodnim (hrana, igračka, pohvala, igra). Kao rezultat ponašanje se pojačava, učvršćuje i češće pojavljuje.

Sekundarni potkrepljivač (secondary reinforcer) – uvjetovani potkrepljivač koji životinja ne treba nužno da bi preživjela. Neutralan poticaj koji je postao potkrepljivač uparivanjem s primarnim potkrepljivačem (npr. “Bravo” postaje sekundarni potkrepljivač nakon što je popraćen primarnim potkrepljivačem npr. hranom i pas nauči njegovo značenje). Sekundarni potkrepljivač u određenim situacijama i uvjetima može biti jednako snažan, pa čak i snažniji od primarnog.

Signal, znak (signal, cue) – poticaj koji izaziva ponašanje. Na hrvatskom se pogrešno naziva naredbom. Signal može biti verbalni (sjedni), vizualni (znak rukom) ili zvučni (zviždaljka).

Umirujući signali (calming signals, appeasement signals) – suptilni znakovi, govor tijela koje psi koriste kako bi ukazali na stres, eliminirali sukob, ublažili agresiju ili suprotnoj strani dali do znanja da ne predstavljaju prijetnju.

Uravnoteženi trening (balanced training) – način rada koji koristi svih pet principa operantnog uvjetovanja i marker događaja (npr. kliker). Nažalost, mnogi pogrešno interpretiraju određene termine vezane uz principe operantnog uvjetovanja i samim time pogrešno ih upotrebljavaju.

Uvjetovani poticaj (conditioned stimulus) – neutralan poticaj u kombinaciji s primarnim potkrepljivačem do trenutka kada poprimi osobine primarnog poticaja. Kliker nakon što je uzastopce poistovjećen s hranom ili bilo kakvom potkrepom postaje uvjetovani potkrepljivač.


Napisala: Sandra Ilievski, instruktor i savjetnik za ponašanje pasa
reference:
Abrantes, Roger: The SMAF manual
Pryor, Karen: Don’t shoot the dog
www.clickersolutions.com/articles/2002/punishment.htm

Sviđa ti se? Podijeli!

Comments are closed.