Yazı 17: Öğrenmenin ABC’si 2: Edimsel Koşullanma (Skinner’ın Kutusu ve Ödül-Ceza)

Bir önceki yazımızda Pavlov’un köpeklerini ve klasik koşullanmayı incelemiştik. Orada öğrenme, organizmanın kontrolü dışında gelişen, pasif bir süreçti (zil çalar, salya akar). Köpek zili çaldırmaz, zil çaldığında sadece tepki verir. Ancak insan hayatı ve davranışları sadece reflekslerden ibaret değildir. Bizler çevremize maruz kalan pasif alıcılar değiliz; çevreyi aktif olarak etkileyen aktörleriz.

Neden her sabah uyanıp işe gideriz? Neden bir çocuk odasını toplar? Neden kumarhanelerdeki slot makinelerinin başından ayrılamayız veya Instagram’da sayfayı yenilemekten kendimizi alamayız? Çünkü bu davranışların sonuçlarıvardır. Psikolojide buna Edimsel (Operant) Koşullanma diyoruz. Bu ilkeye göre, davranışlarımız sonuçları tarafından yönetilir: Ödüllendirilen davranışlar güçlenir ve artar, cezalandırılan davranışlar zayıflar ve azalır.

Gelin, bu basit ama evrensel kuralın mimarı B.F. Skinner ve onun ünlü kutusuyla tanışalım.

Skinner’ın Kutusu: Davranışın Mimarisini Çözmek

B.F. Skinner, insan davranışını anlamak için zihnin içine (“kara kutu”ya), yani duygulara veya düşüncelere bakmaya gerek olmadığına inanan radikal bir davranışçıydı. Ona göre her şey, çevre ile etkileşimimizdeki girdi-çıktı ilişkisinde gizliydi.

Teorisini test etmek için “Skinner Kutusu” (Edimsel Koşullanma Odası) adını verdiği özel bir düzenek geliştirdi. Bu kutuya aç bir fare koydu. Kutuda bir pedal (manivela) ve yemin düştüğü bir hazne vardı. Fare kutuyu keşfederken, sağa sola koştururken kazara pedala bastığında, kutunun içine bir parça yem düştü. Fare bu yemi yedi.

Başlangıçta bu bir tesadüftü. Ancak fare dolaşmaya devam edip pedala tekrar bastığında, yine yem düştü. Bir süre sonra farenin beyninde “Pedala bas = Yemek kazan” bağlantısı kuruldu. Sonuç? Fare artık rastgele dolaşmayı bıraktı ve pedala tekrar tekrar, bilinçli ve hızlı bir şekilde basmaya başladı. Skinner, farenin davranışını (pedala basmak) şekillendiren şeyin, o davranışın sonucu (yemek) olduğunu kanıtladı.

Şekillendirme (Shaping): Adım Adım Öğrenme

Peki ya fare pedala hiç basmazsa? Skinner burada “kademeli yaklaştırma” (shaping) yöntemini kullandı. Önce fare pedala doğru baktığında ödül verdi. Sonra pedala doğru yürüdüğünde. Sonra pedala dokunduğunda. Ve en sonunda sadece bastığında. Bu yöntem, sirk hayvanlarının karmaşık numaraları nasıl öğrendiğinin veya karmaşık bir beceriyi (yazı yazmak gibi) nasıl kazandığımızın sırrıdır: Büyük hedefe giden her küçük adım ödüllendirilir.

Pekiştirme (Reinforcement): Davranışı Artırmak

Pekiştirme, bir davranışın gelecekte tekrarlanma olasılığını artıran herhangi bir olay veya sonuçtur. İki türü vardır ve genellikle karıştırılır, ancak mantığı basittir:

Olumlu Pekiştirme (Pozitif Ödül): Davranıştan sonra ortama hoşa giden bir şey eklemektir. “Bunu yaptığın için sana bunu veriyorum” mantığıdır.
- Örnek: Ödevini yapan çocuğa dondurma vermek, satış hedefini tutturan çalışana prim vermek veya köpeğiniz “otur” komutunu dinlediğinde ona ödül maması vermek. Davranış (ödev/satış/oturma) artar çünkü sonucunda iyi bir şey kazanılmıştır.
- Sosyal Örnek: Yeni aldığınız kıyafetle işe gittiğinizde arkadaşlarınızın “Çok yakışmış!” demesi, o kıyafeti giyme davranışınızı pekiştirir.
Olumsuz Pekiştirme (Negatif Pekiştirme): Davranıştan sonra ortamdaki nahoş (kötü) bir şeyi kaldırmaktır. Dikkat: Bu ceza değildir! Burada da davranış artar, çünkü kötü bir durumdan kurtulursunuz. “Bunu yaparsan, şu kötü şey duracak” mantığıdır.
- Örnek: Başınız ağrıdığında (kötü durum) ağrı kesici içersiniz (davranış) ve ağrı geçer (kötü durum kalkar). Gelecekte başınız ağrıdığında ilaç içme ihtimaliniz artar.
- Örnek: Arabaya bindiğinizde susmak bilmeyen o sinir bozucu emniyet kemeri ikaz sesi (kötü durum), kemeri taktığınızda (davranış) susar. Kemeri takma davranışınız, sesten kurtulmak için pekişir.
- Örnek: Sabah çalan alarmı susturmak (davranış), o rahatsız edici sesi (kötü durum) ortadan kaldırır.

Özetle: Olumlu pekiştirme “iyi bir şey vermek”, olumsuz pekiştirme “kötü bir şeyi almaktır”. Her ikisi de davranışı güçlendirir.

Ceza (Punishment): Davranışı Azaltmak

Ceza, bir davranışın gelecekte tekrarlanma olasılığını azaltan herhangi bir olaydır. Onun da iki türü vardır:

Olumlu Ceza (I. Tip Ceza): Davranıştan sonra ortama nahoş bir şey eklemektir. “Bunu yaptığın için sana bu kötü şeyi veriyorum.”
- Örnek: Yaramazlık yapan çocuğa kızmak, hız sınırını aşan sürücüye para cezası kesmek veya sıcak sobaya dokunduğunuzda elinizin yanması. Kötü bir şey (acı, ceza, azarlama) eklendiği için davranış azalır.
Olumsuz Ceza (II. Tip Ceza): Davranıştan sonra ortamdaki hoşa giden bir şeyi almaktır. “Bunu yaptığın için elindeki güzel şeyi alıyorum.”
- Örnek: Kardeşiyle kavga eden çocuğun tabletini elinden almak, kural ihlali yapan futbolcuyu oyundan atmak veya alkollü araç kullananın ehliyetine el koymak. İyi bir şey gittiği için davranış azalır.

Cezanın Yan Etkileri: Neden İşe Yaramayabilir?

Skinner ve takipçileri, cezanın davranışı durdurmakta etkili olabileceğini ancak öğretici olmadığını savunur.

Öğretmez, Sadece Durdurur: Ceza, çocuğa ne yapmaması gerektiğini söyler ama yerine ne yapması gerektiğini öğretmez.
Korku Yaratır: Ceza, cezayı veren kişiye veya ortama karşı korku ve kaçınma yaratabilir. Çocuk dersten nefret edebilir veya ebeveyninden uzaklaşabilir.
Saldırganlığı Modelleyebilir: Fiziksel ceza, sorunların şiddetle çözülebileceği mesajını verebilir.

Kumarın Psikolojisi: Neden Vazgeçemiyoruz? (Pekiştirme Tarifeleri)

Skinner, ödüllerin verilme zamanlamasının (tarifeler) davranışı nasıl etkilediğini de araştırdı. “Her seferinde ödül vermek” (Sürekli Pekiştirme) öğrenmeyi hızlandırır, ancak ödül kesildiği anda davranış da hızla söner.

Ancak en güçlü, en bağımlılık yapıcı ve sönmeye en dirençli davranışlar, Değişken Oranlı Pekiştirme ile oluşur. Yani, ödülün ne zaman geleceğini bilmediğiniz durumlar.

Kumar Makineleri: Kolu her çektiğinizde kazanmazsınız. Bazen 3. denemede, bazen 20. denemede ödül gelir. Bu belirsizlik, dopamin sistemini sürekli tetikte tutar ve “belki bu sefer” umuduyla sizi orada tutar.
Sosyal Medya: Telefonunuzu her kontrol ettiğinizde yeni bir beğeni veya mesaj görmezsiniz. Bazen bildirim vardır, bazen yoktur. İşte o belirsiz ödül ihtimali, parmağınızın sürekli ekranı aşağı kaydırmasına (refresh) ve saatlerce uygulamada kalmanıza neden olur.

Sonuç olarak, Edimsel Koşullanma, hayatımızın her alanında işleyen güçlü bir yasadır. Ebeveynlikten iş yönetimine, eğitimden teknoloji bağımlılığına kadar her yerde “davranış ve sonuçları” denklemini görürüz. Bizler, sonuçlarımızın mimarları olduğumuz kadar, sonuçlarımızın da eseriyiz.

Peki ya her şeyi deneyimleyerek mi öğreniriz? Başkalarının hatalarından veya başarılarından ders çıkarmak mümkün değil mi? İşte o zaman sahneye Albert Bandura ve ünlü “Hacıyatmaz” (Bobo Doll) deneyi çıkıyor.

Gelecek Yazı: Öğrenmenin ABC’si 3: Gözlem Yoluyla Öğrenme (Bandura ve Bobo Doll Deneyi)

Kaynakça ve İleri Okuma

Skinner, B. F. (1953). Science and Human Behavior. Macmillan.
Schwartz, B., Wasserman, E. A., & Robbins, S. J. (2002). Psychology of Learning and Behavior. W. W. Norton & Company.
Pryor, K. (1999). Don’t Shoot the Dog!: The New Art of Teaching and Training. Bantam. (Edimsel koşullanmanın günlük hayatta ve hayvan eğitiminde kullanımı üzerine harika bir kitap).