本記事は、教育心理学の学び直しシリーズ第3回として、**スキナーの「オペラント条件づけ」**を中心に紹介します。
元ネタは『ようこそ教育心理学の世界へ』(神藤貴昭・久木山健一著/北樹出版)であり、筆者が1年前にまとめた学習記録を現在の視点でリライトしています。
「行動の結果」が学びを変える?
前回のパブロフによる「レスポンデント条件づけ」は、刺激に対して自然に起こる反応をコントロールするものでした。
一方で今回取り上げる「オペラント条件づけ」は、人間や動物が自発的に行う行動に注目します。
キーワードは、「行動 → 結果 → 行動の変化」。
つまり、「ある行動をした結果、良いこと(報酬)が起こった」または「嫌なこと(罰)がなくなった」など、行動の“結果”が“次の行動”を決めるという考え方です。
スキナーのハトとネズミ
この理論を提唱したのは、アメリカの心理学者 B.F.スキナー。
彼は有名な「スキナー箱」を使って、ハトやネズミがレバーを押すとエサが出てくるという実験を行いました。
結果として、ハトはエサが出る条件でレバーをどんどん押すようになります。
このように、「ある行動が報酬につながる」と分かると、その行動の頻度が増える。
これを**強化(reinforcement)**と呼びます。
強化と罰の4分類
オペラント条件づけでは、「強化」と「罰」はさらに細かく分類されます:
| 種類 | 行動の後に | 効果 |
|---|---|---|
| 正の強化 | 良いことが起こる | 行動が増える(例:褒められる) |
| 負の強化 | 嫌なことがなくなる | 行動が増える(例:叱責がなくなる) |
| 正の罰 | 嫌なことが起こる | 行動が減る(例:叱られる) |
| 負の罰 | 良いことがなくなる | 行動が減る(例:ご褒美を取り上げられる) |
強化は行動を“促進”し、罰は行動を“抑制”します。
ポイントは、**正/負というのは「良い・悪い」の意味ではなく、「与える・取り除く」**という操作の意味で使われていることです。
報酬のスケジュールも大事
「強化」は単に“与える”だけでなく、“どんな間隔で与えるか”によっても、学習の定着度が変わってきます。
これを強化スケジュールと呼び、以下のような種類があります:
-
連続強化:毎回ご褒美がもらえる(最初の学習には有効)
-
間欠強化:時々しかもらえない(行動の持続に効果的)
実はギャンブルやスマホゲームがやめられないのも、この「間欠強化」による依存性が一因です。
教育場面での活用と注意点
オペラント条件づけの考え方は、教育現場でも広く応用されています。
たとえば:
-
子どもが宿題をやったら褒める(正の強化)
-
叱責しない代わりに静かにご褒美を取り上げる(負の罰)
ただし注意が必要なのは、強化が「操作」として使われすぎると、内発的動機づけが損なわれることがあるという点です。
「褒められたいからやる」から「やりたいからやる」へとシフトすることが、より本質的な学びにつながります。
おわりに:行動の“意味”も考えよう
オペラント条件づけは、「行動と結果」のつながりを明確にしてくれる有効な学習理論です。
ただし、あくまでも行動の「外側」からの視点に過ぎません。
子どもの行動の裏にある「不安」や「意欲」「価値観」といった内側の要因に目を向けることで、より深い理解と支援が可能になります。
次回は、「観察学習」──他者の行動を見て学ぶメカニズムについて掘り下げていきます。
-
#オペラント条件づけ
-
#スキナー
-
#報酬と罰
-
#学び直し心理学