心理学勉強記録

このブログは、心理学を学んでいる私が、日々のテキストを自分なりに解釈しながらアウトプットしていく記録です。 主に自分自身の復習用として作成していますが、心理学に興味のある方、これから学び始める方にとっても、何かしら参考になる部分があれば幸いです。

【教育心理学③】オペラント条件づけ:報酬と罰で人はどう学ぶか?

本記事は、教育心理学の学び直しシリーズ第3回として、**スキナーの「オペラント条件づけ」**を中心に紹介します。
元ネタは『ようこそ教育心理学の世界へ』(神藤貴昭・久木山健一著/北樹出版)であり、筆者が1年前にまとめた学習記録を現在の視点でリライトしています。


「行動の結果」が学びを変える?

前回のパブロフによる「レスポンデント条件づけ」は、刺激に対して自然に起こる反応をコントロールするものでした。
一方で今回取り上げる「オペラント条件づけ」は、人間や動物が自発的に行う行動に注目します。

キーワードは、「行動 → 結果 → 行動の変化」。
つまり、「ある行動をした結果、良いこと(報酬)が起こった」または「嫌なこと(罰)がなくなった」など、行動の“結果”が“次の行動”を決めるという考え方です。


スキナーのハトとネズミ

この理論を提唱したのは、アメリカの心理学者 B.F.スキナー
彼は有名な「スキナー箱」を使って、ハトやネズミがレバーを押すとエサが出てくるという実験を行いました。

結果として、ハトはエサが出る条件でレバーをどんどん押すようになります。
このように、「ある行動が報酬につながる」と分かると、その行動の頻度が増える。
これを**強化(reinforcement)**と呼びます。


強化と罰の4分類

オペラント条件づけでは、「強化」と「罰」はさらに細かく分類されます:

種類 行動の後に 効果
正の強化 良いことが起こる 行動が増える(例:褒められる)
負の強化 嫌なことがなくなる 行動が増える(例:叱責がなくなる)
正の罰 嫌なことが起こる 行動が減る(例:叱られる)
負の罰 良いことがなくなる 行動が減る(例:ご褒美を取り上げられる)

強化は行動を“促進”し、は行動を“抑制”します。
ポイントは、**正/負というのは「良い・悪い」の意味ではなく、「与える・取り除く」**という操作の意味で使われていることです。


報酬のスケジュールも大事

「強化」は単に“与える”だけでなく、“どんな間隔で与えるか”によっても、学習の定着度が変わってきます。
これを強化スケジュールと呼び、以下のような種類があります:

  • 連続強化:毎回ご褒美がもらえる(最初の学習には有効)

  • 間欠強化:時々しかもらえない(行動の持続に効果的)

実はギャンブルやスマホゲームがやめられないのも、この「間欠強化」による依存性が一因です。


教育場面での活用と注意点

オペラント条件づけの考え方は、教育現場でも広く応用されています。

たとえば:

  • 子どもが宿題をやったら褒める(正の強化)

  • 叱責しない代わりに静かにご褒美を取り上げる(負の罰)

ただし注意が必要なのは、強化が「操作」として使われすぎると、内発的動機づけが損なわれることがあるという点です。
「褒められたいからやる」から「やりたいからやる」へとシフトすることが、より本質的な学びにつながります。


おわりに:行動の“意味”も考えよう

オペラント条件づけは、「行動と結果」のつながりを明確にしてくれる有効な学習理論です。
ただし、あくまでも行動の「外側」からの視点に過ぎません。

子どもの行動の裏にある「不安」や「意欲」「価値観」といった内側の要因に目を向けることで、より深い理解と支援が可能になります。

次回は、「観察学習」──他者の行動を見て学ぶメカニズムについて掘り下げていきます。


  • #教育心理学

  • #オペラント条件づけ

  • #スキナー

  • #報酬と罰

  • #学び直し心理学