B.F.スキナー(1904〜1990年)は、行動主義心理学を発展させたアメリカの心理学者です。スキナーが提唱したオペラント条件づけとは、自発的な行動がその結果によって頻度が変わっていく学習のことです。良い結果(報酬)が続くと、その行動は増えやすくなります。一方で、不快な結果や報酬の消失があると、行動は減りやすくなります。行動の後に起こる「結果」を操作することで、望ましい行動を増やしたり、望ましくない行動を減らしたりできるという理論です。
スキナー箱は、動物の行動を正確に記録するための実験装置です。レバーやキーは、動物が反応を示すための操作部として機能します。エサ箱(給餌装置)は強化子を与える役割を持ち、光や音の刺激装置は合図や条件提示に使われます。装置の各部が連携することで、動物の行動とその結果を正確にコントロール・記録できるように設計されています。
まず動物をスキナー箱に入れ、レバー押しやキーつつきなどの自発的な反応を観察します。次に反応の直後にエサを与える、または特定の刺激を提示します。さらに反応回数の増減を記録し、学習の進み方を分析します。重要なポイントは「反応の直後に結果が与えられる」という即時性で、この仕組みが行動の学習を促進します。
強化とは行動を増やす仕組み、罰とは行動を減らす仕組みです。正の強化は行動の後に好ましいものを与えて行動を増やす方法で、レバーを押したらエサが出る場合がこれにあたります。負の強化は不快な刺激がなくなることで行動が増えることを指します。一方、罰は不快な結果や好ましいものの消失によって行動を減らします。スキナー箱では特に強化の効果を調べる実験が多く行われました。
シェイピング(逐次接近法)とは、最初から完成した行動を求めるのではなく、目標行動に少しずつ近い行動を段階的に強化していく手法です。例えば、箱の近くに来たら強化し、次にレバーの方を見たら強化し、さらにレバーに触れたら強化し、最終的にレバーを押したら強化するという手順で進めます。こうして複雑な行動も段階的に学習させることができます。小さな成功を積み重ねることが、最終的な目標行動への到達につながります。
強化スケジュールとは、どのタイミングで報酬を与えるかを定めた方法です。連続強化(CRF)は反応するたびに毎回強化する方法で、学習の初期段階に適しています。固定比率(FR)は一定回数ごとに、変動比率(VR)は回数を変えながら強化します。固定間隔(FI)は一定時間ごと、変動間隔(VI)は時間間隔を変えながら強化する方法です。中でも変動比率は反応が最も持続しやすく、ギャンブルや習慣形成の仕組みとも深く関わっています。
スキナー箱実験によって、報酬が続くと対応する行動の頻度が高まりやすいことが明らかになりました。また、強化の与え方によって反応の速さや持続性が変わることも分かりました。行動は偶然ではなく、環境との相互作用の中で形成されます。さらに学習を数量的に記録できた点は、心理学に実験科学としての地位をもたらした大きな成果でした。
スキナーの行動理論は多くの実践分野に応用されています。教育では、望ましい行動をほめて伸ばす方法の理解につながります。また動物の訓練やしつけにも、強化の考え方が利用されています。行動療法や応用行動分析の基礎として重要であり、人間の学習や習慣形成を考える上でも大きな影響を与えました。スキナーの理論は、教育・しつけ・医療・ビジネスなどさまざまな分野で今も役立っています。
スキナー箱実験は行動科学に多大な貢献をしましたが、いくつかの限界も指摘されています。単純な行動を中心に扱うため、人間の複雑な思考や感情を十分に説明できないという点がその一つです。また実験室環境であるため、現実社会の行動にそのまま当てはめられない場合もあります。しかしスキナー箱実験は、行動が結果によって学習されることを明確に示した基本実験として、オペラント条件づけ・強化・シェイピングとともに今回お伝えしました。