心理学勉強記録

このブログは、心理学を学んでいる私が、日々のテキストを自分なりに解釈しながらアウトプットしていく記録です。 主に自分自身の復習用として作成していますが、心理学に興味のある方、これから学び始める方にとっても、何かしら参考になる部分があれば幸いです。

心理統計入門③ ― 「代表値」と「ばらつき」:記述統計の核心へ

※本記事は、心理学を学ぶ上で欠かせない「統計学」の基礎として、記述統計の中核である「代表値」と「ばらつき(散布度)」について、自分なりに整理した学習記録です。専門用語をなるべく噛み砕き、初学者にも伝わるようにまとめています。

 

 

---

 

記述統計の目的は「データをわかりやすく」

 

記述統計とは、調査や実験で得られたデータを要約し、その特徴や傾向をわかりやすく伝えるための技術です。

 

記述統計では特に、以下の3つの視点が重視されます:

 

(a) だいたい(=代表値)

 

(b) ばらつき(=散布度)

 

(c) かかわり(=相関など)※次回以降扱う予定

 

 

今回はこのうち、(a)代表値と**(b)散布度**について見ていきます。

 

 

---

 

(a)「だいたい」の値 = 代表値とは?

 

代表値とは、「データの中心」や「全体の平均的な傾向」を示す指標のことです。

 

データの種類 主な代表値

 

量的データ 平均値(mean)、中央値(median)

質的データ 中央値、最頻値(mode)

 

 

 

---

 

● 代表値の種類と特徴

 

平均値(mean)

 すべてのデータを合計し、件数で割った値。1件あたりの標準的な大きさを表します。

 

中央値(median)

 データを小さい順に並べたとき、真ん中に位置する値(累積50%地点)。外れ値に影響されにくいのが特徴。

 

最頻値(mode)

 最も多く出現する値。データが「どこに集中しているか」を直感的に捉えるのに便利です。

 

 

👉 一般的な分析では平均値がよく用いられますが、極端な数値(外れ値)が混じる場合は中央値や最頻値を使う方が適切なケースもあります。

👉 また、データの分布を視覚的に捉える方法としては、**ヒストグラム(柱状図)**が有効です。

 

 

---

 

(b)「ばらつき」を見る = 散布度とは?

 

代表値だけでは、データの広がりやバラつきまでは分かりません。

その広がりを表すのが**散布度(ばらつきの指標)**です。

 

 

---

 

● 散布度の主な指標

 

標準偏差(SD)

 平均値のまわりにデータがどれだけ散らばっているかを示す。値が大きいほどバラつきが大きい。

 

四分位範囲(IQR)

 データの中央50%(第1四分位~第3四分位)にどれだけ広がりがあるかを示す。中央値を基準にしたばらつきの指標。

 

 

👉 平均を使うなら標準偏差、中央値を使うなら四分位範囲、という組み合わせがよく使われます。

 

 

---

 

まとめ:代表値と散布度はセットで使う

 

統計において、「中心(代表値)」と「広がり(散布度)」は両輪のような関係です。どちらか一方だけでは、データの全体像は見えてきません。

 

たとえば、2つのグループで平均値が同じでも、ばらつき(標準偏差やIQR)が違えば**「安定している」「バラバラしている」といった印象が全く異なってくる**のです。

 

 

---

 

次回予告

 

次回は、データの「かかわり」や「関係性」に注目する相関分析やクロス集計の基本について取り上げます。どんなデータとどんなデータが「つながっているのか?」を見極める技術は、心理学においても極めて重要です。

 

 

---

 

#心理統計 #記述統計 #代表値 #中央値 #標準偏差 #心理学部 #学び直し #大人の学び #データ分析 #ヒストグラム