※本記事は、心理学を学ぶ上で欠かせない「統計学」の基礎として、記述統計の中核である「代表値」と「ばらつき(散布度)」について、自分なりに整理した学習記録です。専門用語をなるべく噛み砕き、初学者にも伝わるようにまとめています。
---
記述統計の目的は「データをわかりやすく」
記述統計とは、調査や実験で得られたデータを要約し、その特徴や傾向をわかりやすく伝えるための技術です。
記述統計では特に、以下の3つの視点が重視されます:
(a) だいたい(=代表値)
(b) ばらつき(=散布度)
(c) かかわり(=相関など)※次回以降扱う予定
今回はこのうち、(a)代表値と**(b)散布度**について見ていきます。
---
(a)「だいたい」の値 = 代表値とは?
代表値とは、「データの中心」や「全体の平均的な傾向」を示す指標のことです。
データの種類 主な代表値
量的データ 平均値(mean)、中央値(median)
質的データ 中央値、最頻値(mode)
---
● 代表値の種類と特徴
平均値(mean)
すべてのデータを合計し、件数で割った値。1件あたりの標準的な大きさを表します。
中央値(median)
データを小さい順に並べたとき、真ん中に位置する値(累積50%地点)。外れ値に影響されにくいのが特徴。
最頻値(mode)
最も多く出現する値。データが「どこに集中しているか」を直感的に捉えるのに便利です。
👉 一般的な分析では平均値がよく用いられますが、極端な数値(外れ値)が混じる場合は中央値や最頻値を使う方が適切なケースもあります。
👉 また、データの分布を視覚的に捉える方法としては、**ヒストグラム(柱状図)**が有効です。
---
(b)「ばらつき」を見る = 散布度とは?
代表値だけでは、データの広がりやバラつきまでは分かりません。
その広がりを表すのが**散布度(ばらつきの指標)**です。
---
● 散布度の主な指標
標準偏差(SD)
平均値のまわりにデータがどれだけ散らばっているかを示す。値が大きいほどバラつきが大きい。
四分位範囲(IQR)
データの中央50%(第1四分位~第3四分位)にどれだけ広がりがあるかを示す。中央値を基準にしたばらつきの指標。
👉 平均を使うなら標準偏差、中央値を使うなら四分位範囲、という組み合わせがよく使われます。
---
まとめ:代表値と散布度はセットで使う
統計において、「中心(代表値)」と「広がり(散布度)」は両輪のような関係です。どちらか一方だけでは、データの全体像は見えてきません。
たとえば、2つのグループで平均値が同じでも、ばらつき(標準偏差やIQR)が違えば**「安定している」「バラバラしている」といった印象が全く異なってくる**のです。
---
次回予告
次回は、データの「かかわり」や「関係性」に注目する相関分析やクロス集計の基本について取り上げます。どんなデータとどんなデータが「つながっているのか?」を見極める技術は、心理学においても極めて重要です。
---
#心理統計 #記述統計 #代表値 #中央値 #標準偏差 #心理学部 #学び直し #大人の学び #データ分析 #ヒストグラム