調査分析スキル、技術的専門性、社会に対する洞察力でコミュニケーションを支援

コレスポンデンス分析(対応分析)

調査のこと、統計のこと、お気軽にご相談ください

コレスポンデンス分析(対応分析)は、クロス集計表などのカテゴリデータをもとに、項目間の関係性を視覚的に把握するための多変量解析手法です。

コレスポンデンス分析(対応分析)とは

クロス集計表に基づき、行と列のカテゴリ間の関係性(カイ二乗距離)をもとに多次元空間に配置し、それを主成分軸により2次元に縮約することで、構造や傾向を散布図で表現できます。
偏りの少ない項目は原点付近に、偏りの大きい項目は原点から遠くに配置されます。関連の強い項目同士は、原点から見て同じ方向に配置される傾向があります。

活用場面

  • 集計項目と分類項目の両方が多い場合
  • クロス集計表だけでは読み取りづらい傾向を図示したいとき
  • データの構造や類似性を視覚的に把握したいとき

分析例:年代別に見た昼食の傾向(架空データ)

20代〜60代の各年代で好まれる昼食メニューを、対応分析によって視覚化します。
行に年代、列に昼食メニュー(牛丼・かつ丼・天丼・親子丼・衣笠丼)を配置したクロス集計表をもとに、項目間の関係性を分析します。

分析の結果、次のような傾向が見られました:

  • 20代・30代の近くに「かつ丼」「牛丼」 → 若年層に人気
  • 40代の近くに「天丼」 → 中年層に好まれる傾向
  • 50代・60代の近くに「親子丼」「衣笠丼」 → 高年層の傾向

第1軸(横軸)は年代の流れに沿っており、「がっつり系からあっさり系」への傾向を示唆しています。第2軸(縦軸)では、天丼が他と異なる方向にあり、特異な傾向を持つ可能性がうかがえます。

結果の信頼性

対応分析の図はあくまで視覚的な補助であり、平面上の距離が近い=傾向が似ているとは限りません。
信頼性を確認するために、次のような指標を参照します:

  • 軸ごとの固有値(=単相関係数の2乗)
  • 累積寄与率(図では「各軸の説明度」;図がどの程度データを再現しているか)
  • カイ二乗検定によるp値(構造に統計的な意味があるか)

たとえば、1軸のp値が0.000、2軸が0.031であれば、いずれも有意(p<0.05)と判断され、視覚的な構造に意味があると解釈されます。

注意点

コレスポンデンス分析(対応分析)は、複数の尺度を強引に平面で表現する手法であり、クロス集計の結果を図示する方法のひとつにすぎません。以下の注意が必要です。

  • 距離や近接性はあくまで視覚的指標であり、統計的有意性を保証するものではありません
  • 第1軸・第2軸の寄与率が低い場合は、図の解釈に注意します(例:第3軸以降の影響が無視できない)
  • 極端に出現頻度の少ないカテゴリは、図の解釈にバイアスを与えるため除外も検討します
  • 図の構造が不自然な場合や、解釈に無理や矛盾がある場合には、コレスポンデンス分析(対応分析)による表現を控えます

 

次の関連記事では、下の事例を紹介します。

コレスポンデンス分析(対応分析)事例:二酸化炭素の地中貯留(CCS)に対する賛否の理由

コレスポンデンス分析(対応分析)事例:二酸化炭素の地中貯留(CCS)に対する賛否の理由

関連記事:賛否の理由:割り切れない気持ちを含めてコレスポンデンス分析

この半世紀の特撮ヒーロー主題歌を分析する

特撮ヒーロー主題歌の歌詞の時代別の特徴

関連記事: この半世紀の特撮ヒーロー主題歌を分析する

株式会社ペスコ 社会環境研究室 TEL 03-3435-9588

PAGETOP
Powered by WordPress & BizVektor Theme by Vektor,Inc. technology.