社会との良好な関係づくりを支援する調査、分析、コンサルティング

対応分析(コレスポンデンス分析)

対応分析(コレスポンデンス分析)

【対応分析(コレスポンデンス分析)について】
クロス集計表など、行と列からなるデータの特徴を図示し、項目間の関係を視覚的に把握する方法です。偏りの小さい項目は原点付近に、偏りの大きい項目は原点から遠くに布置されます。また、互いに関連の強い項目どうしは、原点からみて同一方向に布置される性質があります。

ここでは、対応分析を行うにあたり、2つの調査項目の関係について調べるためにクロス集計を用いました。クロス集計の表のレイアウトは、集計したい調査項目が各列に並ぶよう配置し、分類したい調査項目を各行に並ぶよう配置しています。そのうえで、クロス集計の行と列の相関係数が最大になるように、行と列の順序を距離を求め、二次元の図の中で付置する場所を決定します。

【どのような場面で活用されるか】
集計したい項目と分類したい項目が多数あるとき、それぞれの関係を一目で把握したいときに活用されます。

【分析例】
年代別にみた昼食の特徴(架空のデータ)

年代別で食べた昼食の傾向に差があるかについて分析します。この例では、年代(20代~60代)別の昼食の中身(牛丼・かつ丼・天丼・親子丼・衣笠丼)のクロス集計表を用いています。この際、集計したい項目は昼食の中身で、分類したい項目は年代です。集計結果は下表のようになったとします。表の中身は人数で、年代ごとに何人がどの昼食を食べているのか示しています。

このクロス集計をもとに、年代と昼食の中身の相関関係が最大となるような配置(各行、列の項目の順序、相対的な位置)を求め、平面上に配置しました。この対応分析(コレスポンデンス分析)から、年代別の昼食の中身の特徴、年代間、メニュー間の類似性を把握することができます。

まず、それぞれの軸に注目します。この図をみると、横軸(1軸)は、20代・30代~40代・50代・60代と年代順に配置されています。縦軸(2軸)は、天丼~かつ丼・牛丼~親子丼・衣笠丼と布置されています。具なのか、味付けなのか、解釈しにくいデータですが、何らかの傾向が仮定されます。

これを踏まえて1軸、2軸を同時に配置した平面を見ます。コレスポンデンス分析では、偏りの小さい項目は原点付近に、偏りの大きい項目は原点から遠くに布置されます。また、互いに関連の強い項目どうしは、原点からみて同一方向に布置される性質がありますが、数学的には、平面上の距離が近いからといって、傾向が似ているとは言い切れないこともあるのですが、実用的にはそのような使い方をすることがあります。

20代、30代の近くにはかつ丼と牛丼が、40代の近くには天丼がそれぞれ布置されています。また、50代と60代の近くには親子丼と衣笠丼が布置されています。このことより、20代、30代は、他の年代よりもかつ丼、牛丼を食べ、また40代は天丼を、50代と60代は親子丼と衣笠丼をそれぞれ食べるという、クロス集計結果が図で表現されました(コレスポンデンス分析は、あくまでもデータ(ここではクロス集計結果)を図示する方法のひとつですので、矛盾がある場合はコレスポンデンス分析による表現を控えます)。

分析精度については、各次元(1軸、2軸)に対する固有値と単相関係数が示されています。単相関係数の2乗が固有値です。また、ソフトウェアによっては、「各軸の説明度」を表示してくれるものもあります。これは、その軸によって元のクロス集計表の情報の何%が表現し尽されているかという指標です。

また、1軸・2軸の値の差に意味があるかどうかを確認するため、カイ二乗検定を行います。カイ二乗検定とは、グループ間で差があるか否かを検定するものです。カイ二乗検定の結果を読み取る際には、値の差に意味がない確率を表すp値に注目します。今回の分析では、p値は1軸では0.000、2軸では0.031でした。つまり、1軸に意味がない確率は0.1%未満で、2軸に意味がない確率は3.1%となりました。一般に、意味がない確率(p値)が5%未満の場合、値の差に意味があると解釈されます。これに従えば、上の図の1軸・2軸の値の差には意味があることになります。

関連記事:賛否の理由:割り切れない気持ちを含めてコレスポンデンス分析

株式会社ペスコ 社会環境研究室 TEL 03-3435-9588

PAGETOP
Copyright © 株式会社ペスコ 社会環境研究室 All Rights Reserved.
Powered by WordPress & BizVektor Theme by Vektor,Inc. technology.