前回は、量的(定量)アンケート調査の主な目的タイプについてお話しましたが、今回は効率よくアンケートデータを分析するコツについてお話します。
アンケートデータ分析の大まかな流れ
アンケート調査を行って収集したデータは、下記のように全体から細部へ(森から木へ)の流れで集計・分析をしていきます。
- 単純集計(Grand Total:GT):回答者全体の要約。全体データの傾向を見る。各項目の回答頻度(数)と回答割合(%)を計算。
- クロス集計:項目をクロス掛けし、回答の関連性を見る。よく行う方法は、性別、年齢別、現在使用している製品ブランド別毎に回答を見ることで、グループごとに特徴をつかむ。
自由回答はインサイトの宝庫
アンケート調査でお勧めなのが、評価項目と関連するコメントを読み込むことです。点数評価法等比べると、自由回答は回答者への回答方法の縛りがなく、回答者は自由に意見を書くことができます。例えば、5段階評価で商品の満足度を聞いた後、満足度の理由を聞いた場合、5段階評価と照らし合わせて何が満足度を左右しているのかを読み取ることができます。
ただし、自由回答の取り扱いには注意点もあります。具体的には、「点数評価や選択肢による回答等と比べて集計が難しい」ことが言えます。また、回答者の中には、コメントを書くことが面倒に感じる人もいますし、表現方法も人によって違います。また設問によっては、感じたことをことばで表現しにくい場合もありますので、注意が必要です。
自由回答の集計・分析方法
点数評価等にに比べて、自由回答の集計は複雑ですが、手段はあります。例えば、回答数が多い場合や傾向を知りたい場合、以下の方法を使うことができます。
- アフターコーディングによるカウント:予め作成しておいたキーワードのコード表に従って、収集したコメントの中にあるキーワード数をカウントする方法。アンケート後にコーディングするのでアフターコーディングという。参考までに、プリコーディングとは、アンケートの選択形式の項目のこと。
- テキストマイニングツールの活用:単語同士の関連性を見るテキストマイニングのソフトウェアを使用。様々なテキストマイニングツールがあるため、比較検討することをお勧めします。なお、件数が少ない場合は生データのコメントを読み込むことをお勧めします。
ターゲットセグメントを見つける手段
一般的にターゲットセグメントを見つけるには、まず、クロス集計を行います。そのほか、ターゲットグループを見つける手段を挙げてみました。
- クロス集計:属性(性別、年齢等)の項目別や使用している商品ブランド別等、いろいろな切り口で実施してみます。クロス集計は、Excelのピボットテーブルでも行うことができます。
- クラスター分析:回答項目の中で、よく似た回答(例えば、「爽やか」と「新鮮」の点数が似ている場合)をグルーピングし、グルーピングされた項目により、クラスターに分ける方法です。
- よく似た回答のグルーピングは、主成分分析(PCA: Principle Component Analysis)が用いられますが、主成分を使うには、主成分分布を確認し、第1主成分、第2主成分等、きれいに主成分が分かれていることを確認することが重要です。理想的なのが、第1主成分から第5主成分ぐらいまで80%~90%のデータを網羅していること(累積寄与率で確認)が理想的ですが、第1主成分に項目が固まったり等、なかなかきれいにデータが出ないことがよくあります。なお、主成分の数が決まれば、その数をもとにクラスター分析を行います。
- クラスター分析には、階層型(クラスターを樹形図で表す)、非階層型の2種類の方法があります。一般的には、非階層型のK-means法がよく用いられます。
- 裏ワザ:クロス集計でもクラスター分析でもターゲットセグメントが見つからない場合、例えば、A商品の購入意向が非常に高い人のデータを抽出し、その人たちに共通の特徴(例えば、職業、年齢、購買チャネル等)を見つける方法です。
ただ、データからターゲットセグメントが見つかっても、マクロ的な顧客理解のレベルなので、顧客インタビュー等の質的(定性)調査で顧客に直接会ってターゲット顧客のペルソナ確認をお勧めします。
最後に、データ分析の注意点 – データクリーニング
アンケート調査でデータを収集した後は、いきなり統計分析に移らずに、まずざっとデータを見て重複等おかしなデータが混じっていないかを確認し、明らかに重複データ等がある場合はあらかじめ除去しておくことが大切です。
次回は、活用する観点から、インタビュー調査のアウトプットの見せ方、まとめ方についてお話します。