社会との良好な関係づくりを支援する調査、分析、コンサルティング

テキストマイニング

テキストマイニングについて

文章中に出てくる単語の出現回数や出現頻度、単語同士の結びつきを文章ごとに比較したうえで、個々の文章の持つ特徴を数理的に把握する分析手法です。
文章そのものを数値で把握することはできません。しかし文章を単語に分解したうえで、単語の出現回数や単語同士の結びつきは数理的に把握することができます。従来、これらの作業は手作業で行われ、分析には膨大な時間が必要でした。しかし、自然言語処理技術の発達により、膨大なテキストデータに対し分析を加えることができるようになりました。テキストマイニングのツールにはKH CODER(樋口耕一)やIBM SPSS Text Analytics for Surveys(IBM)、TRUE TELLER(野村総合研究所)などのソフトウェアやASPのサービスなどがあります。

何ができるの?

テキストマイニングにより、単語の出現回数や結びつきをみることで、膨大なテキストデータを読まなくても「このテキストはどのようなことが述べられているか」を一目で把握できます。また、文章どうしを比較することで「この文章には○○という単語が他と比べ多く出現している」「この文章では△△と□□の単語が結びついているが、別の文章では△△と○○の単語が結びついている」など、文章の持つ特徴を把握できます。
代表的な活用例には、アンケートの自由記述部分の分析があります。定性データであるテキストを計量可能なデータとすることで、様々な統計手法が適用できるようになります。例えば、単語どうし、単語とその他の属性(例えば、性別、地域別、時期別、商品別等)と文章との関係をクロス集計や対応分析(コレスポンデンス分析)により分析することで、これまで定性的に感じていた傾向(例えば、商品AとBそれぞれの魅力や特徴、ある政策を支持する根拠 等々)を定量的に把握したり、対象をグルーピングすることができます。他にも回帰分析や判別分析などを用いて予測モデルを作ることもできます。例えば「このような話題を持ち出すと、この商品を購入する確率が高まる」といったものです。他にも「会社を辞めてしまう人に特有の言い回し」「ネガティブな感情を持つ人が持ち出す話題」など、データ次第でさまざまに活用できます。
仮説を設定したうえでテキストマイニングが行われることもありますが、仮説を設定せずに探索的に行うことで新しい発見が得られることもあります。

簡単には書き尽くせませんが、テキストデータは宝の山です。ぜひ分析しましょう。

活用例

科学館の来館者日報分析

来館者の属性、来館日、滞在時間、スタッフとの質疑応答内容、アンケート結果を紐付けて分析しスタッフの対応や展示物の改善に活用しました。

生活相談の内容分析

生活者から寄せられた相談内容を分析し、健康、環境、生活など様々な課題に答えるための基礎資料を作成しました。

報道状況分析

特定のテーマに関連する報道の分析により、社会的関心の変化、媒体の特徴、ポジティブまたはネガティブにとられやすい文脈などを把握し、今後のコミュニケーションに活用しました。

施策・研究開発の動向分析


福島原子力発電所事故を受けて、国、自治体、大学・研究機関などさまざまな機関が実施した施策の記録を収集・分析し、時期、機関、地域別の特徴を明らかにしました。(The Society for Risk Analysis, Asia Conference 2018にて発表)

簡単な分析イメージ

【使用ソフト】KHcoder(KHコーダー) (解析部分はSPSS、Excel太閤なども活用)

株式会社ペスコ 社会環境研究室 TEL 03-3435-9588

PAGETOP
Copyright © 株式会社ペスコ 社会環境研究室 All Rights Reserved.
Powered by WordPress & BizVektor Theme by Vektor,Inc. technology.