初心者でもわかるデータ分析プロジェクトの全体設計
公開:2021年9月30日(木)| データ分析
こんにちは。データサイエンティストの永井です。
九月に入り、急に秋めいてきましたね。体調管理には、より一層気を付けていきましょう!
さて、今回のコラムでは、「データ分析プロジェクトの全体設計」についてお話しさせていただきます。こちらは、8月20日に実施させていただいた弊社ウェビナー【自社のデータをどう分析するか?分析の設計と地理的要素がポイント!】の内容を一部抜粋し、解説いたします。
はじめに
DX推進が叫ばれている昨今、データを利用したいけれど、何から手を付けていいかわからない…というご相談をいただくことがあります。
データ利活用に対し、ある程度イメージや課題感が見えているようであれば、最適なサーバやツールの選定、データ統合と進んでいただいて問題ありません。しかし、そうでない段階でデータ分析基盤を検討するのは難しいですよね。基盤を導入してから、やりたいことができなかったと後悔したケースもお聞きしました。
そこで、基盤を導入する前にデータ分析プロジェクトのサイクルを一度回してみて、データ活用のイメージや課題を明確化するという方法をご紹介します。この方法はスモールスタートできるので、お客様のDXの最初の一歩として挑戦してみてはいかがでしょうか。
スモールスタートではじめるデータ分析プロジェクトの全体像
スモールスタートで行うプロジェクトの前に、データ分析プロジェクトの一般的な進め方をご紹介します(下図参照)。
最初にデータ分析基盤を導入し、各種システムから必要なデータを連携して、システム内でデータを整える。各種BIツールを導入して、データを可視化する。可視化したデータをもとに、施策を検討し、実行してみる。そして、実行結果を分析し、次の施策に繋げていく…という流れになります。
この場合、「何について分析したいのか」「目的・課題は何なのか」「どのような運用を想定しているのか」を整理せずにデータ基盤を構築してしまい、いざ可視化のフェーズになっても見たいものが見れない状態だった。といった失敗ケースがよくあります。
この「データ分析基盤およびBIツールの導入」のプロセスを、いったん後回しにしたのが次の図になります。
この場合、最初に行うことは「ディスカッションによる仮説構築」になります。まず、データ分析でどのようなビジネス課題を解決したいかを明確化したうえで、お手持ちのデータを棚卸し、その中でできることを探っていくという手順になります。
分析作業はローカルで行うため、大量のデータを日次で更新して処理していくことは難しいですが、直近数年分のデータからでも見えてくることはあります。分析した結果をもとに施策を回すサイクルを数回繰り返すと、データの活用イメージや課題が明確になってきます。
この段階になってから分析基盤の構築を行えば、あとから手戻りする危険性が減り、スムーズにデータ利活用を進めていくことができます。
データ収集
それでは、プロセスの各段階を見ていきましょう。最初に、課題に即したデータ収集についてお話しします。
よく「今あるデータで何かわからないか」や、「機械学習で何かできないか」といったお話をうかがいます。これはプロジェクトが迷子になる原因のひとつです。「どのようなビジネス課題を解決したいか」を明確にしないまま始めてしまうと、「結果をどう生かすか」の部分にたどり着けずに終わってしまいがちです。
そこで、まず既存のフレームワーク(SWOT分析や3C分析など)などを活用して、プロジェクトのゴールとなる課題を、ひとつ決めてください。
例えば、次の図は、ロジックツリーを使ってビジネス課題をブレイクダウンした例です。売上向上を達成するには、さまざまな方法が考えられます。その中で、施策効果が上がりそうなもの、手持ちのデータ内で検証できそうなもの…といった基準で、優先順位を検討します。
ここで決めたビジネス課題をもとに、関連しそうなデータを集めていきます。
優良顧客の抽出の場合、売上データや顧客情報が必要になります。そうした定量データだけでなく、アンケートデータや売り場担当者の共有メモといった定性データ、行政から提供されるオープンデータ等、使えそうなものをできるだけ広く集めてください。
どのようなデータを集め、どう見ていくかを決めるうえで重要なのが、現場の方の肌感覚です。
例えば、「最近小さいお子さんを連れた若いママさんが口コミで来て、たくさん買ってくれる」とか、「〇〇にできた競合店の近くのお客さんが来なくなっちゃった」といった話が聞けるかもしれません。前者を検証するなら、売上データと顧客情報から、年齢層ごとの売上を時系列で見ればよいと思います(子供用品を買った人に子供有りフラグを立てる方法もあります)。後者なら、売上データと住所データから、地域ごとの来店頻度を可視化すれば、見えてくると思います。
売上データを見るだけなら、Excelでも可能ですね。結果を地図上にマッピングをしたいなら、Tableau等のBIツールの試用期間を利用することもできます。やりたいことから逆算して、使えそうなツールを検討してみてください。
データの可視化
ここまで整理できましたら、次はデータの可視化を行います。先ほど立てた仮説が本当かを検証してみましょう。
例えば、次の図は、ある期間の売上金額ランキングです。(※Tableau付属のサンプルデータを使用しています)
これだけでは、どのように傾向を見ていいかわかりません。そこで、ランキング順に顧客を10分割します。顧客が1000人いるなら、1位~100位、101位~200位…と分けて売上を合算し、それぞれ、デシル1、デシル2…デシル10と名前を付けます。次に、各デシルが売上全体に占める割合を足しあげた折れ線グラフを重ねます。すると、下の図のようになります。
※デシル分析:デシルはラテン語で10等分の意味を持ちます。顧客の購入金額などをもとに、上位から10等分し、各グループ(デシル1~10)の購入比率や売上構成比などを分析する手法のことです。
デシル1だけで総売り上げの25.48%を占めます。デシル2は17.12%、デシル3は13.79%…となっているのを足しあげ、デシル4まで足すと、67.48%になります。このお店では、デシル4=上位40%までの顧客が、売り上げの約7割を占めていることになります。こういう図をパレート図といい、この分析をデシル分析と呼びます。
では、売上の大半を占める上位デシルに所属しているのは、どんな顧客でしょうか。年齢、性別、購入頻度、居住地、よく買う商品ジャンルなどに特徴があるかもしれません。最初に作った仮説(若いママさん、ある地域の居住者など)と比べて、合致しているか検証してみましょう。
施策検討
可視化によって、有望そうな顧客層が見えてきたら、次は、どこに施策を打っていくかを検討します。その際、「30代女性」や「今月5000円以上購入している顧客」のように、属性または行動で表すことができる切り方をします。これを顧客セグメントと呼びます。
この顧客セグメントごとに、どの媒体で、どのようなコミュニケーションを取るかを考えます。オンライン施策であれば、Webプロモーション施策を策定し、セグメントごとに異なるメルマガを送信したり、SNS広告の配信を行います。
オフライン施策であれば、オンデマンドDMを使う方法もあります。セグメントごとに異なるDMを送付し、QRコードでWebサイトに誘導したり、クーポンを同封して店頭でカウントしたりすることができます。
施策実行
施策に関しては、業態によって、また、狙うセグメントによって、できることが変わってくるかと思います。新たなコンテンツの作成が必要になるケースもあります。
ともあれ、データ分析結果をもとに、ターゲットセグメントに施策を実施した際は、必ず効果測定を行ってください。Webサイトのアクセス数でも、メルマガの開封数でも、店舗でのクーポン回収数でも構いません。施策を行う前と後で、どのような変化があったかを、あとで評価できる状態にして下さい。
そして、施策終了後に、結果の可視化を行います。
何%増加しましたというだけでなく、「セグメントの中でも、ここは施策効果があったが、別のところは効果が薄かった。それは何故か」というところまで踏み込めると、次の施策に結び付いてきます。
施策結果を可視化して評価し、フィードバックして新たな施策に生かす、というPDCAを回すうちに、だんだんデータドリブンなマーケティングのノウハウが蓄積されていきます。そして、ある程度「このデータをこう活用していけばよさそう」というイメージができましたら、改めてデータ統合、基盤導入と進んでいけばよいかと思います。
関連コラム記事
関連ソリューション
Web&デジタルマーケティングの
お悩みを一緒に解決します!
今後のセミナー開催情報をメルマガにてお送りします