シリーズ「データ分析入門」第2回:「中小企業診断士が解説する初心者のためのデータ分析入門」

みなさん、こんにちは。デジタルボーイです。

今回は、「データ分析入門」第2回です。「現役中小企業診断士による、初心者のためのデータ分析入門」という内容で、
現役の中小企業診断士で、データ分析を活用し経営コンサルティングを行っている僕が、データ分析初心者の方がデータ分析をどのように進めればいいのか、データ分析の現場と経験を元に解説したいと思います。

記事を書いた人

デジタルボーイです。
データサイエンス歴20年以上のおっさんです。中小企業診断士として、データサイエンス、WEBマーケティング、SEOに関するデータ分析、コンサルティングの仕事をしています。自己紹介の詳細はコチラ

目次

データ分析には大きく「探索的分析」と「仮説検証分析」の2つがある。

データ分析を始めるに当たって、ぜひ、まずはじめに知ってもらいたい考えがあります。それは、データ分析には、
「探索的分析」「仮説検証分析」の2つの考え方があるということです。

探索的分析とは?

例えば、僕のようなデータ分析コンサルタントは、特に事前知識などもなく、建設業だったり、人材派遣業など、全く知らない業界から依頼を受けてデータ分析をすることになったりします。このような場合はその分野の分析を始めて行うため、ざっくりとデータの概要を調査して、データからその会社の状況や業界の状況を眺めることがあります。

こんな感じの、特に事前知識がない状態でデータから色々、確認しながら進めていく分析プロセスを探索的分析と言います。このように探索的分析では、分析時点で分析の方向性や仮説を定めなくても分析プロセスを進めることができる反面、分析を始めた段階で確固たる分析の方向が定まっていないため、分析のゴールも定まっておらず、どこまでやったら分析が終わりかということが分かりづらい点もあり、あまり、初心者にはお勧めしません。初心者は、次の仮説検証分析のプロセスで分析を進める方がいでしょう。

仮説検証分析とは?

仮説検証分析の分析プロセスでは、その業界に精通している人だったり、何かしらの知見がある場合に、ある仮説を立てその仮説が正しいのかどうかを検証するプロセスで実施する分析となります。多くの場合、データ分析を行おうと考えている人は、何かしらのその分野での知見がある場合が多いと思うので、この仮説検証分析のプロセスを実施することが多いでしょう。

僕のような分析コンサルタントの場合は、例えばクラアイアント企業の経営改善させるための対策(仮説)を立て、その仮説が正しいのかどうかを検証するための分析プロセスとしても、実施します。

先ほども探索的分析でも解説した通り、基本的にはデータ分析初心者は、この仮説検証分析のプロセスで分析を始めることをお勧めします。

ということで、以降では仮説検証分析の進め方について解説しますね。

仮説検証分析の進め方

とは言え、仮説検証分析の進め方といっても、決まったやり方が確立されているわけではありません。そのため、あくまで、中小企業診断士としてデータ分析コンサルの活動を行っている僕の経験上ですが、データ分析プロジェクトはこのように進めていけば良い!という経験則で解説したいと思います。

仮説検証分析プロセスに沿ったデータ分析のプロジェクトの工程は以下となります。

仮説検証分析プロセスに沿ったデータ分析の工程

  • 工程1:ニーズの確認
  • 工程2:課題の発見のためのデータ分析と分析方針の決定
  • 工程3:課題に対する仮説立案
  • 工程4:仮説検証のためのデータ分析工程5:仮説検証のためのデータ分析
  • 工程6:結果の考察

架空の食品スーパー「分析屋」を例にデータ分析プロセスを体験

以降の仮説検証分析のプロセスに沿った、データ分析プロジェクトについて、架空の食品スーパー「分析屋」を念頭に置いて、解説したいと思います。

架空食品スーパー「分析屋」

都内に3店舗を経営する、独立系の食品スーパー。社長は創業者であり、今も食品の仕入れなどを行う。社長の息子は専務として、主に販促やマーケティングを担う。息子は創業者の経験と勘だけでなく、データ分析に基づいた店舗マーケティングの必要性を実感している。ちなみに、テレビでよくみるスーパー「アキダイ」の成功は親子揃って気になっている。

工程1:分析ニーズの確認〜なぜ、データ分析したいのか?

コンサルタントとしての経験から、この「なぜ、データ分析したいのか?」という点を、十分に確認することはとても重要です。

というのも、データ分析のやり方や分析の切り口は無数にあるため、データ分析の方向性が間違ってしまうと、突拍子もない方向に突っ走ってしまうことになりかねないからです。

サラリーマン分析コンサルだった頃の地獄の話・・・僕がサラリーマン分析コンサルだったころ、その頃の上司はパワハラ超絶クソ野郎でした。上司の指示通り分析すると「そんなんじゃダメだ、この視点でも分析しろよ」と言われ、さらにその分析するおと「こんなことが知りたいんじゃない、このようにやれよ」と延々とダメ出しされました。

で、今、僕は独立開業して、クライアントとゼロからプロジェクトを立上げる立場になって、その時のことをこう思ういます。はっきりいって、そのパワハラ超絶クソ野郎上司は、プロジェクトの立ち上げ段階でクライアントから「データ分析のニーズ」を汲み取ることができておらず、分析の方針がまるで固まっていなかったのです。自分のやるべきことやっておらず、そのツケを部下に押し付けていたのだと、今に思うと分かります。

こんな状況で分析プロジェクトを進めてしまうと、ゴールの見えないプロジェクトとなってしまいます。まるで、ゴールがどこかなのかも確認せずにマラソンを走りすかのようです。分析の方針が決まらずに分析プロジェクトを進めてしまうと、多かれ少なかれ、このようにドツボにハマることは、統計モデルを使わなくとも予測できます。

あるいは、データ分析に慣れれば慣れるほど、自分の使えるデータ分析の手法から、物事を考えてしまうこともよくあります。例えば、「このような売上データだったら、〇〇分析ができる」というように、データの形状から分析の方向性や分析手法を決めてしまうことは、データサイエンティスあるあるだったりします。

でも、多くの場合、データ分析プロセスにおいては、データ分析自体が目的ではなく、データ分析は手段であり、データ分析という道具を利用することで、実現させたい目的があるはず、なのです。

そのため、データ分析プロジェクトを開始する際は、必ず「なぜ、データ分析が必要なのか?」について再定義し、出発するようにしましょう。以下は、食品スーパー分析屋におけるデータ分析ニーズの例です。

架空食品スーパー分析屋のデータ分析のニーズ

  1. コロナ禍で売上が上がった食品スーパー「分析屋」だが、最近売れ行きが芳しくない。
  2. 有効な対策を打ちたいが、何が有効なのかもわからない。
  3. そのため、データ分析を活用し、売上改善のための有効な対策を講じたい
  4. 分析ニーズ:「データ分析を活用し、売上改善のための有効な対策を講じたい」

工程2:課題の発見のためのデータ分析と分析方針の決定

続いて、課題発見を行います。僕は仕事柄、よく、データ分析の書籍を読むのですが、この課題発見のためのフェーズが抜け落ちている書籍がほとんどのようです。

データ分析の書籍では、この「課題発見」という工程がごっそりと抜け落ちている一方、中小企業診断士や経営コンサルタントにとっては「経営診断」というコンサルティングプロセスで課題発見という作業が行われることもあり、非常に馴染みのある行為です。

そのため、僕自身は、データ分析プロジェクトを進める上で、課題発見の工程はあって当たり前で、ないと逆に気持ち悪いくらいです。

そして、データ分析において、なぜ課題発見が必要なのかというとそれはズバリ、「企業にとって本当の課題は、経営者も分かっているとは限らないから」なのです。例えば、業績が上がらないワンマン経営の会社で、経営者の独善的な行動が従業員のやる気を阻害し、営業成績が上がらないにも関わらず、ワンマン経営者が「うちの従業員のやる気の無さが当社の課題だ」というようなものです。

このような典型的な例でなくとも、企業の本当の課題や問題の原因というものは、経営者でも、実はなかなかわからないものなんですね。

そのため、問題の本当の原因を突き止めるため、まずは簡単なデータ分析を行うことをお勧めします。とはいえ、この工程では、課題を発見するためなので、そんなに難しいことを行う必要はありません。

やり方としては、以下の3つのステップで進めてください。

データ分析プロジェクトにおける、課題発見のプロセス

  1. データ分析の目的となる指標(売上、利益、不良品率・・・)を決める。
  2. 目的となる指標は、どんな要素から構成されているのか、リストアップしてみる
  3. 構成要素のデータを時系列で比較し、問題を特定する

では、食品スーパー分析屋を例に、課題発見のプロセスについて具体的に見ていきましょう。

架空スーパー分析屋における課題発見プロセスの例

  1. データ分析の目的となる指標:「売上」
  2. 売上を構成している要素:
    • 部門(生肉、野菜、日用雑貨、酒類等)
    • 時間帯(午前中、昼、夕方、夜)
    • 曜日(平日、休日)
  3. 構成要素のデータを時系列で比較し、問題を特定する:以下図参照

上の図をみるとわかるように、部門別の売上で比較したとこころ、「酒類」の売上が大きく減少していることがわかります。ここから、スーパー分析屋の専務は今回の課題を「酒類」と結論づけました。

このように、今回の例で言えばスーパーの売上が目的となる指標でしたが、このように、目的となる指標を構成する部門やカテゴリーで分類し、構成要素同士の比較や、時系列での比較をすることで、課題を発見しましょう。

以上より、スーパー分析屋の分析方針として、「酒類の売上を回復させるためのデータ分析を行う」を設定しました。

工程3:課題に対する仮説立案

分析プロセスの前工程2ではデータに基づき課題を発見しました。工程3では、その課題を解決するためにはどのような対策が必要か、についての仮説を立案します。

ビジネス場面で、この工程を行う場合は、ぜひチームで話し合いながら、いくつかの案を出すようにしましょう。特に現場の意見を取り入れることは非常に重要になります。コンサルの僕も、クライアントとこの工程を進めるにあたっては、できるだけ他部署のメンバーもディスカッションに参加していただき、アイデア出しをお願いするようにしています。

架空スーパー分析屋の例:
酒類の販売額を回復させるための仮説:「健康志向への対応」

チーム内で、課題解決のためのディスカッションをしたところ、ある販売担当者から「顧客の健康志向への変化」への対応ができていないことが最大の課題であるのでは?との意見が出た。

そのため、健康志向の顧客がなどが好むと思われる、ノンアルビールや微アルコールビールなど
の品揃えを拡充すればいいのでは?、との仮説が考えられた。

このディスカッションで仮説として出された「健康志向への対応」が売上に貢献することを証明するには、売上データを分析し、「ここ数年でノンアルビールや微アルコールビールなどの売上が増加している」という結果を出すことが必要です。

その結果、健康志向のアルコールがここ数年増加傾向となっているようであれば、確かに、健康志向のアルコールの品揃えを拡大させることは、売上増加につながる可能性は高そうですね!

では、次の工程で、その仮説が本当に正しいのか検証するためのデータ分析についてみていきましょう。

工程4:仮説検証のためのデータ分析

前工程「工程3:課題に対する仮説立案」では仮説:健康志向への対応が立てられました。そして、この工程では上の仮説が本当に正しいのか、データ分析により検証するということを行います。

それでは仮説の正しさを検証するためには、どのようなデータ分析が可能なのか見ていきましょう。

ただし、ここで述べるデータの分析方法は、あくまで僕が考えるデータ分析のやり方であり、人によってやり方は様々で、どれが正しいと言うことはありません。

このやり方以外にはないと言うことはないので、「自分だったらこんな分析をやる」と言うスタンスで見てもらえるといいと思います。

「仮説:健康志向への対応」への検証

仮説では、健康志向の顧客がなどが好むと思われる、ノンアルビールや微アルコールビールなどの品揃えを
もっと増やすと言うことが検討されました。

そのため、まずは、「健康志向の顧客がなどが好むと思われる、ノンアルビールや微アルコールビールなどの売り上げが
何かに比べて増加している」が言えるといいでしょう。

ちなみに、スーパー分析屋では次のように分析を進めたようです。

架空スーパー分析屋の分析ステップ

  1. アルコールの商品マスタから、ノンアルビールや微アルコールビールなどの健康志向のアルコールに該当する商品をリストアップする
  2. リストに該当するアルコールに「健康志向」と言う新たなカテゴリを付与し、売上データに紐づける
  3. 健康志向のアルコールとそうでないアルコールに分け、時系列で売上の推移を確認する
  4. 健康志向のアルコールの売上がそうでないアルコールに比べて増加していれば、仮説は正しかったと結論づける


ここで、1と2はデータハンドリングやデータ加工と言われる作業で、3が実際のデータ分析作業、4がデータを基にした意思決定のプロセスとなります。

このように3の分析作業に入る前に、多くのデータ分析では、1と2のようにデータの加工が必要となります。
そして、実際の3の分析作業の時間よりの遥かに長い時間の作業をデータの加工に費やさないといけないことが多々あります。

このような手順で、データの分析を行なっていきます。架空スーパー分析屋の分析結果では、確かに健康志向アルコールの売上が増加しているということがグラフから見えてきましたね!

ところで、読者の方の中には「データ分析をやるのに、前の工程などやらなくても、いきなりこの工程のデータ分析からすればいいじゃないか」と思われた方もいると思います。

しかし、これまでの工程があったからこそ、データ分析を効果的に実施できるのです。

例えば、ここで述べたデータ加工の作業はデータ分析の作業時間の90%近くを占める、厄介な作業ですが、
必要なデータ分析が増えれば増えるほど、データ加工の作業時間も増えてしまいます。

そのため、効果的にデータ分析作業を行うためには、不必要な分析作業をできるだけ減らす必要があります。
だからこそ、この前工程で行った仮説をしっかりと立てるということが、とても重要になってくるんですね。

工程5:対策の実行と効果検証

データ分析の結果、検証が正しいと判断できれば、その対策の実行を行います。
もちろん、対策はやりっぱなしではなく、やった後にもデータの分析により効果を検証することが必要です。

このことを効果検証と言います。

架空スーパー分析屋における効果検証結果の例:

健康志向の酒類の品揃えをさらに拡大し、店頭でのプロモーション活動を行った。
その結果、次のような結果となった。



結果から、プロモーション前に比べて、136%の売上上昇となった。

実際のビジネス場面では多くの場合、このように鮮やかに効果が出ることはほとんどありませんが、
それでも、小さな成功の積み重ねが経営を良くしていくことに違いはありません。

地道な仮説立案と対策の実行と分析が重要なんですね。

最後に

以上が、仮説検証分析による、データ分析プロジェクトの進め方の例になります。

読者の方によっては、データ分析と言われて想像するイメージは、データサイエンティストが鮮やかに問題解決をビシバシとしていく場面かもしれません。しかし、実際には、データ分析の多くの作業は地道なデータの加工などの地味な作業だったりします。

でも、僕自身はこのような地味な作業も含めてデータ分析という仕事がとても好きです。今回の内容を読んでいただき、少しでもデータ分析に興味を持っていただけるととても嬉しいです。

次のコラムでさらに「データ分析の面白さ」に焦点を当てて、解説したいと思います!

目次