株式会社リクルートスタッフィングが運営するITSTAFFINGでは、弊社に派遣登録いただいている皆さまのスキル向上を支援するイベントを定期的に開催しています。
6月15日には、データ分析のスキルアップを支援する『データ分析を仕事で活用するために本当に必要なこと ~ それは統計でも分析ツールでもビッグデータでもなかった!』を開催しました。小手先のテクニックではなく、考え方やデータ分析の進め方などを学ぶ場となりました。
■今回のイベントでは
・「データ整理」と「データ分析」は何が違う?
・2軸の視点を使って複数のデータの関係性に着目する
・データ分析手法のひとつ「相関分析」
をご紹介。
データ分析について何も知らなくても大丈夫。難しいツールも不要。わかりやすい例と共に、データをどう活用していくか解説します。
▲【講 師】データ&ストーリー LLC代表 多摩大学大学院ビジネススクール客員教授 横浜国立大学非常勤講師 柏木吉基さん
日立製作所入社。2003年米国Emory UniversityにてMBAを取得後、日産自動車へ。 海外マーケティング&セールス部門、組織開発部 ビジネス改革マネージャ等を歴任。 組織の変革を行うChange agentとして、グローバル組織での経営課題の解決、社内変革プロジェクトのパイロットを数多く務める。2014年独立。「実務データ分析」「課題解決」「ロジカルシンキング」を軸とした、企業研修講師、コンサルタント、大学教員、著者として活動。
分析手法をいくら身につけてもパフォーマンスは変わらない
まず、今回のイベントで身につけて欲しい3つの項目を説明しました。
(1) 「データ整理」で終わる人、「データ分析」ができる人は何が違う?
(2) 複数のデータの関係性に着目する(2軸の視点)
(3) 関係性の強さから、意味ある繋がりを見つける(相関分析)
まず、「データ分析」ではない「データ整理」とは何でしょうか?データ分析を使うと、何ができるようになるのでしょうか?実はここをわかっていない人が多いのです。相談に来たクライアントとの「よくある会話」を例に紹介します。
クライアント:「仕事で数字を使わなければならなくなったのですが、会社の数字を活用できているという実感が持てないのです」
柏木さん:「いまはどんな分析をしているのですか?」
クライアント:「平均を出したり、グラフを作ったりしています。3つくらいの分析手法を使っていますが、さらに手法を学べば、もっといろんなことが見えてくるんですよね?」
実は、この考えが大きな間違い。例え100個のツールや分析手法をマスターしても、明日からのパフォーマンスは変わらないだろうと言えます。これは、分析ツールやシステムを導入して数年が経っても、何もデータから得られるものが変わらない企業が多いことからもわかります。
「データ整理」から脱する考え方
平均を取ったり、時系列で並べるだけでは、そのデータの傾向しかわかりません。
それはただの「データ整理」です。データ整理で面白い結果が得られることも、万が一にはあるかもしれません。ただ、それによるアクションが有効であるとどう説明するのでしょうか?たまたま出た結果では、それが最適解とは言い切れず、故に意思決定ができないのです。
データ整理ではなく「データ分析」に移るためには、次のアクションを成功に導くための「問い」とそれに答えるための「スキル」が必要です。「問い」と「スキル」は、下記のように対応します。
何を見るのか → 目的(課題)定義と仮説
どう見るのか → 多面的にデータをとらえる
なぜそうなのか → 2軸の視点
上の左側3つについて、「データを実際に触る前に」答えられるようにしなくてはなりません。それに答えるためのスキルが、それぞれ右側に書かれていることです。今回のイベントでは、時間の関係で「目的(課題)定義と仮説」「2軸の視点」について解説していきます。
データ分析とは、データとデータの関係性から「ストーリー」を導き出すこと
ここで、「2軸の視点」について解説します。最初のポイントにもあった「複数のデータの関係性に着目する」という内容です。
顧客満足度アンケート調査のデータを例に解説をしていきます。まず。よくあるのは顧客満足度の各要素を平均したグラフです。
ただ平均を出しただけでは、まさに「データ整理」の枠を超えません。まずは、データ分析を何に活用したいかを確認し、仮説を立てましょう。ここでは「満足度を高めてリピーターを増やしたい」とし、そのために「総合満足度をアップさせる」を目標にする、と考えてみます。
細かな項目のうち、何を改善すれば総合満足度がアップするのかを見極めることにしましょう。そう考えると、次のような2軸で考えられます。縦軸が「総合満足度」、横軸が各要素の満足度です。
これらのグラフでわかるのは、「予約の取れやすさ」と「接客の良さ」は、「総合満足度」との相関関係があるということです。つまり、この2つを改善すれば、総合満足度が高まる可能性が高いと予想できるのです。
ただし、関係が見える組み合わせを見つけるのは簡単ではありません。何度もトライアンドエラーを繰り返します。データをかけ合わせても何もわからなかったら、再度仮説に立ち返ってやり直します。
小学生の自由研究でもできるデータ分析
さらに講師の柏木さんは、自身の息子(小学校6年生)が取り組んだ夏休みの自由研究を紹介しました。「部屋はなぜ散らかるのか?」をテーマとして、クラス全員の部屋の散らかり具合を聞いて回ったのです。
部屋の散らかり具合を自己申告で100点満点中何点か、と1件ずつ回ってリサーチし、平均点を取りました。ところが、「データの信憑性はあるのか?」と問われ、やり直しをしたのだそうです。
今度は散らかった自分の部屋の写真を持参し、それと比較して各自の部屋の散らかり具合を答えてもらいました。データの客観性、信憑性は増したものの、「結果を示しているだけ」には変わりがありません。
そこで次に、相関関係がありそうなもののデータも取得することにしました。「片付け頻度」のデータ収集を経た後、最終的に立てた仮説は「ものの置き場所の数」と「配布物の即日処理」。家の中に自分のものの置き場所がたくさんある人と、プリントなどをその日に片付けている人は、部屋が片付いているだろうと仮定したのです。
結果、家の中にものの置き場所が2箇所ある人がもっとも片付いていることがわかりました。3箇所以上あると、逆に部屋が片付いていないのです。また、プリントをその日に処理する人は高得点であることがわかりました。その後、彼は自宅にものの置き場所を2箇所確保し、プリントの即日処理を徹底して、部屋がとてもきれいになったのだそうです。
このように、目的を達成する次のアクションを見つけることが、データ分析の醍醐味と言えるでしょう。
2軸の関係の強さを定量的に表す「相関係数」
これまで、グラフで視覚的に「相関関係がありそうだ」を予測してきました。それを数字で定量的に表す分析手法を「相関分析」と言います。相関の強さを示す相関係数は-1~1の間で表され、0なら相関なし、-1に近づくほど負の相関が、1に近づくほど正の相関が強くなります。0.7以上なら相関あり、と見なす人もいれば、0.5とする人もいるようです。
Excel関数で計算できるので、使うのは決して難しくありません。「CORREL」という関数で、変数1と変数2の範囲を指定すれば相関係数が計算できます。
相関係数を使うには注意が必要です。相関関係があっても、因果関係があるというわけではないからです。
例えば、「足のサイズ」と「知っている漢字の数」に相関関係があったとします。これを見ると、「漢字を覚えれば足のサイズが大きくなるんだ」と考えてしまいそうですが、実は間違いです。本来の関係性はデータの裏に隠れている「年齢」という要素にありました。年齢と共に足のサイズが大きくなり、知っている漢字の数も増えるからです。
他の例として「コーヒーを1日に3杯以上飲む人は、飲まない人に比べて、心臓病で死ぬ確率が3倍以上に上がることがC大学医学部の調査で分かった。カフェインの取り過ぎによるものと思われる」という文章があったとします。
カフェインが本当に要因なのでしょうか?実は、ここでデータの裏に隠れていた要因は「砂糖」なのです。コーヒーを飲む人は、飲まない人に比べて砂糖の摂取量が多く、結果、心臓病の死亡率に直結していたのです。
このように一見正しくても、本当の関係性や要因は自分が見ているデータとは別のところにある場合は多々あります。このポイントに気づくかどうかがデータ分析を行う上で必要なスキルと言えます。
データ分析に大切なのは「目的を整理すること」
データ分析を仕事で生かすには、数多くある手法をマスターするより大切なことがあります。まずは、具体的な分析の目的がわからないままに作業を開始しないこと。さらには、データと方法が揃えば正解が出せる、と考えないことです。
分析者の裁量は非常に大きいため、正解を出すよりも「正解を創る」発想で挑むとよいでしょう。また、データですべてを語ろうとしないことも大切。結論の方向性を指し示すもの、という程度にとらえることも大切です。