目次
Domo主催のカンファレンス「Domopalooza 2019」が開催
ビジネス最適化ソリューション「Domo」を提供する、Domo社が主催するカンファレンス「Domopalooza 2019」が、現地時間の3月19~22日の4日間にわたり、アメリカのユタ州・ソルトレイクシティで開催されました。
※参考:「DOMOPALOOZA 2019」イベント公式サイト
4日間にわたるイベント期間中、「機械学習」や「デジタルトランスフォーメーション」などDomoにまつわる様々な内容のセッションが行われましたが、その中でも2日目に実施されたセッション「Story Beasts Statistics: The Power of Data Storytelling」中で、登壇者であるDomoのBrent dykes氏は近年、データストーリーテリングの重要性が増してきていると語っていました。
データストーリーテリングとは?
データストーリーテリングとは、「データから得られたインサイトを、本や映画のようにストーリーを組み立てながらユーザーに分かりやすく伝え、期待するアクションに繋げる手法」のことを指します。
会社や組織でデータドリブンな意思決定を行う際、その意思決定を下す人が必ずしもデータサイエンティストやアナリストではありません。データストーリーテリングを利用することで、そのような専門性を持たない人であってもデータが示す事象を理解できるようになり、組織全体にデータ分析の習慣が作られます。そのため、会社や組織においてデータドリブンな文化を醸成するために、データストーリーテリングは欠かすことのできないものと言えます。
本記事では同セッションの内容をもとに、データストーリーテリングの重要性と、ビジュアライズする際のポイントについて紹介したいと思います。
データストーリーテリングに必要な3つの要素
Brent dykes氏によると、データストーリーテリングには以下3つの要素が組み合わさっているそうです。
- NARRATIVE(語り)
- DATA(データ)
- VISUAL(可視化)
上図のように、「NARRATIVE」と「DATA」を組み合わせることで、より明瞭に物事の本質を人々に伝えることでき、「DATA」と「VISUAL」を組み合わせることでデータの傾向を把握できます。また、「NARRATIVE」と「VISUAL」を組み合わせることでお互いが密接になり、より相互関係を持つことができます。そして、上記3つの要素が組み合わされば人々にモチベーション与え、行動に影響して変化を生み出すと述べていました。
またBrent dykes氏は、データストーリーテリングは統計値と比較して記憶性に優れており、説得力があるとも語っていました。
セッションでは、スタンフォード大学の例が挙げられました。コミュニケーション学を教えているスタンフォード大学の教授が、授業中に生徒間でプレゼンテーションを行ってもらい、その後互いに議論させ、のちにどの程度内容を覚えているかテストを実施した結果、ストーリーテリングなプレゼンテーションの方が明らかに生徒たちに記憶されていました。
さらにカーネギーメロン大学の事例では、アフリカで貧困に苦しむ子供向けのチャリティーにおいて、2パターンのテストを実施したそうです。1つ目のパターンは、子供たちの食糧状況や居住環境、どんな問題に直面しているかなどを、データで示して説明、2パターン目では、アフリカで苦しんでいるとある少女がどのような問題に直面しているか、というストーリーで説明したところ、ストーリー仕立てで説明したパターンのほうが説得力があり、より多くの募金を集められました。
これら2つの事例が示すように、ストーリーテリングを駆使すれば、データにおいてもより記憶に残りやすく、説得力をもたせることができます。
データストーリーテリングなビジュアライズを上手く表現する7つのステップ
Brent dykes氏によれば、データストーリーテリングなビジュアライズを上手く表現するには以下7つのステップがあるそうです。
- Identify the right data(正しいデータの特定)
- Choose the right visualizations(正しいビジュアライゼーションの選択)
- Calibrate visuals to your message(主張に沿ってビジュアルを調整)
- Remove unnecessary noise(不必要な要素の除去)
- Focus attention on what’s important(重要項目に注意を促す)
- Make your data accessible & engaging(アクセシブルかつエンゲージしやすくデータ整形する)
- Instill trust in your numbers(数字に信頼感をもたせる)
正しいデータの特定
まず「正しいデータの特定(Identify the right data)」のステップでは、分析して発見したインサイトがどのような意味を持つのかを正しく表現する必要があり、その表現方法には「% Change(変化)」、「Variance(差異)」、「Calculated Metric(計算指標)」、「Added Context(追加コンテキスト)」の4つがあります。
下図は「% Change」の具体例。左側の図はあるECサイトにおける月別の売上と訪問者数を表しています。この図では右に行くにつれて売上と訪問者数が増加しています。しかし、よく見てみると成長率は鈍化傾向になっています。右側の図は前月の売上と訪問者数の変化率を表しており、こちらの方が月々にどの程度成長しているのかを明確に伝えることができます。
以下は「Calculated Metric」と「Added Context」の例です。右側の図では、「Revenue per visit」の指標を計算し、かつ前年の「Revenue per visit」も加えています。それにより訪問者数が増加するごとに一人当たりの売上が低下している、かつ前年と比較して大幅に低下しているというインサイトをがわかりやすく、よりアクショナブルなグラフといえます。
最後に「Variance」の例です。左側の図は2017年と2018年の工場での事故発生件数を棒線グラフで表現していますが、事故の件数がどの程度増減したのか一目では判断できません。一方、右側の図では2017年と2018年の事故発生件数の増減数を棒線グラフで表現しており、かつ増加した場合は赤色で表現しているため、2017年と2018年の差異を明確に理解できます。
正しいビジュアライゼーションの選択
次に2つ目の「正しいビジュアライゼーションの選択(Choose the right visualizations)」についてです。ストーリーデータテリングでは常に何かしらのデータと比較してインサイトを発見する必要があります。そのため、どんなビジュアライズでデータを比較するのかが非常に重要です。下記の図では左側に向かうにつれて、他の数値と正確に比較できるビジュアライズ方法が記載されています。
例えば、下図はウェブサイトのトラフィックの割合を円グラフと棒線グラフでビジュアライズして比較した図ですが、円グラフでは比較が容易ではなく、ラベルを示さなければ理解できません。しかし、棒線グラフではラベルなしでも比較できます。
主張に沿ってビジュアルを調整
3つ目は「主張に沿ってビジュアルを調整(Calibrate visuals to your message)」。データの可視化を正しく調整することで、メッセージを正しく伝えることができます。
下図は年度別にチャネル別のマーケティング費用を表した図ですが、左側の積み上げ棒グラフでは「Print」や「Radio」の比較が正確に理解できません。右側の図のようにチャネルごとにそれぞれ分解することで、正確に比較可能なビジュアライズを表現できます。
不必要な要素の除去
4つ目は「不必要な要素の除去(Remove unnecessary noise)」です。データ数が多くなればなるほど重要なインサイトを発見するのが困難になるため、あまり重要ではないデータは「削除」、「集約」、「分割」する必要があります。
左側の図には数多くの指標が存在しているため、本当に重要なデータは何かを把握するのに時間がかかってしまいます。右側の図のように3~4つ程度の重要指標を残し、ノイズとなるデータを「削除」することで、よりアクショナブルなグラフとなります。
下図は必要ないデータを「集約」した例です。細分化された値を集約し、4~5個の指標に絞ることで、認知的負担を減らすことができます。また、認知的負担が減ったことで記憶性も良くなります。
最後にデータを「分割」した例になります。時にはカテゴリごとにデータを分割した方がシンプルになり、理解が易しやすくなります。
重要項目に注意を促す
5つ目は「重要項目に注意を促す(Focus attention on what’s important)」です。データの重要度によって色の強弱をつけることで、ユーザーの注意を引き付け、どれが重要なデータなのかを理解させることができます。
色による差別化以外にも、テキストでユーザーとコミュニケーションをとることにより、グラフ中で最も見てほしいことは何かを簡単にユーザーに伝えることができます。
アクセシブルかつエンゲージしやすくデータ整形する
6つ目は「アクセシブルかつエンゲージしやすくデータ整形する(Make your data accessible & engaging)」です。下画像の右側の図では、データが縦軸で表示されています。ラベルが横書きだった場合、縦軸グラフは一目での理解が難しいため、横にした方が理解し易くなります。また、データを降順で表示することで、より認知性が増します。
下記の図はアメリカの元陸上競技男子走幅跳選手のボブ・ビーモン氏がどの程度跳躍したのかを表しています。左側の図が他の選手の跳躍記録と比較したもので、右側の図はボブ・ビーモン氏の跳躍記録をバスケットコートを利用して比較した図です。見比べると、右側の図の方がどの程度跳躍したのかがイメージしやすいかと思います。時にデータは、同種のデータ同士で比較するのではなく、ユーザーにとって身近なものと比較するほうが理解度が上がる場合があります。
数字に信頼感をもたせる
最後となる7つ目は「数字に信頼感をもたせる(Instill trust in your numbers)」です。図の数値を正しく明記、設定することで、ユーザーは感覚的にデータを理解できます。
例えば、左側の図ではベースラインを2.75%に設定しているため、2014年と2018年のCVRを比較すると非常に大きな差があるように見受けられます。しかし、右側の図でのようにベースラインを0%に設定すると、実際には大きな差が見受けられまないことがわかります。このように正しい数値を設定することで、感覚的にユーザーの理解を促進できます。
データを分析した結果は、ビジュアライズをすることで他者への説明が可能となり、そこにストーリーを組み合わせることで聞いている人の深い理解に繋がります。
その際、上記に挙げた7つのポイントを踏まえ、適切なデータを見極め、他のデータと組み合わせて比較することが重要です。それを行うことでデータからビジネス課題を抽出し、新たなインサイトの発見やアクションに繋げることができます。つまり、データストーリーテリングと比較は密接な関係にあるのです。適切な比較ができれば、データサイエンティストやアナリストといった専門性を持たない人でもデータドリブンな意思決定ができます。
次回はデータストーリーテリングなダッシュボードを構築する際に、どのようにダッシュボード全体をデザインすればよいのかをお届けします。