Premium Contents

データに関わるすべての人へ。数字の裏にある真実をどう読み解くか 江崎貴裕 #サプライジングパーソン

2024.05.21Premium Contents
データに関わるすべての人へ。数字の裏にある真実をどう読み解くか 江崎貴裕 #サプライジングパーソン

ソーシャルギフトサービス「GIFTFUL」 を運営する株式会社GiftX いいたかゆうた さんが、マーケターと対談しつつその知見を学び、変化の時代を生き抜くビジネスの本質に迫る連載「サプライジングパーソン」。

今回のゲストは、東京大学先端研特任講師の江崎貴裕 さんです。

『データ分析のための数理モデル入門』『分析者のためのデータ解釈学入門』など、データサイエンス入門書を手掛けてきた江崎さん。2023年に出版データサイエンス入門書3部作の最終章として、『指標・特徴量の設計から始める データ可視化学入門』を出版しました。

本書は「“データを視えるようにする”とは何か」という本質的なテーマに触れつつ、データを可視化するために必要な知識が網羅的に紹介されています。

現在、江崎さんは東京大学先端科学技術研究センターにて物流について研究を進めています。
2021年には株式会社infonervを創業し、物流に欠かせない発注リストの作成を支援するAI SaaS「α-発注」を開発。人的リソースの枯渇とDX対応など、多くの課題を抱える物流業界の最適化に向けて、日々尽力しています。

今回は江崎さんに、ビジネスにおけるデータサイエンスの重要性について伺いました。また取材では、弊社にてデータ分析を担当する杉浦巧も参加し、日々のデータ活用における疑問に答えていただきました。

(執筆:サトートモロー 進行・編集:いいたかゆうた 撮影:小林一真)

数理モデルがビジネスにもたらす「予測」と「メタ認知」

いいたか:
江崎さんは物流にまつわる事業にも携わっているとのことですが、そこではどのようにデータを活用しているのでしょうか?

江崎:
例えば、在庫管理や発注履歴などのデータから、お客様に「この商品はもっと在庫を増やさないと欠品します」とお伝えします。逆に、現在はあまり売れ行きが伸びていないけれど、過去の販売実績から在庫を抱え込みすぎている商品があれば、「在庫を整理しましょう」と伝えることもあります。

数万点の商品を展開している企業の場合、個々の商品の売れ行きや在庫状況を把握するのは大変です。「α-発注」は、そうしたお客様の在庫管理・発注を最適化するためのプロダクトなんです。

いいたか:
確かに、「昔売れていたけれど今は在庫に眠っている商品」を抱えている企業は、たくさんありそうです……。データからその事実に気づければ、企業にとって大きなコスト削減につながりますね。

江崎:
実際、先日はお客様から「おかげさまで、無駄な在庫を1億円分削減できました」という報告がありました。「そんなに減らして大丈夫!?」と、こちらが心配になったくらいです。

486A1282

いいたか:
1億円はすごいですね!それだけのインパクトを生み出すのに役立っているのが、江崎さんが紹介している「数理モデル」なのでしょうか。

数理モデルとは
現実のデータを理解・活用するために生み出された様々な数理的な手段の総称。近年注目を浴びている機械学習だけでなく、物理学、生物学、生態学などの自然科学、また心理学、経済学、といった人文社会科学分野で用いられる諸手法が含まれている。

江崎:
そうですね。数理モデルをビジネスに活用する場面として、皆さんがもっともイメージしやすいのは「予測」だと思います 。先ほどの在庫管理もそうですし、商品のレコメンドシステムなどに用いられることも多いです。

また、数理モデルはより高次の意思決定を行なうのにも用いられます 。私はこれを「理解志向型モデル」と呼んでいるのですが、目の前にあるデータがどのようなメカニズムによって生成されたのかを理解する手助けとして数理モデルを使うことができます。

先ほどの予測の場合、過去の購買データをある程度蓄積できていれば精度の高いレコメンドシステムを構築できます。しかし「日経平均株価を当てる」といったテーマのように、いくつもの要因が関係しすべてのデータを取得できない事象では、うまく機能しません。

同様に、革新的な新商品が世の中に受け入れられてどれだけ売れるかを知りたい場合も、過去のデータに基づいた予測は相性が悪いと言えます。

理解志向型モデルはこうした事象に対して、ボトムアップ的に「おそらく今求められている商品はこういうものだ」と考えていくんです

いいたか:
サイト改善やレコメンドシステムのように、過去に蓄積されたデータから最適解を導き出せるものは予測を用いる。一方、理解志向型モデルはデータの裏にあるメカニズムを読み解き、市場に受け入れられる商品・サービスを探していくのですね。

私も新商品の展開を考えるとき、想定されるマーケットについて調べたり、過去のデータを見ながら「こうすれば売れるんじゃないか」と考えることがあります。知らず知らずのうちに、理解志向型モデルに近い考え方をしていたのだと思いました。

データを可視化してどのような状態を作りたいか

いいたか:
江崎さんは昨年、データサイエンスの入門書として『指標・特徴量の設計から始める データ可視化学入門』を出版しています。本書を通じて、読者に何を伝えたいと考えたのでしょうか?

江崎:
『データ可視化学入門』は、データ分析に携わる人はもちろん、マーケティングやデザイナーなど、データに触れる機会がある人すべてに向けて書きました

特に強調したかったこととして、本書では冒頭にて「まず指標・特徴量(予測の手がかりとなる変数)の設計から始めよう」と伝えています。どの指標・数字に着目するかを決める時点で、データの可視化の成否は半分以上が決まるからです。

データの可視化を単体で捉えるのではなく、データ分析の全体像を押さえた上で取り組む。データの可視化を軸にデータ分析の設計を始める。

こうした観点を持てるようになれば、データ分析をする人も、それをもとに意思決定する人にも有意義な可視化を実現できます。そのための考え方や、データを可視化するために必要な知識を本書にまとめました。

486A1487

いいたか:
今の話には、思い当たることがたくさんあると感じました。

マーケターにはデータが好きな人が多いのですが、そのデータがなぜ必要なのかという視点がなく、グラフ化=可視化することが目的になっているケースが珍しくありません。

きれいにまとめられたグラフの裏には、いろいろな事象が隠れています。そこに目を向けることの重要性を、本書は伝えてくれるのかなと思いました。

ちなみに、江崎さんは大学での講義や企業とのやり取りでデータを可視化して示す際、どのような点を意識していますか?

江崎:
可視化されたデータを見せて、どのような状態を作りたいかはあらかじめ考えるようにしています。一部の傾向や特徴を理解してもらえればいいのなら、ハイライト的に情報をまとめますし、基本的に1つの図には1つのメッセージを込めるようにしています。そうしないと、グラフから伝えたい事実がうまく伝わらないからです。

例えば、お客様に「このプロダクトで在庫がここまで減りました」という成果を見せたいとき、その事実がわかるシンプルな図を作成します。逆に、相手に複数の事実を読み取ったり、データの特徴を探してほしい場合は、あえて情報の多い資料にすることもあります。

データ分析担当者の苦悩に江崎さんが答える

いいたか:
今回のインタビューでは、杉浦さんに「データ分析の業務で困ったこと」をピックアップしてもらいました。それぞれの困り事を通じて、データ分析担当者が何を意識すべきかを江崎さんに教えていただければと思います。

①お客様が求めていることをよりシンプルに考える

杉浦:
私は以前、クライアントが各メディアに投資した結果、どれだけの利益が生まれたかの関係性を示すモデルを構築するというプロジェクトに参加しました。

対象となるメディアは10以上あり、それぞれが季節イベントやキャンペーンを展開していました。結果、それぞれのキャンペーンの成果が複雑に絡み合い、正確なデータ分析ができないという問題に直面してしまいました

私としては、各メディアが利益にどの程度貢献しているのか、時系列を追って説明したかったのですが……。江崎さんなら、どのようにデータ分析しますか?

江崎:
私なら、なるべく単純な分析手法を取ると思います。例えば、媒体ごとのキャンペーン成果(商品の販売数など)を個別に算出すれば、簡単に各媒体の成果を比較できますよね。

大切なのは、データ分析の知識を抜きにして「お客様のニーズに対して何をやるべきか」を考えることだと思います。不確実な状況の中で意思決定を行なうビジネスの現場では、どうしてもデータの限界がありますから、判断に使える情報をできるだけ提供するという方針がわかりやすいと思います。厳密な論文を書くわけではないので、決まった手法にこだわらなくても良いのではないでしょうか。

杉浦:
なるほど……。私はデータ分析において、「ここを解明しなくては!」というアカデミックな思考に陥りがちなことに気づきました。データをビジネスに活かす上で、その行動が正しいとは限らないのですね。

②お客様が意思決定を下せるように指標を用いる

杉浦:
お客様の支援では、短期的に売上を伸ばす施策を展開することもあれば、認知獲得やブランディングなど長期的に取り組む施策を展開することもあります。どのような指標や分析法を用いれば、時間軸の違う施策を同列に評価できるでしょうか?

486A1354

江崎:
1つの指標・分析ですべて解決しようとしない方がいいと思います。短期的な施策を評価したいのなら短期的な指標を用いて、長期的な施策なら長期的な指標を用いましょう。

どのような施策であれ、やる・やらないの意思決定を下すのはお客様です。お客様が最適な判断を下せるように、さまざまな指標を柔軟に用いて、そこで得られた分析結果を示せればいいと思います

③モデル構築のコツはゲームに勝つ「勘所」を見つけること

杉浦:
江崎さんは、データ分析に用いるモデルを素早く構築できるように意識していることはありますか?お客様からデータを渡されてモデル構築するとき、支援先によっては2週間以上かかってしまうこともありまして……。構築スピードを上げる方法を、ぜひ伺いたいです。

江崎:
モデル構築の姿勢として、私がもっとも大切にしているのは、「勘所(かんどころ)を知る」ということだと思っています

やみくもに「とりあえず全てのデータを抽出しよう」とすれば、モデル構築はいつまでも終わりません。データ分析を通じて何をしたいのか、こういう分析結果が得られればゲームとして勝ちなのか。それが自分の中にあると、どんなデータが必要で何を調べればいいのかという道筋が見えてきます。

それと、仕事を通じてさまざまな事業のドメイン知識が蓄えられていきます。すると、「Aの分野で問題になったことがBの分野でも起こっているのではないか」という引き出しが増え、新しいドメインにもキャッチアップしやすくなるでしょう

さまざまな業界を貪欲に学べば学ぶほど、
そういう知識がたまってきて、新しいドメインでもどんどんキャッチアップするのが早くなります。そういう意味では、いろんな分野のいろんなことを貪欲に知っていくっていうことをやっていくと、どんどん早くなってくるのかなっていう気がします。

SNSのバズはデータ分析で予測可能か

いいたか:
ここからは少し視点を変えて、SNSマーケティングにおけるデータ活用についてもお伺いしたいと思います。この点について、杉浦さんから江崎さんに聞きたいことがあるのですよね。

杉浦:
率直な疑問なのですが、SNSおける「バズ」はモデリング可能なのでしょうか?

江崎:
私自身は研究したことがありませんが、モデリングは可能だし関連する研究もすでに発表されていると思います

X(旧Twitter)の場合、ある投稿がフォロワー・フォロワー関係でつながっているネットワーク上で、どんどん広がっていきますよね。その様子はウイルス感染と似ているため、ウイルス感染のモデルと同じ手法で分析出来ると思います。

ただし、そこで得られたデータをもとに、特定の投稿がバズるかどうかを予測するのは難しいでしょう

投稿がバズるかどうかは、それを見たフォロワーが何人リポストするのかで決まります。仮に投稿が100人に見られて、そのうち2人がリポストして、それぞれの投稿を別の100人が見て…というサイクルが生まれれば、バズる可能性は高いでしょう。

しかし、投稿をリポストする人数が0.5人と少なければ、すぐに投稿の広がりは終息すると思います。この「2人か0.5人か」という壁を乗り越えられるかどうかを予測するのは、メカニズム的に困難だと言えるでしょう

486A1258

杉浦:
壁を超える要因として、投稿者のフォロワー数といった知名度も関係していると思いますが、その点についてはどう思いますか?

いいたか:
フォロワー数とバズるかどうかは、関係がないと私は思います

前職・ホットリンクでの経験なのですが、同社が支援していた大手食品メーカーの株式会社シャトレーゼは、クリスマスになると毎年生産ラインを数日止めるんです。そして、アレルギーのお子さんでも食べられるクリスマスケーキを作っています。

とても素晴らしい取り組みですが、同社はそのことについてほとんど触れることはありません。SNSでこの取り組みにはじめて言及したのは、フォロワー60人ほどの主婦でした。しかし、このアカウントの旧Twitterでの投稿は、5000RTを超えるほどの反響を呼んだのです

しかも、投稿は主婦層だけでなく子供時代にアレルギーでケーキを食べられなかった過去を持つ、大人にも波及していったんです。このことから、私たちは「フォロー・フォロワーという縦でつながるコミュニティ間のやりとりが横に広がった瞬間にバズが生まれる」という結論にいたりました

杉浦:
なるほど……。SNSといえば、TikTokなどにおけるショート動画におけるデータ分析について、江崎さんはどうお考えですか?

江崎:
動画をそのまま分析して、バズる投稿の傾向を調べるのは非常に難しいと思います。テキストベースのコンテンツが主体のXとは異なり、動画は投稿者や音楽、映像など、分析に使えるデータ量に対して情報量が多すぎるからです。

もし私が人気コンテンツについて分析するなら、動画の特徴をテキスト情報に落として考えると思います 。「投稿者の特徴」「商品紹介動画かダンス動画か」「動画の長さ」「使われている音楽」など問題に応じて変数を選ぶといった感じです。テキスト情報でラベリングしてデータ分析すれば、一般的な分析のアプローチを適用しやすくなると思います。

複雑な分析はしなくていい

いいたか:
ここまでのお話を聞いて、データ分析に対して興味を持った人は多いと思います。一方で、数字を見ることに苦手意識を持っている人もいるでしょう。そんな人に向けて、ぜひ江崎さんからメッセージをお願いできますか?

江崎:
私が皆さんに伝えたいのは「そんなに複雑な分析をしようとしなくていいんだよ」ということです

近年、SNSのインサイトなどさまざまな形で、数字を見る機会は増えてきました。それらを用いて複雑なデータ分析を行っただけでは、実感を持って状況を理解することができません。結局、私たちは数字の背景で何が起きているかを想像して、意思決定するしかありません。

おそらくこれは、皆さんがビジネスで取り組んでいることとそう変わらないと思います。ビジネスにおけるちょっとした武器や追加情報として、数字と向き合っていただければ、よりよい意思決定ができるようになると思います

杉浦:
つい複雑に数字を考えてしまいがちなので、耳が痛いです(笑)。

いいたか:
データサイエンスの専門家である江崎さんから、「複雑な分析はしなくていい」と言っていただけると、救われた気持ちになります。

486A1506

飯髙悠太(いいたかゆうた)
ライター:飯髙悠太(いいたかゆうた)
株式会社GiftX Co-Founder
@yutaiitaka
2022年7月に「ひとの温かみを宿した進化を。」をテーマに株式会社GiftX共同創業。
自著は「僕らはSNSでモノを買う」、「BtoBマーケティングの基礎知識」、「アスリートのためのソーシャルメディア活用術」。
  • X
  • facebook