Oisix ra daichi Creator's Blog(オイシックス・ラ・大地クリエイターズブログ)

オイシックス・ラ・大地株式会社のエンジニア・デザイナーが執筆している公式ブログです。

事業会社のデータ分析で大きなインパクトを出すには「データ分析案件を育てる」のが良いというお話

こんにちは、オイシックス・ラ・大地のデータプラットフォーム室でマネージャをしている普川です。
我々のチームでは主にレコメンドエンジン開発プロダクトに実装するモデルの開発や、需要予測のような業務で使うデータエンジニアリングを主に実施しています。データ分析の活動をどうビジネスの価値に変えていくかについて、今回は真正面から答えてみました。

あ、この記事はOisix ra daichi Inc. Advent Calendar 2018の20日目の記事となっております。

目次

この本がすごくいいんです。

のっけから別の本を紹介して恐縮ですが、データ分析のビジネス適用という文脈では、今一番詳しく書かれている超オススメ本を先に紹介しちゃいます。

データサイエンティスト養成読本 ビジネス活用編 (Software Design plusシリーズ)

データサイエンティスト養成読本 ビジネス活用編 (Software Design plusシリーズ)

  • 作者: 高橋威知郎,矢部章一,奥村エルネスト純,樫田光,中山心太,伊藤徹郎,津田真樹,西田勘一郎,大成弘子,加藤エルテス聡志
  • 出版社/メーカー: 技術評論社
  • 発売日: 2018/10/30
  • メディア: 大型本
  • この商品を含むブログ (1件) を見る

共同執筆者の一人である津田さんがSNSで告知していたのを見て私も発売と同時に購入して読みました。「データ分析によるビジネス革新」という問に業界の有名な人がそれぞれの見地から答えていています。一人の人より10人もの人が自分の切り口で答えているので、いろんな捉え方、アプローチがあることがわかり、自分が思いもよらなかった議論ポイントも目にして大変良い本です。 この「いろんな見方の提供」ということが特に良かったので、やや便乗気味ですが自分の考える「データ分析の価値の最大化戦略」も書いてみました。 3年前社内でデータチームを立ち上げたときから、何を対象として活動するかについては比較的自由にやらせてもらっています。 事業会社なのでデータ分析の価値に最大化については常に求められていて、どう最大化するかは常に考えていたイシューです。私のこれまでの学びが誰かの参考になると良いなと思います。

データ分析の価値とは

ではそもそもデータ分析の価値とは何かから考えていきましょう。弊社では以下の様に定義をしています。

「データ分析の価値」=「意思決定への寄与度」☓「意思決定の重要性」


これは元大阪ガスの河本さんの著書「会社を変える分析の力 (講談社現代新書)」からそのまま使わせてもらっています。この定義を決めたことで定義に出てくる2つの要素について常に意識するようになりました。
「意思決定の重要性」ーつまりその案件でもたらす効果はどれくらいなのかです。どんなに精度の高い分析を行っても改善効果自体が少なければ価値としては低くなります。逆に期待効果の大きい案件であれば少しの精度アップも大きなリターンになります。
「意思決定寄与度」ーデータ分析なり作ったデータモデルの結果がどれくらい効果に直結しているのかということです。どんなに高度で前例のない分析を行ってもそれがビジネスの意思決定に使われないなら価値はゼロなのだと日々戒めております。この分析の寄与度どう高めるか、業務に落とし込むかをかなり考えるようになりました。

データ分析における問題解決の4つのフロー それぞれでのポイント

続いてデータ分析活動をフェーズ毎に見ていきたいと思います。我々は、データ分析の活動を4つのフェーズに分けて考えます。そして各フェーズでも分析の価値を高めるポイントがあります。

1.活動領域の決定
↓
2.問題の可視化
↓
3.データモデリング・エンジニアリング
↓
4.ビジネスへの適用

1.活動領域の決定

まずはどの領域でデータ分析を行うのかを決めます。ここでのポイントは案件の期待効果と難易度です。100万円のコスト削減案件で30%改善しても30万しか改善できませんが、1000万円のものを改善すると10%でも100万円分の効果となるので圧倒的に有利です。先程の定義でいうと「意思決定の重要性」にあたります。これについては、自社の事業のコスト構造や売上構成から金額が多い領域をピックアプしていくと早いです。また選んだ領域について他社の事例などを分析し、その領域での過去成功事例はあるのか代表的なイシューはなにかなどみて、難易度も判断していきます。

2.問題の可視化

それが終わると、その業務/ビジネス領域の構造を明らかにします。イシューアナリシスをしたり、ファネル分析などフローの見える化などを行い、ボトルネックや新の問題を見つけ、それに対する施策を考えます。 このフェーズの肝は、なるべくクリアな形でビジネスのイシューをデータサイエンスのイシューに落とし込むことです。分類問題なのか、推定なのか、精度はどれくらいが許容されるのか。リアルタイムの応答なのか、バッチでデータを作るのかなどができるだけ精緻に定義されることが重要です。この問題設定が適切で、精緻なほど、後工程のデータモデリング、エンジニアリング活動がやりやすくなります。

3.データモデリング・エンジニアリング

ここについてのポイントはもちろん色々あるのですが、簡単にまとめられるものではないので、別の機会にします。

4.ビジネスへの適用

最後は作り上げたデータモデルアルゴリズムをいかに業務やプロダクトに適用し、実際の価値に転換させることかできるかに知恵を絞ります。ここについてこれといってスマートにできるコツやノウハウはないです。オーソドックスですが関係者を全員巻き込んで業務適用への影響を洗い出し小さく影響の少ない状態での適用を行い、チューニングをし問題がなければ全展開をして行くことを愚直に行います。

案件を成功のための3つのポイント

更にデータ分析を成功させるために抑えておくべきポイントが3つあります。

①現場との関係作り
②ビジネスの理解
③データの整備

①現場との関係作り

 現場の重要性については多くの人が言及していると思います。現場と関係性をつくることで、プロジェクトの推進及びデータ分析、チューニングの際に現場から有用なインプットをもらうというところに効いてくると思います。またあまり他では言及されていないのですが、現場の理解に加えて、その現場のマネージャー、部門長と関係を作っておくことも大事だと思っています。現場を知ることは当然必要ですが、より大きいインパクトを出せうる課題の情報は上長が持っていることが多いからです。

ビジネスの理解

現場と関係づくりと同時に必要なのが、その領域のビジネスの理解です。そもそも現場との関係づくりという観点でも、現場の人と対等に会話をするためにも必要な知識を得る必要があります。データ分析を行っているときにまた、なにが筋の良いインパクトのある案件かを自分で判断するためにも必要と思っています。

データの整備

 新たな領域で活動を行う場合に、そもそも分析するデータがまだ簡単に扱える状態でない、そもそもデータすらないなどのことがあります。またデータがあったとしてもローデータのままとなっていると、前処理が必要となってきます。ここ毎回一から行っていては結果を早く出すことができません。必要な情報が適切なタイミングで取得され、前処理が行われるのを自動で行われるようワークフローツールなどで組んでいきます。このときにデータの分布や特徴の理解まで進めておくとより進めやすいです。

「データ分析案件を育てる話」

結構これを毎回やるのしんどくないすか?

さて、いよいよこの記事の本題にはいっていきます。ここまで見てきた通りデータ分析案件に真摯に取り組み成功確率を高めるべくするためには各フェーズを順番に積み上げ、3つのポイントを作りながら、進めていくことになります。結構手間も多いし時間もかかります。弊社の場合は0から始めて、1つの案件を終えるとなると、最低3ヶ月、長いものはもっとかかるかなといったところです。

だからデータ分析案件を育てるのです。

 なるべくなら案件たびに毎回フェーズや地盤づくりの大半をカットできる方法があります。それがつまりデータ分析案件を育てるということなのです。

育てるってどういうこと?

 案件を育てるとは一度実施した案件をのモデルやアルゴリズム、データを横展開したり、周辺の領域に適用していくということです。ここでは弊社の事例を交えながらより具体的説明をしていきます。

弊社での育てた実例ー発端は現場のSOSから

弊社の主力商品にKitOisixというのがあります。1食分の献立が半調理済みでレシピと一緒に入っていてるミールキットと呼ばれる商品です。これを自社で製造しております。これの販売数予測の案件を例に説明していきます。発端は昨年の11月、製造部より売上が予定以上に伸びていてこのままでは製造が追いつかなくなるとのこと。製造タイミングを早めないと出荷までに製造が間に合わなくなるとSOSが来て急遽はじめた案件でした。

まずは販売数予測案件

その時の製造のフローとしては、まずおおよその注文数の担当者が予測して注文締切前にその8割り程度を製造。注文締切後に、差分の数を製造するという「2回製造」という方式で行なっていました。これを注文締め切り24時間前から作り始める「1回製造」に切り替えることが必要でした。製造現場で製造ラインの切り替えに時間がかかります。同じ商品の製造回数を2回から1回に減らすことで生産ラインの切り替え回数が半分になるので劇的に生産性があがるのです。そのためには注文締め切りの24時間前に、販売数を予測する必要がありました。そこで我々は販売開始から注文締切24時間前までの時系列の販売情報をもとに注文数を予測するシステムをつくりました。結果、廃棄数は増えたものの製造効率があがってトータルでコストは少し改善し、かつ製造遅延リスクを大幅に回避できるという形で結果に結び付けられました。

同じデータモデルの使い回し−1つぶで2度も3度もおいしい横展開

 案件がうまくいき、製造部で精度の良い販売数データを使って製造現場を回していると聞いたお隣の調達チームから我々にも使わせてくれと依頼がきました。調達チームもお客様の注文数を元に農家やメーカーに発注をしているので廃棄リスクという観点では抱えている問題は一緒。なので、製造部用に作った予測システムを多少手を入れて全商品に適用することであっという間に成果に結びつけることができました。

さらにチューニングとリファクタリングで効果を狙う

そうこうしているうちに、最初の案件から半年後くらいに、注文数の予測精度が落ちていることがわかり原因を調査しました。お客様の人数が増えたこと、新しいサービスが導入されたことで注文数の動きに変化が現れ当初作ったシンプルな単回帰のアルゴリズムでは精度がでない状態となっていました。そこでアルゴリズムの入れ替えとチューニング行いつつ、当初リリースでやっつけて作った、データフローの部分のリファクタリングの実施を行いました。結果廃棄額を改善前の半分に抑えることができ、それまで属人的に運用していたシステムを安定的なものに作り変えることができました。
さらにこの先では現状、定期会員のお客様の注文だけを予測しているのですが、今後は新規獲得時に販売するトライアルセットの注文数の予測を行っていく予定です。今度は領域を増やしてい案件を育てていくという目論見です。

結果が出る上にデータ分析に専念できる

ここで注目すべきポイントは一つの案件からでる派生した案件を拾っていくことで、「本来必要な4つのステップからかなりの部分を省ぶくことができる」ということです。また案件のたびに、上であげた3つのポイントがより強固なものにできて行けている点です。これによって案件をより成功しやすい状態にでき、かつ我々は本質的に結果を出すために必要なデータ分析活動により多くの時間を投入できるようになっているのです。0からやるよりより少ないコストで大きいリターンが選らえるところも最大のメリットです。

事業会社の中のデータチームだからできること

我々は、事業会社に属しているので、新たな課題で一発で結果を出す必要がありません。むしろ刻々とかわるビジネス環境にあわせて、長期的にデータ分析やデータモデル変化・調整していくことが大事と考えています。そのためには社内にいることを生かして、長期的な視野で結果を出せる領域にでの案件をこなしていくことで、よりその領域での地盤を強固なものでき、インパクトのある案件をより簡単にできるようになっていきます。

この記事の全体のまとめ

 −事業会社においては一回の案件成功で終わらせるのはもったいない
 −事業会社でのデータ分析においては長期的な視点で考えるとよい
 −業務理解、データ整備、現場との関係性を資産として捉え育んでいく

というわけで、我々とデータ分析案件を育てたいと思った方はぜひご連絡をお待ちしております。

Oisix ra daichi Creator's Blogはオイシックス・ラ・大地株式会社のエンジニア・デザイナーが執筆している公式ブログです。

オイシックス・ラ・大地株式会社では一緒に働く仲間を募集しています