ビジネスでインパクトが出せるデータサイエンティストになるためには
- 岩永二郎, Retty株式会社
- 公益社団法人日本経営工学会『経営システム』Vol.28, No.2 (2019), pp.127-132
はじめに
「ビジネスでインパクトが出せるデータサイエンティストになるためには」という解説文を読んだので、感想をつらつらと述べます。
.@pseudo_finite さんの寄稿が掲載された『経営システム』をご恵贈いただきました。「10年間の経験を整理して中堅のデータサイエンティスト向けに書いた」とのことで、少し先の自分を見据えて拝読したいと思います。https://t.co/GKJA8vIPUh pic.twitter.com/0kfPj7ECme
— u++ (@upura0) January 23, 2019
感想
文章構成は、以下の通りです。以下、必要に応じて文章を引用し、章ごとに感想をまとめます。
- はじめに
- データサイエンティストが力を発揮する場
- 課題設定
- 解決方法の設計
- 検証
- 育成
- まとめ
はじめに
冒頭から本稿の立ち位置を明示しており、非常に読みやすい文章でした。
「データサイエンティスト」は一種の「バズワード」であると言及し、その上で本稿で議論する内容を次のように明示しています。
本稿ではビジネス上でサイエンスを実践し,ビジネスにインパクトを与える方法について議論する.特にデータサイエンティストの一連の業務を通してサイエンスの素養が必要であることに焦点をあてる.
データサイエンティストが力を発揮する場
データサイエンティストが活躍するための前提条件として、次のような内容に触れています。
- 事業ドメインやサービスの規模
- データの質と量
これらは私が現職(事業会社のデータアナリスト)で働いている理由とも適合しており、全面的に同意でした。
前者について言えば、下記のTJOさんのブログでも言及されている通り、私はデータサイエンスが生み出せる効果はあくまで既存事業の掛け算に過ぎないと考えています。その率は大きくてもせいぜい数%が現実的という認識です。
掛けられる率がある程度固定ならば、元々の事業ドメインやサービス規模の大きさ自体が重要になってきます。
難しいのは、事業ドメインやサービス規模が大きい会社は一般に「古臭い」会社だということです。データサイエンティストが活躍する土壌はあるものの、風土が整っていない場合も、現状少なくありません。
しかし逆に言えばデータサイエンスへの理解などの風土さえ整っていれば、事業ドメインやサービス規模が大きい会社の方が、データサイエンスがビジネス貢献できるインパクトが大きいと常々考えています。
後者について、データの質と量は言わずもがなの話だと思います。この部分が整っていないと、どれだけ優秀な人材でも成果は発揮できないでしょう。
本稿の著者が「日本最大級の実名型グルメサービスRetty」に勤めているということで、データの質の文脈で「実名/匿名」などの要素に言及している点は興味深かったです。
課題設定
本章の冒頭の文にも、大きく同意しました。
データサイエンティストの仕事の肝となるのは適切な課題を設定することである
先日私がとあるイベントで発表したスライドを引用しますが、ビジネスのデータ分析の文脈では「解決すべき課題を特定し仮説を立てる」ことに価値があると考えています。
必要最低限の要素に注力する点や、大学でのアカデミックな研究の経験との連関など、自身の経験と照らしわせて腑に落ちる話が多かったです。
解決方法の設計
本章では「様々な知識と技術を駆使して適切に課題を解決する」という至極まっとうな主張が述べられていますが、個人的に最も印象的だったのは次の文です。
もう一つ付け加えるならば解決方法にちょっとした色気をもたせることである
自身の経験から言うと「様々な知識と技術を駆使して適切に課題を解決する」を徹底すると、データサイエンス専門企業でも無い限り、単純なクロス集計レベルの分析で十分な場合も多いです。
しかし、データサイエンティスト(になりたい人)の一般的な習性として「新しい手法を使いたい」「技術的な課題に挑みたい」というものがあり、ビジネスでデータサイエンスを活用する上でのミスマッチの一要因だと思っています。
「解決方法の設計」と題された章で、このような部分に言及があるのは、一定規模以上の実務経験の賜物だと感じました。
検証
まず、「データサイエンティストの一連の業務」として「検証」が一つの章立てで存在しているのが素晴らしいです。
文中で次のように述べられている通り、検証はビジネス上の「短期的な」利益を考慮すると、優先順位が低くなりがちな業務です。
事業会社でスピードを重視していると施策の検証を手薄にすることがちらほら見受けられる
とはいえ、検証は「長期的な」視点で、今後の施策の成功率や質を上げていく重要な価値のある行為だと考えています。
昨日私は、とあるデータ分析のコンテスト*1に出場しました。
#オレシカナイト 朝からずっと1位を走ってたのですが、最後に @hiding_koukyo さんに抜かれて準優勝でした( ; ; )完全に自分の中の甘えが原因なので、精進します。楽しかったです。運営さん、ありがとうございました! pic.twitter.com/LyfDaWe3aX
— u++ (@upura0) January 26, 2019
このコンテストでは序盤・中盤と、他者を突き放す精度を出すモデルを実装しました。何度も「これで優勝できるかな」と考えていたのですが、最後に別の参加者に抜かれ、惜しくも2位という結果でした。
本章にも著者の経験で似たような事例が書かれているのですが、データサイエンティストは常に謙虚に自分を見つめ直す必要があるなと改めて実感しています。
育成
著者はここまで一貫して「サイエンスの素養が必要」と主張しており、本章でも次のような記述があります。
大学で十分に研究能力を身につけていればよいが,そのようなデータサイエンティストはビジネスの現場では一握りである.是非とも大学でサイエンスの素養を身につける教育を施していただきたい.
私の経験談としても、「課題設定」の章で述べた「解決すべき課題を特定し仮説を立てる」能力は、大学時代の研究室で鍛えられたと思っています。
本章の最後では、レビューの大切さについても触れられています。
私が定期的にブログを書く理由の一つも、いろんな方から感想や意見をもらい新たな知見が得られるからです。ビジネスロジックや顧客情報として問題ない範囲については、積極的にオープンな場で公開していくのが良いと思っています。
まとめ
本章では、本稿の内容を簡潔にまとめています。
本稿は、「はじめに」「まとめ」で論旨が明瞭に示されています。著者自身にアカデミック・ライティングの素養が備わっていると分かる文章で、本稿の説得力をより一層高める内容になっていました。
おわりに
本記事では、解説文「ビジネスでインパクトが出せるデータサイエンティストになるためには」について章ごとに感想をまとめました。全面的に私の思考と重なる部分が明文化されており、同意ばかりの感想になってしまいました。
本記事を執筆する中で、自分の中での思考を整理するきっかけにもなりました。ご恵贈いただいた岩永さんに、改めてお礼申し上げます。