@pseudo_finite さんから
「ビジネスでインパクトが出せるデータサイエンティストになるためには」
をご恵贈していただいたので、感想をここに記します。
経営システム誌に寄稿したものができました。30 部あるので欲しい方はお声がけください。
私の 10 年間の経験を整理して中堅のデータサイエンティスト向けに書いたものになります。批判的なフィードバックなどいただけると嬉しいです。(@pseudo_finite)
tweet January 18, 2019
批評
1. データサイエンティストが力を発揮する場
データサイエンティストとして成果を発揮するには、事業ドメイン・そしてデータの規模と質に依存する
圧倒的に同意です。自分も現職に就職する際には、データ規模・質・種類や社内のデータに関する文化などを考慮して会社を選びました。
最後の一文も完全に同意で、良いデータさえあれば基本的に問題は解きやすく簡単になると思っています。
2. 課題設定
データサイエンティストの仕事の肝は適切な課題設定
本質的な課題設定とはそもそもなんなのか
と考えてみます。
ここで、本質的な課題設定を解明するための大きな障壁になるのは、
-
自社が事業会社か
-
ドッグフーディングできるサービスを運営しているか
どうかではないでしょうか?
日常的に自社のサービスを使っていると、顧客視点での改善点や課題点などを見つけることができる。
また、サービスをより深く知ることで深い考察や客観的な観察をすることができる。
スタートアップ界隈では浸透している リーンスタートアップの考え方は、本質的な課題の発見に非常に相性が良いと思っています。
また、データ分析では、単なる集計や相関ではなく、顧客がどんな状況で何をしたいのかを考えてユーザーリサーチをすることも非常に重要です。
ジョブ理論 イノベーションを予測可能にする消費のメカニズム で語られているトピックですが、非常に勉強になります。
3. 解決方法の設定
自然なモデリングと実現可能性のあるモデリング
自分はデータサイエンティストではなく、機械学習エンジニアとして働いているので、その立場からの視点です。
実感するのはまず何よりも実装力が大事だと思います。
実装ができるからこそ、実験ができる。その実験から知見を得て改善のサイクルが回り始める。
関連する暦本先生の tweet が面白かったので、ご参考まで
深層学習時代になってますますですが研究者のコード書きは開発というより未解決の問題や仮説に決着をつける行為、サイエンスにおける実験そのものなのでコード書かない人がどうやって研究してるのか想像つかないです🤔 https://t.co/mojhTqHqmx
— Jun Rekimoto : 暦本純一 (@rkmt) September 16, 2019
4. 検証
施策実行後の検証は必須
個人的には自分が最も重要だと思う点はここである。
確かに施策が成功したら、燃え尽きたくなる気持ちはわかるが、なぜ成功したのかを解明して再現性を担保しなければ知見としてストックされない。
そして知見の溜め込みの速さ・多さこそがビジネスとしての優位性につながるのではないのだろうか?
これこそ、まさに科学的思考の本幹ですね。
5. 育成
データサイエンティストの育成は非常に難しい
育成の点は、自分も最近考えていたことですが、
-
例えば研究室のセミナーや論文の赤入れなどで議論をしたからこそ科学的思考方法が身についたのか?
を考えていました。
僕の結論では、 強い相関はあれど研究室での議論により全員が身科学的思考方法を会得するのは難しいのではないかと思っています。
(もちろん全員が身につけることこそ、研究室の本懐だと思います)
Software Enginnering やアカデミアの世界では、レビュー文化を体験してあくまで内容に関する批判であり、
フィードバックを受け入れて改善する姿勢を身に着けていることも大事だなと最近感じています。
Team Geek ―Google のギークたちはいかにしてチームを作るのか の書籍で語られる HRT の精神ですね。
まとめ
自分も機械学習エンジニアとして働きはじめて、2 年弱が経過しようとしている。
シニアクラスになるためには、まだまだ不足点がたくさんあるが俯瞰的に見直せる良い機会になる良い予稿だった。
岩永次郎さんが書かれている続編的な位置づけの
が、更に踏み込んだ内容になっているのでこの記事が面白いと感じた人はぜひご覧ください。