先日、同僚に機械学習適用に興味があるんだけど、おすすめの資料があったら教えてほしいと言われ、情報をまとめてみた際に現時点でのおすすめの資料としてまとめておいたら、数年後見返したら面白そうだと思ったので記事として公開しておく。
おすすめの資料
プロジェクトマネジメントや考え方、思想
- How Google does Machine Learning
- CourseraでHow Google does Machine Learning の講義を修了したにも書いたが、 機械学習を実応用する人たちにはぜひ見てほしいビデオ講義。前半が、機械学習プロジェクトの計画や、優先順位、よくあるアンチパターンについてGCPで機械学習について多く関わってきたエンジニアが解説してくれていて、非常に勉強になる。
- リーン・スタートアップ ムダのない起業プロセスでイノベーションを生みだす
- 顧客が求めるものを作ろう。機械学習にこだわったらまずだめなので… (詳しくは後述の Rules of ML を呼んでみよう。)
- 関連する良いフレームワークとして @nishio さんの機械学習キャンバス もおすすめです。
- Make something people want. by Paul Graham
- 人によって意見が別れるところではありますが、機械学習エンジニアとして、これがなぜ機械学習で必要なのかの「なぜ」を説明できない結局意味なかったねとなりがち。つまるところ、必要とされるものを見つけ出して作っていこうぜということですね
- Netflixがカスタマーを誰よりも理解するためのデータ分析プロセス、コンシューマー・サイエンスの紹介
- カスタマーオブセッションの考え方は、常に心のなかに秘めつつ世の中を良くするプロダクトを作りたい。
機械学習エンジニアリング
- Rules of Machine Learning
- 全員これを毎日読もう。聖書
- 仕事ではじめる機械学習 第2版
- MLCT 創始者の @chezou さんが筆頭に書き上げた実践的な機械学習本。日本人で機械学習をやりたいならまずこれを買うべし。
- AIアルゴリズムマーケティング 自動化のための機械学習/経済モデル、ベス トプラクティス、アーキテクチャ
- 邦訳だとべらぼうに怪しい感じになってしまっているが、内容はとんでもなく素晴らしい。マーケティングのために機械学習を適用することが多いと思うが、かなり網羅的に適用例を解説してくれている。原著の英語は無料なので、中身が気になる人はそちらをおすすめする。無料公開偉大すぎる
- MLOps: 機械学習における継続的デリバリーと自動化のパイプライン
- GCPによるMLOps の解説。人によって、MLOps の定義って差異がありますが、自分はここで語られている
ML システム構築のすべてのステップで自動化とモニタリングを推進できます
こそが、 MLOps の骨子だなと思っています。クラウドサービスは、開発に関係する知識をパターン化して、資料を公開してくれるのでありがたいですね。
- GCPによるMLOps の解説。人によって、MLOps の定義って差異がありますが、自分はここで語られている
- Google Cloud で機械学習を実装するためのベスト プラクティス
- この資料なんかは、GCPで機械学習を実践したい場合にはまず見ておけば困ることはなさそうですね
- 各クラウドサービスのMLOps のwhite paper
- AWS, Azure は普段使わないので深く言及しませんが、同様の資料は公開されたりしています。
論文
- eugeneyan/applied-ml
- @euganeyan さんがまとめてくれている、機械学習の応用例をまとめてくれているリポジトリ。事例を探したいならまずここを見れば間違いない
- The ML Test Score: A Rubric for ML Production Readiness and Technical Debt Reduction
- 機械学習システムの完成度を点数化できて、どの部分を改善していけばいいか明瞭にしてくれます。一度プロダクションにリリース後に、チームでスコアを計算してみて、次に何を改善するのか議論すると楽しいです。 日本語での抄訳
情報収集源
RSS (+Twitter)
なんかのRSSを登録しています。なんだかんだRSS便利なので最近回帰しています。Twitter でしか得られない情報もあったりはしますが、特定のリストを使って監視してます。Nuzzle を愛用してましたが、なくなってしまった。
Conference tutorial, workshop
Academic
-
Applied Data Science Track Papers
- 世界最高峰の機械学習の実応用例の論文が集まるKDDのADS track。毎年論文が公開されるのが楽しみ
-
- 近年だとE Commerce など実世界への適用を主題にしたワークショップがアカデミックな会議でも開催されていて、非常にいい流れだと思う。
少し前だと、Reliable Machine Learning in the Wild, Workshop on ML Systems, Reliable Machine Learning in the Wild のワークショップも面白かった。
Industrial
- MLSys
- 機械学習の実応用をテーマにして査読付き学会
- OpML
- 機械学習の実運用をテーマにした査読付き学会。MLSys よりも実践論がテーマになっている。2021年は開催されないみたいで悲しい。2021年はSRECON21 でOpML Track が開催されていた。来年はOpMLが単独カンファレンスとして復活してほしい。
- MLconf
- 海外の機械学習実践の第一人者の人たちが自社事例を惜しげもなく公開してくれているいいカンファレンス。
- TWIMLcon
- TWIML podcast を主催している Sam さんが開催している、機械学習事例のカンファレンス。有料だが、Samさんのおそろべきネットワークにより、有料にする価値は間違いなくあるカンファレンスとなっている
Podcast
- twiml
- ゲストがかなり豪華で、理論から実践まで幅広くトピックを取り扱っている。ジョーダン先生やAlex smola 先生がゲストとして着てるのは驚くしかない。。
- MLOps.community
- こちらは、実践的な麺をメインにしたPodcast。D Sculley さんがゲストとしてきていた、The Godfather Of MLOps は神回なのでおすすめ。
読んだ記事は はてぶでまとめているので、興味のある方はフォローすると役立つかもしれません。Twitter のほうにもはてぶと連携して放流しているので、そちらのフォローも是非。