2021年05月時点で自分が実践している MLOps の情報収集方法
先日、同僚に「機械学習プロジェクトに興味があるんだけど、おすすめの資料があったら教えてほしい」と言われたので、Blog 記事に現時点でのおすすめの資料としてまとめておいたら、数年後見返したら面白そうだと思ったので記事として公開しておく。
おすすめの資料
プロジェクトマネジメントや考え方、思想
- How Google does Machine Learning
- これは機械学習を実応用する人たちにはぜひ見てほしいビデオ講義。前半が、機械学習プロジェクトの計画や、優先順位、よくあるアンチパターンについて GCP で機械学習について多く関わってきたエンジニアが解説してくれていて、非常に勉強になる。 感想記事
- リーン・スタートアップ ムダのない起業プロセスでイノベーションを生みだす
- 顧客が求めるものを作ろう。機械学習にこだわったらまずだめなので… (詳しくは後述の Rules of ML を呼んでみよう。)
- 関連する良いフレームワークとして @nishio さんの機械学習キャンバス もおすすめです。
- Make something people want. by Paul Graham
- 人によって意見が別れるところではありますが、機械学習エンジニアとして、これがなぜ機械学習で必要なのかの「なぜ」を説明できないとたいてい上手く行かない経験がある。つまるところ、必要とされるものを見つけ出して作っていこうぜということですね
- Netflix がカスタマーを誰よりも理解するためのデータ分析プロセス、コンシューマー・サイエンスの紹介
- カスタマーオブセッションの考え方を、常に心のなかに秘めつつ世の中を良くするプロダクトを作りたい
MLOps, 機械学習エンジニアリング
- Rules of Machine Learning
- 全員これを毎日読もう。聖書
- 仕事ではじめる機械学習 第 2 版
- MLCT 創始者の @chezou さんが筆頭に書き上げた実践的な機械学習本。日本人で機械学習をやりたいならまずこれを買うべし。
- AI アルゴリズムマーケティング 自動化のための機械学習/経済モデル、ベス トプラクティス、アーキテクチャ
- 邦訳だとべらぼうに怪しい感じになってしまっているが、内容はとんでもなく素晴らしい。マーケティングのために機械学習を適用することが多いと思うが、かなり網羅的に適用例を解説してくれている。原著の英語は無料なので、中身が気になる人はそちらをおすすめする。無料公開偉大すぎる
- MLOps: 機械学習における継続的デリバリーと自動化のパイプライン
- GCP による MLOps の解説。人によって、MLOps の定義って差異がありますが、自分はここで語られている
ML システム構築のすべてのステップで自動化とモニタリングを推進できます
こそが、 MLOps の骨子だなと思っています。クラウドサービスは、開発に関係する知識をパターン化して、資料を公開してくれるのでありがたいですね。
- GCP による MLOps の解説。人によって、MLOps の定義って差異がありますが、自分はここで語られている
- Google Cloud で機械学習を実装するためのベスト プラクティス
- この資料なんかは、GCP で機械学習を実践したい場合にはまず見ておけば困ることはなさそうですね
- 各クラウドサービスの MLOps の white paper
- AWS, Azure は普段使わないので深く言及しませんが、同様の資料は公開されたりしています。
Machine Learning Engineering for Production (MLOps) も気になっているが、手を出せていないのでまた受講が完了したら感想を書きたい。Andrew 先生の講義はハズレはないので非常に期待している。
論文
- eugeneyan/applied-ml
- @eugeneyan さんがまとめてくれている、機械学習の応用例をまとめてくれているリポジトリ。事例を探したいならまずここを見れば間違いない
- The ML Test Score: A Rubric for ML Production Readiness and Technical Debt Reduction
- 機械学習システムの完成度を点数化できて、どの部分を改善していけばいいか明瞭にしてくれます。一度プロダクションにリリース後に、チームでスコアを計算してみて、次に何を改善するのか議論すると楽しいです。 日本語での抄訳
情報収集源
RSS (+Twitter)
なんかの RSS を登録しています。なんだかんだ RSS 便利なので最近回帰している。Twitter でしか得られない情報もあったりはしますが、特定のリストを使って監視してます。Nuzzle を愛用していたが、なくなってしまったで復活してほしい。
Conference tutorial, workshop
Academic
- KDD Applied Data Science Track Papers
- 世界最高峰の機械学習の実応用例の論文が集まる KDD の ADS track。毎年論文が公開されるのが楽しみ。RecSys や SIGIR など、自分の専門分野に合わせた論文を呼んでおくと楽しいです。神嶌先生の ML, DM, and AI Conference Mapを参考にどんな国際会議があるかを調べてみるといいかもしれません。
- ECNLP 2 , SIGIR eCo
- 近年だと E Commerce など実世界への適用を主題にしたワークショップがアカデミックな会議でも開催されていて、非常にいい流れだと思う。
少し前だと、Reliable Machine Learning in the Wild, Workshop on ML Systems, Reliable Machine Learning in the Wild のワークショップも面白かった。
Industrial
- MLSys
- 機械学習の実応用をテーマにして査読付き学会
- OpML
- 機械学習の実運用をテーマにした査読付き学会。MLSys よりも実践論がテーマになっている。2021 年は開催されないみたいで悲しい。2021 年は SRECON21 でOpML Track が開催されていた。来年は OpML が単独カンファレンスとして復活してほしい。
- MLconf
- 海外の機械学習実践の第一人者の人たちが自社事例を惜しげもなく公開してくれているいいカンファレンス。
- TWIMLcon
- TWIML podcast を主催している Sam さんが開催している、機械学習事例のカンファレンス。有料だが、Sam さんのおそろべきネットワークにより、有料にする価値は間違いなくあるカンファレンスとなっている
Podcast
- twiml
- ゲストがかなり豪華で、理論から実践まで幅広くトピックを取り扱っている。M.J. 先生や Alex smola 先生がゲストとして着てるのは驚くしかない。。
- MLOps.community
- こちらは、実践的な麺をメインにした Podcast。D Sculley さんがゲストとしてきていた、The Godfather Of MLOps は神回なのでおすすめ。
読んだ記事は はてぶでまとめているので、興味のある方はフォローすると役立つかもしれません。Twitter のほうにもはてぶと連携して放流しているので、そちらのフォローも是非。
[2023/04/30 追記]
Twitter やはてぶで記録するのはやめて、Search Engineering Newsletter というニュースレター形式で、検索技術・機械学習関係で面白かった記事配信しています。
関連しているかもしれない記事
- TFXの歴史を振り返りつつ機械学習エンジニアリングを提案する論文「Towards ML Engineering: A Brief History Of TensorFlow Extended (TFX)」
- MLOps の国際会議 OpML'20 に、機械学習を活用した商品監視の改善に関する論文が採択されたので登壇してきた
- 機械学習システムの信頼性を数値化し、技術的負債を解消する論文「 The ML Test Score: A Rubric for ML Production Readiness and Technical Debt Reduction」
- 機械学習システムの信頼性を数値化する論文「 What’s your ML test score? A rubric for ML production systems」
- Google, Facebookが提供する機械学習基盤まとめ
📮 📧 🐏: 記事への感想のおたよりをおまちしてます。 お気軽にお送りください。 メールアドレス入力があればメールで返信させていただきます。 もちろんお返事を希望せずに単なる感想だけでも大歓迎です。
このサイトの更新情報をRSSで配信しています。 お好きなフィードリーダーで購読してみてください。
このウェブサイトの運営や著者の活動を支援していただける方を募集しています。 もしよろしければ、Buy Me a Coffee からサポート(投げ銭)していただけると、著者の活動のモチベーションに繋がります✨
Amazonでほしいものリストも公開しているので、こちらからもサポートしていただけると励みになります。