今回のイチオシは、

  • Elasticsearch と Lucene で学術論文の手法を実装する際に学んだこと
  • DMM さんの検索システムのリファクタリング

です。

Machine Learning & Data Science

  • Kubernetes AI Day North America | Linux Foundation Events
    • CNCF 主催の k8s の機械学習活用のカンファレンス
  • Kubeflow Summit 2022
    • 上記の k8s AI Day とは異なる、KuBeflow の年次カンファレンス。こちらのほうが個人的には登壇内容が面白いのが多い。
      • Kubeflow は使わないけど、k8s で機械学習するというのが k8s AI Day なのだろうか?ゾーニングがいまいちまだわからない
  • Orchestrating Data/ML Workflows at Scale With Netflix Maestro | by Netflix Technology Blog | Oct, 2022 | Netflix TechBlog
    • Netflix の既存の機械学習ワークフローのオーケストレーションツールである Meson は、7000 のワークフローと 50 万のジョブがスケジュールされ管理されている。
      • 課題点: 深夜 0 時に起動するジョブが多く、そのせいでオンコール対応者がその時間帯の監視を余儀なくされ辛い。
    • Mestro という新世代のワークフローオーケストレーションを開発。
      • 個人的に面白いのは。NoteBook(おそらく Jupyter Notebook)を定期的に実行可能にしていたり、Metaflow をかんたんに実行可能にしていたりと、できるだけ簡単にワークフローを実行できるようにする方針が見受けられる。NoteBook の定期ジョブとか管理が怖いんだけど、それを許容しているのも面白い
  • データ サイエンスと AI チームの価値の計測と最大化 | Google Cloud 公式ブログ
    • データサイエンスによってもたらされた価値をどう計測するかの解説。削減された時間や費用などなど、多角的に評価するのは大事ですよね。データサイエンスによる改善はほぼ全てがオペレーションの自動化ですしね。
  • 競馬 AI でポルシェを買う話(2020 年総まとめ・+43361 万円) | Matsukaze.AI
    • AI で競馬に挑んでポルシェを買うお話。収支が億単位で儲かっており、すごいとしか言いようがない。

      購入が約 17.5 億、払戻が約 20.8 億で、収支は+3.3 億

      • 以下の戦略はとてもおもしろかった。機械学習でギャンブルって自分は正直想像がつかないが、突き詰めればそれだけ勝てるのは凄い。

        好調の要因としては、三連単の開放と独自開発データの蓄積・投入が考えられる

    • 「自動で経理」の推論エンジンってどんなやつ? - freee Developers Hub
      • freee さんの勘定項目を機械学習で推論する機能の解説。機械学習による会計の勘定項目の自動化は王道の改善ですね。
  • 試行回数の増やし方 2021 年度版 Speaker Deck
    • 研究を効果的にすすめる上で、どうやれば試行回数を最大化できるかについて。
      • ここらへんの考え方って物凄く生産性に効いてきますが、意識しないと難しい点も多いですよね。これこそ知的生産のコツの一つだなと思います。
    • 成功の方程式
      • 上記のスライドの参考資料の一つ。単純だけど奥深いですね。最後の文章がすごく良かったです > 私の知っている「成功している人達」は必ずしも成功率が高い人達で はない.ただ,彼らは例外なく試行回数が多く,失敗も含めて自分のやったことに対する評価 を受け入れる.それは結果であって原因ではないのかもしれない.たとえそうだとしても,そ のあり方は清々しく真似したくなるあり方である.
    • 研究者流コーディングの極意
      • 上記のスライドの参考資料の一つ。NL2013 のチュートリアル資料として公開。Make it work→ Make it right→ Make it fast の各段階はとても明瞭。相変わらず岡崎 直観先生の資料は良き資料が多いですね。言語処理 100 本ノックを作った経緯もここで語られている。
  • KARTE における MLOps の変遷- Speaker Deck
    • KARTE さんの機械学習基盤がどのように変遷したか。そのときの必要性に合せて基盤を適宜作成しているのが特徴的です。
      • NOTE: MLOps の目的は、「ML を使うこと」ではなく、「ビジネスで価値を出すこと」と最初に語っているのが良いですね。

ニュースレターの購読のメリット

substack でのニュースレター を購読してくれている方のみに最新号がメールで配信され先読み可能です

そのため、ニュースレターの最新号を先読みしたい方はぜひ購読をよろしくおねがいします 😁 もちろん購読は無料です。

ニュースレターが更新されるたびに、最新号を除くニュースレターは Web 上で公開され、誰でも読めるようになっています。

感想など

Twitter で searchengineeringnewsletter のハッシュタグでつぶやいていただくか、Google フォーム での感想投稿をお待ちしております。 また、substack 上でのコメントも歓迎しております。

ご感想は執筆の励みにさせていただきます。

もしよろしければ、Buy Me a Coffeeからサポート(投げ銭)していただけると、ニュースレター配信のモチベーションに繋がります ✨