メルカリのTeam AI Meetup #1 に参加してきた #mercari_ai
メルカリが主催する機械学習のミートアップに参加してきたので備忘録がてらメモ書きです。書きなぐったメモなので意訳として捉えて下さい
発表者の顔は隠しています。なにか問題があればお伝え下さい。
Team AI Meetup #1 (2018/02/13 19:00〜)
Twitter: #mercari_ai
山口さん
- Image Net と mercari の持ってるデータセットは似てるのでいけるのでは!
- ルカリはクラス数 over 1100
- 始期の推定値 Top5 29.3%
- エラー例 :画像からサイズを推定しないと男女のシューズを区別不可(人間でも不可能なエラー例が多い)
- 意外と認識がうまくいく事例がかなりある(クラス設計の影響で推定が上手く出来ていないらしい)
- データセットはユーザーが作成してるので最高、画像が正方形なのも Good
- 学習は GPU,推論は CPU 環境下で行っている
- 画像検索自体はプロトタイプは出来ているが、実運用は計算量やリアルタイム性を担保するのが難しいので一旦保留中
大筋は以下の記事と資料で把握できます。k8s で運用しているなどの実運用の構成が今回の発表では差分として語られていました。
画像での商品検索に向けて - Mercari Engineering Blog
【Mercari Summer Internship】商品画像の色推定を行いました! - Mercari Engineering Blog
工藤さん
- 運用を継続すると色んな問題が出てきたので、それを解決する基盤環境を作成しはじめた
- e.g. 学習データのバージョン管理、モデルのデプロイ, etc
- 最終的には OSS としての公開も考えているとのこと
メルカリの今年 1 年間の機械学習の取り組みとこれから - Mercari Engineering Blog
ML Ops Study (仮) #1の発表内容も今回の機械学習の運用周りの Tips が共有されているので興味のある方はオススメです
機械学習基盤といえば、最近Polyaxonという OSS が公開されてました。
Q.A.セッション
- Q. 論文などは参考にされますか?
- A. ある程度枯れた手法をメインに実装している
- TFX(KDD2017)など Google が出している機械学習の基盤関係の論文は非常に参考している
- Q. 機械学習のプロジェクトをどう進めているか?
- A. ある程度の機械学習についての啓蒙が必要
- 必ずデモを見せて期待値のすり合わせを行っている
- 何もしらない人は機械学習に対して過度な期待ではなく間違った期待をしてしまっているのでそこのすり合わせは重要
- e.g. データは無いが機械学習でなんとかして! など雑感 : 質疑応答でも機械学習を実運用したい場合にどう運用しているかにフォーカスした質問がメインでためになる質問が多かったので良かった。メルカリさんが今回のような知見を共有してくれるのは本当に尊敬できます。
関連しているかもしれない記事
- Analyzing Free-standing Conversational Groups: A Multimodal Approach (ACMMM15) を読んだ
- Call center stress recognition with person-specific models を読んだ
- FUSE: Full Spectral Clustering(KDD2016) を読んだ
- “Learning Deep Representations for Graph Clustering (AAAI2014)” を読んだ
- CoreMLがTensorFlow Liteをサポート
📮 📧 🐏: 記事への感想のおたよりをおまちしてます。 お気軽にお送りください。 メールアドレス入力があればメールで返信させていただきます。 もちろんお返事を希望せずに単なる感想だけでも大歓迎です。
このサイトの更新情報をRSSで配信しています。 お好きなフィードリーダーで購読してみてください。
このウェブサイトの運営や著者の活動を支援していただける方を募集しています。 もしよろしければ、Buy Me a Coffee からサポート(投げ銭)していただけると、著者の活動のモチベーションに繋がります✨
Amazonでほしいものリストも公開しているので、こちらからもサポートしていただけると励みになります。