KDD2022 で気になった論文、チュートリアル、ワークショップ

2022/08/14 - 2022/08/18 に開催される KDD Knowledge Discovery and Data Mining 2022の情報が出揃ってきたので、気になった情報をメモしておく。

自分が気になるトピックは、変わらず機械学習の実応用とその周辺領域なのでそれに偏ったリストになっている。

ADS invited speaker

KDD 2022 ADS Invited Speakers

An overview of AWS AI/ML’s recent contributions to open source ML tools: Accelerating discovery and innovation

招待講演は確か毎回論文化されて ACM で公開されるので論文公開されたらぜひ読みたい。

Tutorias

KDD 2022 Tutorials Schedule に Tutorial の情報がまとまっているが、タイトルだけでウェブサイトへのリンクが一切なく、読み手に不親切なので来年は、改善してほしい。去年はそんなことなかったので、なんとか来年はもとに戻って欲しい。

Graph-based Representation Learning for Web-scale Recommender Systems. Authors: Ahmed El-Kishky (Twitter)*; Michael Bronstein (Twitter); Ying Xiao (Twitter); Aria Haghighi (Twitter)

- Twitter が開催する Tutorial で、すごく面白そうなのだが全く情報が見つからなかった。Twitter Cortex にも情報が更新されていないので、しばらくしたら公開されていることを祈る。

New Frontiers of Scientific Text Mining: Tasks, Data, and Tools. Authors: Xuan Wang (University of Illinois at Urbana-Champaign)*; Hongwei Wang (University of Illinois Urbana-Champaign); Heng Ji (University of Illinois at Urbana-Champaign); Jiawei Han (UIUC)

- こちらも情報を発見できなかった。

Modern Theoretical Tools for Designing Information Retrieval System. Authors: Da Xu (Walmart Labs)*; Chuanwei Ruan (Walmart Labs); Bo Yang (Linkedin)

- arxiv でTutorial: Modern Theoretical Tools for Understanding and Designing Next-generation Information Retrieval System も公開されている。WSDM2022 チュートリアルでも同じチュートリアルが開催されていた模様。チートシート的に、情報検索の領域でどんなツール(理論)を使えばいいのかを紹介してくれているチュートリアル。

Model Monitoring in Practice: Lessons Learned and Open Challenges. Authors: Krishnaram Kenthapadi (Fiddler AI)*; Himabindu Lakkaraju (Harvard); Pradeep Natarajan (Amazon.com Inc.); Mehrnoosh Sameki (Microsoft Azure AI)

- モデルの監視に関するチュートリアル。大前提としては、モデルの監視は、デプロイ後に必須の時代でどんな課題が今まで存在しており、どう実現するかをツールを交えて講義。そして最終的にはモデルの監視がガバナンス向上や責任のある AI につながっていくことについて話している。

Reward Optimising Recommendation using Deep Learning and Fast Maximum Inner Product Search. Authors: Imad Aouali (ENS Paris-Saclay); Benjamin Heymann (Criteo); Martin Bompaire (Criteo); Achraf Ait Sidi Hammou (Criteo); Sergey Ivanov (Criteo); Amine Benhalloum (Criteo); DAVID J ROHDE (CRITEO)*; Flavian Vasile (Criteo); Maxime VONO (Criteo); Otmane Sakhi (Criteo)

- こちらも情報を発見できなかった

Deep Search Relevance Ranking in Practice. Authors: Linsey Pang (Salesforce)*; Wei Liu (University of Technology Sydney); Moumita Bhattacharya (neflix); Keng-hao Chang (Microsoft); Xue Li (Microsoft); xianjing liu (twitter); Stephen Guo (Walmart Labs)

- 検索のための深層学習によるレリバンスモデルのハンズオンチュートリアル。Jupyter notebook を通して手を動かしながら学べる。

Workshops

KDD 2022 Workshopは、すべてリンクがまとめられていた。素晴らしい。

論文投稿を募集するから外的にわからないと開催できないので納得。

Workshop on Applied Machine Learning Management

- 機械学習プロジェクトのマネジメントや機械学習のプロダクト開発と、超実践的な領域に焦点を当てたワークショップ

- これは一番面白そうなワークショップで、ぜひとも資料を全公開していただきたいが、現状なにも情報は公開されていない。

Fragile Earth 2022 - AI for Good Foundation

- ソーシャルハッピーのために機械学習をどう活用するかのワークショップ。災害予測や犯罪の予防などがトピック

Workshop on Decision Intelligence and Analytics for Online Marketplaces: Jobs, Ridesharing, Retail, and Beyond

- オンラインマーケットプレイスでの課題をどう解決するかに焦点をあてたワークショップ。

Document Intelligence Workshop @ KDD 2022 DI@KDD2022

- 今年で 3 回目の開催となるワークショップ。現実世界の書類をどのように理解(例えば OCR など)して活用するかについて焦点をあてている。

- 現実世界のデータって全部紙なので、それを構造化してデジタル化するってものすごく大変だけどやりきった先に競合優位性が発生し、とんでもない価値を生むと思うのでこの領域は気になっている。

First Content Understanding and Generation for E-commerce Workshop

- e コマースでのコンテンツ生成に関するワークショップ。e コマースに関わっている方ならおもしろトピック満載です。

ESCI Challenge for Improving Product Search

- 後述する KDD Cup の成果がこのワークショップで公開される。既に論文が公開されており、読むのが非常に楽しみ

KDD online and adaptive recommender systems Workshop

- リアルタイムでの推薦システム構築に関して焦点を当てたトピック。

KDD Cup

Search Engineering Newsletter vol.05 で言及した Amazon が主催する KDD カップ。

自分が e コマースの検索システム開発に携わっているので、このタスクは非常に興味がある。

Amazon Product Search

https://www.aicrowd.com/challenges/esci-challenge-for-improving-product-search

Papers

論文関係は数が多いので、見出しだけで面白そうだなと思った論文をリスト化した。

時間がある時にこのリストから選んでみたい。

全ての論文が網羅されているのページがこちら。

https://kdd.org/kdd2022/toc.html

KDD のサイトで提供されているトラックごとのページは抜け漏れ?がある模様

https://kdd.org/kdd2022/researchPosterAssignments.html

ポスターだけに絞っているからそうなっている?

会社ごとの論文は、会社によってはまとめられているので便利。

自分は職業柄、e コマースに関するに関する課題に向き合っている Amazon の論文が好きな事が多い。

Research Track Full Papers

HyperLogLogLog: Cardinality Estimation With One Log More
Streaming Graph Neural Networks with Generative Replay
Non-stationary A/B Tests
A Generalized Backward Compatibility Metric
On-Device Learning for Model Personalization with Large-Scale Cloud-Coordinated Domain Adaption

SESSION: ADS Track Papers

ItemSage: Learning Product Embeddings for Shopping Recommendations at Pinterest
Graph-based Multilingual Language Model: Leveraging Product Relations for Search Relevance
Amazon Shop the Look: A Visual Search System for Fashion and Home
TwHIN: Embedding the Twitter Heterogeneous Information Network for Personalized Recommendation
Automatic Generation of Product-Image Sequence in E-commerce
Alexa Teacher Model: Pretraining and Distilling Multi-Billion-Parameter Encoders for Natural Language Understanding Systems
Automatic Controllable Product Copywriting for E-Commerce
Learning Backward Compatible Embeddings

- 埋め込み空間の後方互換性に関する研究

Rax: Composable Learning-to-Rank Using JAX
A/B Testing Intuition Busters: Common Misunderstandings in Online Controlled Experiments
TaxoTrans: Taxonomy-Guided Entity Translation
Persia: An Open, Hybrid System Scaling Deep Learning-based Recommenders up to 100 Trillion Parameters

- PersiaML/PERSIA: High performance distributed framework for training deep learning recommendation models based on PyTorch. PyTorch による深層学習ベースの推薦モデルを分散学習するためのフレームワーク。

User Behavior Pre-training for Online Fraud Detection
Lion: A GPU-Accelerated Online Serving System for Web-Scale Recommendation at Baidu
Semantic Retrieval at Walmart
Looper: An End-to-End ML Platform for Product Decisions

- Looper: An End-to-End ML Platform for Product Decisions - Igor Markov | Stanford MLSys #60 - YouTube Stanford の講義で動画が公開されていた、Meta(Facebook)の機械学習プラットフォーム。従来の機械学習基盤であるFBLeaner からこれに移行したのだろうか?

Amazon SageMaker Model Monitor: A System for Real-Time Insights into Deployed Machine Learning Models
Human-in-the-Loop Large-Scale Predictive Maintenance of Workstations
PinnerFormer: Sequence Modeling for User Representation at Pinterest
Improving Relevance Modeling via Heterogeneous Behavior Graph Learning in Bing Ads
Profiling Deep Learning Workloads at Scale using Amazon SageMaker
Recommendation in Offline Stores: A Gamification Approach for Learning the Spatiotemporal Representation of Indoor Shopping
Type Linking for Query Understanding and Semantic Search

- Huawei が書いている。

Interpretable Personalized Experimentation

- Meta が書いている。

Training Large-Scale News Recommenders with Pretrained Language Models in the Loop
Scale Calibration of Deep Ranking Models

- Google が書いている

Multilingual Taxonomic Web Page Classification for Contextual Targeting at Yahoo

電脳枯山水

KDD2022 で気になった論文、チュートリアル、ワークショップ

ADS invited speaker

Tutorias

Workshops

KDD Cup

Papers

Research Track Full Papers

SESSION: ADS Track Papers

最近の記事

各プロバイダーの軽量LLMモデルの値段を調査

Perfect Glue

令和最新版 FressRSSのおすすめAndroidクライアント

データサイエンスリーダーのキャリアガイドという翻訳書籍が出版されるが面白そう

marimoはwasm notebookとして出力してGitHub Pages などブラウザ上で実行可能にできる

目次

バックリンク