2022/08/14 - 2022/08/18 に開催される Knowledge Discovery and Data Mining (KDD) 2022 の情報が出揃ってきたので、気になった情報をメモしておく。

自分が気になるトピックは、変わらず機械学習の実応用とその周辺領域なのでそれに偏ったリストになっている。

ADS invited speaker

KDD 2022 ADS Invited Speakers

An overview of AWS AI/ML’s recent contributions to open source ML tools: Accelerating discovery and innovation

招待講演は確か毎回論文化されて ACM で公開されるので論文公開されたらぜひ読みたい。

Tutorias

KDD 2022 Tutorials Schedule に Tutorial の情報がまとまっているが、タイトルだけでウェブサイトへのリンクが一切なく、読み手に不親切なので来年は、改善してほしい。去年はそんなことなかったので、なんとか来年はもとに戻って欲しい。

  • Graph-based Representation Learning for Web-scale Recommender Systems. Authors: Ahmed El-Kishky (Twitter)*; Michael Bronstein (Twitter); Ying Xiao (Twitter); Aria Haghighi (Twitter)
    • Twitter が開催する Tutorial で、すごく面白そうなのだが全く情報が見つからなかった。Twitter Cortex にも情報が更新されていないので、しばらくしたら公開されていることを祈る。
  • New Frontiers of Scientific Text Mining: Tasks, Data, and Tools. Authors: Xuan Wang (University of Illinois at Urbana-Champaign)*; Hongwei Wang (University of Illinois Urbana-Champaign); Heng Ji (University of Illinois at Urbana-Champaign); Jiawei Han (UIUC)
    • こちらも情報を発見できなかった。
  • Modern Theoretical Tools for Designing Information Retrieval System. Authors: Da Xu (Walmart Labs)*; Chuanwei Ruan (Walmart Labs); Bo Yang (Linkedin)
  • Model Monitoring in Practice: Lessons Learned and Open Challenges. Authors: Krishnaram Kenthapadi (Fiddler AI)*; Himabindu Lakkaraju (Harvard); Pradeep Natarajan (Amazon.com Inc.); Mehrnoosh Sameki (Microsoft Azure AI)
    • モデルの監視に関するチュートリアル。大前提としては、モデルの監視は、デプロイ後に必須の時代でどんな課題が今まで存在しており、どう実現するかをツールを交えて講義。そして最終的にはモデルの監視がガバナンス向上や責任のある AI につながっていくことについて話している。
  • Reward Optimising Recommendation using Deep Learning and Fast Maximum Inner Product Search. Authors: Imad Aouali (ENS Paris-Saclay); Benjamin Heymann (Criteo); Martin Bompaire (Criteo); Achraf Ait Sidi Hammou (Criteo); Sergey Ivanov (Criteo); Amine Benhalloum (Criteo); DAVID J ROHDE (CRITEO)*; Flavian Vasile (Criteo); Maxime VONO (Criteo); Otmane Sakhi (Criteo)
    • こちらも情報を発見できなかった
  • Deep Search Relevance Ranking in Practice. Authors: Linsey Pang (Salesforce)*; Wei Liu (University of Technology Sydney); Moumita Bhattacharya (neflix); Keng-hao Chang (Microsoft); Xue Li (Microsoft); xianjing liu (twitter); Stephen Guo (Walmart Labs)
    • 検索のための深層学習によるレリバンスモデルのハンズオンチュートリアル。Jupyter notebook を通して手を動かしながら学べる。

Workshops

KDD 2022 Workshopは、すべてリンクがまとめられていた。素晴らしい。 論文投稿を募集するから外的にわからないと開催できないので納得。

KDD Cup

Search Engineering Newsletter vol.05 で言及した Amazon が主催する KDD カップ。 自分が e コマースの検索システム開発に携わっているので、このタスクは非常に興味がある。

Amazon Product Search https://www.aicrowd.com/challenges/esci-challenge-for-improving-product-search

Papers

論文関係は数が多いので、見出しだけで面白そうだなと思った論文をリスト化した。 時間がある時にこのリストから選んでみたい。 全ての論文が網羅されているのページがこちら。 https://kdd.org/kdd2022/toc.html

KDD のサイトで提供されているトラックごとのページは抜け漏れ?がある模様 https://kdd.org/kdd2022/researchPosterAssignments.html ポスターだけに絞っているからそうなっている?

会社ごとの論文は、会社によってはまとめられているので便利。 自分は職業柄、e コマースに関するに関する課題に向き合っている Amazon の論文が好きな事が多い。

Research Track Full Papers

  • HyperLogLogLog: Cardinality Estimation With One Log More
  • Streaming Graph Neural Networks with Generative Replay
  • Non-stationary A/B Tests
  • A Generalized Backward Compatibility Metric
  • On-Device Learning for Model Personalization with Large-Scale Cloud-Coordinated Domain Adaption

SESSION: ADS Track Papers

  • ItemSage: Learning Product Embeddings for Shopping Recommendations at Pinterest
  • Graph-based Multilingual Language Model: Leveraging Product Relations for Search Relevance
  • Amazon Shop the Look: A Visual Search System for Fashion and Home
  • TwHIN: Embedding the Twitter Heterogeneous Information Network for Personalized Recommendation
  • Automatic Generation of Product-Image Sequence in E-commerce
  • Alexa Teacher Model: Pretraining and Distilling Multi-Billion-Parameter Encoders for Natural Language Understanding Systems
  • Automatic Controllable Product Copywriting for E-Commerce
  • Learning Backward Compatible Embeddings
    • 埋め込み空間の後方互換性に関する研究
  • Rax: Composable Learning-to-Rank Using JAX
  • A/B Testing Intuition Busters: Common Misunderstandings in Online Controlled Experiments
  • TaxoTrans: Taxonomy-Guided Entity Translation
  • Persia: An Open, Hybrid System Scaling Deep Learning-based Recommenders up to 100 Trillion Parameters
  • User Behavior Pre-training for Online Fraud Detection
  • Lion: A GPU-Accelerated Online Serving System for Web-Scale Recommendation at Baidu
  • Semantic Retrieval at Walmart
  • Looper: An End-to-End ML Platform for Product Decisions
  • Amazon SageMaker Model Monitor: A System for Real-Time Insights into Deployed Machine Learning Models
  • Human-in-the-Loop Large-Scale Predictive Maintenance of Workstations
  • PinnerFormer: Sequence Modeling for User Representation at Pinterest
  • Improving Relevance Modeling via Heterogeneous Behavior Graph Learning in Bing Ads
  • Profiling Deep Learning Workloads at Scale using Amazon SageMaker
  • Recommendation in Offline Stores: A Gamification Approach for Learning the Spatiotemporal Representation of Indoor Shopping
  • Type Linking for Query Understanding and Semantic Search
    • Huawei が書いている。
  • Interpretable Personalized Experimentation
    • Meta が書いている。
  • Training Large-Scale News Recommenders with Pretrained Language Models in the Loop
  • Scale Calibration of Deep Ranking Models
    • Google が書いている
  • Multilingual Taxonomic Web Page Classification for Contextual Targeting at Yahoo

See Also

Support

記事をお読みくださりありがとうございます。このウェブサイトの運営を支援していただける方を募集しています。 もしよろしければ、下のボタンからサポート(投げ銭)していただけると、ブログ執筆、情報発信のモチベーションに繋がります✨