u++の備忘録

【論文メモ】Embedding-based News Recommendation for Millions of Users

論文名

Embedding-based News Recommendation for Millions of Users

どんなもの?

end-to-endの方法で分散表現を使用する埋め込みベースのニュース推薦手法の提案

  • オートエンコーダのノイズ除去の変形に基づく分散表現から
  • ブラウジング履歴を入力としたRNNモデルでユーザ表現を生成し
  • システム性能を考慮した内積操作に基づいて、各ユーザの記事を照合して一覧表示する

先行研究と比べてどこがすごい?

  • コラボレーティブフィルタリングや低ランク分解などのIDベースの手法はよく知られているが、候補の記事は短期間で期限切れになり新しい記事に置き換えられるため、ニュースの推薦には適していない
  • 単語ベースのアプローチは、システム性能の面で優れた候補であるが、同義語・表記ゆれ・固有名詞といったユーザ固有の特徴をどう扱うかなど、いくつかの課題がある
  • 本論文では、埋め込みベースのアプローチで、従来より高い性能を示すモデルを作成した

技術や手法のキモはどこ?

RNNモデルを採用することで、ブラウジング履歴から各ユーザの特徴を表現し、高精度の推薦を可能にした

どうやって有効だと検証した?

  • 過去のアクセスデータを用いたオフライン評価において良好な性能を示した
  • CTRと合計期間は、単語ベースのアプローチと比較して個別に23%と10%向上
  • 提案された方法を組み込んだサービスは、すでにすべてのユーザーに公開されており、1日に1,000万人以上のUUに推薦され、毎月数十億のアクセスが行われている

議論はある?

ニュース以外の分野(広告)などにも推薦技術を応用していきたい

次に読むべき論文は?

NULL