「購買順序を効率的に用いた協調フィルタリング」[情報処理学会論文誌 数理モデル化と応用 Vol.49, No.SIG4, pp.125-134]
平成20年度論文賞受賞者の紹介
「購買順序を効率的に用いた協調フィルタリング」[情報処理学会論文誌 数理モデル化と応用 Vol.49, No.SIG4, pp.125-134]
[論文概要]
高速にパラメータ推定可能な購買順序を考慮した協調フィルタリング手法を提案する.これまでに次の購入商品を予測する問題において,購買順序を考慮したマルコフモデルや最大エントロピーモデルが適用されている.マルコフモデルは高速にパラメータ推定ができるが,予測精度が低いという問題点がある.一方,最大エントロピーモデルはパラメータ推定に多くの計算量を必要とするが,予測精度は高い.提案法は,複数のマルコフモデルを最大エントロピー原理を用いて統合することにより,高速性と高予測精度を同時に実現する.音楽,動画,漫画配信サービスの実ログデータを用い,提案法の有効性を示す.
[推薦理由]
データベースとして蓄積された多くのユーザの購買履歴データを用いて、予測したいユーザの購買履歴を入力とし、次に購入する商品を予測もしくは推薦する問題は、協調フィルタリングと呼ばれる。協調フィルタリングに基づく商品の推薦は、アマゾンなど、多くのオンラインサービスで既に実用化されている。しかし、そのうちの大半は、予測のための購買履歴情報として、ユーザが直前に購入した商品のみ、もしくは、購買履歴の順序を無視した購買商品集合を用いている。ユーザが次に購入する商品を高精度に予測するためには、単に、そのユーザが過去に何を購入したかという履歴情報だけでなく、その購買順序も重要な情報と言える。従来、購買順序を考慮する方法として、マルコフモデルを用いた手法が提案されている。しかし、考えるべき履歴が長くなるにしたがって、推定すべきパラメータ数が膨大となり、大規模データへの適用性が困難という問題があった。さらに、ユーザの嗜好は動的に変化するため、昔の購買履歴は必ずしも参考にならない可能性がある。すなわち、単純な購買順序だけでは不十分で、嗜好の動的変化も考慮すべきと言える。この視点も従来法では欠けている。以上の背景の下、本論文では、購買順序と嗜好の動的変化を考慮した、高速かつ高精度な協調フィルタリング手法を提案している。具体的には、購買順序を考慮すべく、マルコフモデルを用いるが、単純なマルコフモデルではなく、現在から過去の履歴に不連続性を持たせたギャップマルコフモデルを複数用意し、それらの重み付き和として統合し、予測を行っている。各ギャップマルコフモデル、および、重みパラメータは統計的学習の枠組みで、既存データを用いて推定する。これにより、過去の履歴でも予測に重要な情報はより重み付けされ、逆に、最近の履歴でも予測に不要な情報は無視され得るという、嗜好の動的変化に柔軟に対処できる手法となっている。実データを用いた従来法との比較実験で、提案法は、多くの計算量が必要な購買順序を考慮した従来法と同程度の精度を維持しつつ、計算量の大幅削減を実証している。単純な原理で、技術の健全性、実用性も高い。本技術の考案は、当該研究分野の学術発展と、今後のオンラインサービスの発展に大きく貢献するものと言える。その価値を称え、論文賞に推薦する。
岩田 具治 君
平13慶大・環境情報卒.平15東大大学院・総合文化・広域科学修士課程了.同年NTT入社.平20京大大学院・情報学・システム科学博士課程了.博士(情報学).現在,NTTコミュニケーション科学基礎研究所 研究員.機械学習,データマイニング,情報可視化の研究に従事.平16船井ベストペーパー賞等受賞.情報処理学会,電子情報通信学会各会員.
山田 武士 君
昭63東大・理・数学科卒.同年NTT入社.平8より1年間英国コベントリー大学客員研究員.現在, NTTコミュニケーション科学基礎研究所 知能創発環境研究グループリーダ.主として統計的機械学習,データマイニング,メタヒューリスティクスによる組合せ最適化等の研究に従事.博士(情報学).情報処理学会,電子情報通信学会,ACM,IEEE各会員.
上田 修功 君
昭57阪大・工・通信工学卒.昭59同大学大学院修士課程了.工学博士.同年NTT入社.平5より1年間Purdue大学客員研究員.主として,統計的学習とそのパターン認識,データマイニングへの応用に関する研究に従事.現在,NTTコミュニケーション科学基礎研究所副所長 企画担当主席研究員,電子情報通信学会,情報処理学会,IEEE各会員.