「リンク情報の利用によるWeb 検索性能の改善」 [論文誌Vol.46, No.SIG8(TOD26), pp. 48-59 (2005)]

平成17年度論文賞受賞者の紹介

「リンク情報の利用によるWeb 検索性能の改善」 [論文誌Vol.46, No.SIG8(TOD26), pp. 48-59 (2005)]

[論文概要]
 本研究は,Web文書クラスタリングの新手法を提案し,そのクラスタ情報の利用によりWeb検索性能の向上を実現する.リンク解析に関する研究にはWeb 構造解析の域を出ない傾向もあるが,本研究の特徴はリンク解析を情報検索という具体的アプリケーションに利用した点にある.提案のクラスタリング手法はグラフ理論における単一始点最短パス問題という古典的問題の一応用となっており,またクラスタの中心となるWebページの抽出にはP2P分野で使われる2ホップ帰還確率を援用している.評価実験は,提案手法がワンクリック距離文書モデルの下でWeb検索性能を大きく改善できることを示した.

[推薦理由]
 本論文は,Webサイト内のリンク情報を使用する新しいクラスタリング・アルゴリズムを提案し,NTCIR-3 WEBテストコレクションを用いた検索評価実験を通じてその検索への有効性を示したものである。Web検索では一つのトピックが分割記述された論理ページ単位を適切に扱うことが求められ,これまで各種の手法が提案されたがどれも明確な効果を示すことができなかった。本手法は,一定規模のテストコレクションを用いた客観的評価により,明確な有効性が示された初めての例と言える。実験では既存手法との比較評価や複数の代表的指標による評価を行っており信頼性も高い。本研究が将来のWeb検索技術に与える影響は大きいものと考えられる。よって本論文を論文賞に推薦する。

正田 備也 君 1970年生.1995年東京大学大学院理学系研究科情報科学専攻修士課程修了.1999年同大学院総合文化研究科(科学哲学)修士課程修了.2004年同大学院情報理工学系研究科電子情報学専攻博士課程修了.1999年~2001年フジノン(旧富士写真光機)株式会社.2004年~国立情報学研究所非常勤研究員.興味は情報検索,テキスト・マイニング.

高須 淳宏 君 1984年東京大学工学部航空学科卒業.1989年同大学院工学系研究科博士課程修了.工学博士.同年,学術情報センター研究開発部助手.同センター助教授.国立情報学研究所助教授を経て2003年より同研究所教授.データ工学,特にデータ解析と解析モデルの学習の研究に従事.

安達 淳 君 1981年東京大学大学院工学系研究科博士課程修了.工学博士.東京大学大型計算機センター助手,文部省学術情報センター助教授、教授等を経て現在国立情報学研究所教授.東京大学大学院情報理工学系研究科教授を併任.データマイング,情報検索,電子図書館シス テム等の開発研究に従事.電子情報通信学会,情報処理学会,IEEE,ACM 各会員.