「Joint Phrase Alignment and Extraction for Statistical Machine Translation」

2012年度論文賞受賞者の紹介

Joint Phrase Alignment and Extraction for Statistical Machine Translation

[Journal of Information Processing Vol.20 No.2 pp.512-523]
[論文概要]

 最近の統計的機械翻訳システムにおいて、スコア付きの対訳フレーズ集であるフレーズテーブルは中心的な役割を果たす。本論文では、ノンパラメトリックベイズ法を用いて、フレーズテーブルを対訳文コーパスから直接学習する手法を提案する。特に、従来手法ではフレーズの対応付けを1つの粒度でしかモデル化できないのに対して、提案手法では複数の粒度におけるフレーズの対応付けを行えるのが特長である。複数の言語対にわたる翻訳実験により、提案手法によって学習された翻訳モデルは、従来手法で学習されたモデルに比べてサイズを1/7に圧縮しながら、同程度の翻訳精度を実現することを示した。


[推薦理由]

 本論文では、フレーズベース機械翻訳において使用されるフレーズテーブルを、Inversion Transduction Grammar (ITG)とベイズ的手法を用いることにより、階層的にモデル化し、様々な粒度のフレーズテーブルを統一的に構築する手法を提案している。提案手法により、翻訳精度を保ったままフレーズテーブルを簡潔化させることに成功している。提案手法は興味深くかつ実用的であり、また、論文全体の完成度も高く、論文賞に相応しい論文であると判断し、JIP論文賞へ推薦する。

Graham Neubig 君

 2005年米国イリノイ大学アーバナ・シャンペーン校工学部コンピュータ・サイエンス専攻卒業。2010年京都大学大学院情報学研究科修士課程修了。2012年同大学院博士後期課程修了。同年奈良先端科学技術大学院大学助教。自然言語処理に関する研究に従事。

渡辺太郎 君

 1994年京都大学工学部情報工学科卒業.1997年京都大学工学研究科情報工学専攻修士課程修了. 2000年Language and Information Technologies, School of Computer Science, Carnegie Mellon University, Master of Science取得.2004年京都大学博士(情報学). ATRおよびNTTにて研究員として務めた後、現在、情報通信研究機構主任研究員.主に統計的機械翻訳の研究に従事.情報処理学会、自然言語処理学会、ACL各会員.

隅田英一郎 君

 独立行政法人情報通信研究機構多言語翻訳研究室室長.1982年電気通信大学大学院修士課程修了.1999年京都大学工学博士.機械翻訳,eラーニングを研究.2010年文部科学大臣表彰科学技術賞(開発部門),2013年第57回前島密賞,受賞.言語処理学会副会長(総編集長),IPSJ,IEICE,ASJ,NLP,ACL,IEEE会員.

森信介 君

 1998年京都大学大学院工学研究科電子通信工学専攻博士後期課程修了.同年日本アイ・ビー・エム(株)入社.2007年より京都大学学術情報メディアセンター准教授.京都大学博士(工学).1997年情報処理学会山下記念研究賞受賞.2010年情報処理学会論文賞受賞.2010年第58回電気科学技術奨励賞受賞.言語処理学会会員.

河原達也 君

 1989年京都大学大学院工学研究科情報工学専攻修士課程修了.現在,京都大学学術情報メディアセンター教授.音声言語処理,特に音声認識及び対話システムに関する研究に従事.京大博士(工学).2012年度科学技術分野の文部科学大臣表彰科学技術賞.情報処理学会,日本音響学会,電子情報通信学会,人工知能学会,言語処理学会,IEEE 各会員.