「Joint Phrase Alignment and Extraction for Statistical Machine Translation」
2012年度論文賞受賞者の紹介
Joint Phrase Alignment and Extraction for Statistical Machine Translation
[Journal of Information Processing Vol.20 No.2 pp.512-523]
[論文概要]
最近の統計的機械翻訳システムにおいて、スコア付きの対訳フレーズ集であるフレーズテーブルは中心的な役割を果たす。本論文では、ノンパラメトリックベイズ法を用いて、フレーズテーブルを対訳文コーパスから直接学習する手法を提案する。特に、従来手法ではフレーズの対応付けを1つの粒度でしかモデル化できないのに対して、提案手法では複数の粒度におけるフレーズの対応付けを行えるのが特長である。複数の言語対にわたる翻訳実験により、提案手法によって学習された翻訳モデルは、従来手法で学習されたモデルに比べてサイズを1/7に圧縮しながら、同程度の翻訳精度を実現することを示した。
[推薦理由]
本論文では、フレーズベース機械翻訳において使用されるフレーズテーブルを、Inversion Transduction Grammar (ITG)とベイズ的手法を用いることにより、階層的にモデル化し、様々な粒度のフレーズテーブルを統一的に構築する手法を提案している。提案手法により、翻訳精度を保ったままフレーズテーブルを簡潔化させることに成功している。提案手法は興味深くかつ実用的であり、また、論文全体の完成度も高く、論文賞に相応しい論文であると判断し、JIP論文賞へ推薦する。
Graham Neubig 君
2005年米国イリノイ大学アーバナ・シャンペーン校工学部コンピュータ・サイエンス専攻卒業。2010年京都大学大学院情報学研究科修士課程修了。2012年同大学院博士後期課程修了。同年奈良先端科学技術大学院大学助教。自然言語処理に関する研究に従事。
渡辺太郎 君
1994年京都大学工学部情報工学科卒業.1997年京都大学工学研究科情報工学専攻修士課程修了.
2000年Language and Information Technologies, School of Computer Science,
Carnegie Mellon University, Master of Science取得.2004年京都大学博士(情報学).
ATRおよびNTTにて研究員として務めた後、現在、情報通信研究機構主任研究員.主に統計的機械翻訳の研究に従事.情報処理学会、自然言語処理学会、ACL各会員.
隅田英一郎 君
独立行政法人情報通信研究機構多言語翻訳研究室室長.1982年電気通信大学大学院修士課程修了.1999年京都大学工学博士.機械翻訳,eラーニングを研究.2010年文部科学大臣表彰科学技術賞(開発部門),2013年第57回前島密賞,受賞.言語処理学会副会長(総編集長),IPSJ,IEICE,ASJ,NLP,ACL,IEEE会員.
森信介 君
1998年京都大学大学院工学研究科電子通信工学専攻博士後期課程修了.同年日本アイ・ビー・エム(株)入社.2007年より京都大学学術情報メディアセンター准教授.京都大学博士(工学).1997年情報処理学会山下記念研究賞受賞.2010年情報処理学会論文賞受賞.2010年第58回電気科学技術奨励賞受賞.言語処理学会会員.
河原達也 君
1989年京都大学大学院工学研究科情報工学専攻修士課程修了.現在,京都大学学術情報メディアセンター教授.音声言語処理,特に音声認識及び対話システムに関する研究に従事.京大博士(工学).2012年度科学技術分野の文部科学大臣表彰科学技術賞.情報処理学会,日本音響学会,電子情報通信学会,人工知能学会,言語処理学会,IEEE 各会員.