「係り受け木における機械翻訳のための品詞の教師なし学習」
2014年度論文賞受賞者の紹介
係り受け木における機械翻訳のための品詞の教師なし学習
[情報処理学会論文誌 Vol.55, No.7, pp.1665-1680]
[論文概要]
統語情報に基づく機械翻訳の性能を向上させるため,ノンパラメトリックベイズ法により,単語間の係り受け構造から,原言語と目的言語の両言語を考慮したバイリンガルな品詞を推定する手法を提案する.具体的には,原言語の係り受け木における各品詞を隠れ状態とし,各隠れ状態は,原言語の単語と共に,対応する目的言語の単語をシンボルとして出力する,バイリンガルな無限ツリーモデルを提案する.NTCIR-9の日英特許翻訳タスクにおける実験を通じて,提案手法で推定した日本語の品詞タグを使うことにより,forest-to-string翻訳の性能をBLEUで1 % 以上改善できることを示す.
[推薦理由]
本論文は,機械翻訳システムの性能改善を目的とした新たな品詞推定手法を提案するものである.単言語を対象とする既存モデルを拡張し,提案手法では原言語と目的言語の両言語を使用するシナリオに適用している.これにより目的言語における違いを反映したバイリンガルな品詞を原言語の単語に付与することが可能となり,その結果として翻訳性能を向上させられることを示した.着眼点の新しさだけでなく,情報化され,かつ国際化された社会への影響力の強さも認められるため,論文賞にふさわしいと判断し,ここに推薦する.
田村晃裕 君
2005年東京工業大学工学部情報工学科卒業.2007年同大学院総合理工学研究科修士課程修了.2007年から2015年3月まで日本電気株式会社にて自然言語処理に関する研究に従事.2013年東京工業大学大学院総合理工学研究科博士課程修了.博士(工学).現在,情報通信研究機構の研究員.統計的機械翻訳の研究に従事.
渡辺太郎 君
1994年京都大学工学部情報工学科卒業.1997年京都大学大学院工学研究科情報工学専攻修士課程修了.2000年Language and Information Technologies, School of Computer Science, Carnegie Mellon University, Master of Science取得.2004年京都大学博士(情報学).ATRおよびNTT,NICTにて研究員として務めた後,現在,グーグル株式会社ソフトウェアエンジニア.言語処理や機械学習,特に統計的機械翻訳の研究に従事.
隅田英一郎 君
1999年京都大学大学院博士(工学)取得.1982年~1991年(株)日本アイ・ビー・エム東京基礎研究所/研究員.1992年~2009年国際電気通信基礎技術研究所/研究員,主幹研究員,室長.2007年~現在,国立研究開発法人情報通信研究機構/研究M,GL,室長,副所長.機械翻訳,情報検索,e ラーニングに関する研究開発に従事.
高村大也 君
1997年東京大学工学部計数工学科卒業.2000年同大大学院工学系研究科計数工学専攻修了.2003年奈良先端科学技術大学院大学情報科学研究科博士課程修了.博士(工学).2003年から2010年まで東京工業大学精密工学研究所助手,のち助教.2006年にはイリノイ大学にて客員研究員.2010年より同准教授.計算言語学,自然言語処理を専門とする.
奥村学 君
1984年東京工業大学工学部情報工学科卒業.1989年同大学院博士課程修了.同年,東京工業大学工学部情報工学科助手.1992年北陸先端科学技術大学院大学情報科学研究科助教授,2000年東京工業大学精密工学研究所助教授,2009年同教授,現在に至る.工学博士.自然言語処理,語学学習支援,テキストマイニングに関する研究に従事.