「 特許文献によるBERT 事前学習モデルと特許調査業務への応用」

2024年度論文賞受賞者の紹介

特許文献によるBERT 事前学習モデルと特許調査業務への応用

[情報処理学会論文誌デジタルプラクティス Vol.4 No.3, pp.58-68]

[論文概要]

特許の侵害回避調査では,調査対象製品との関係性で特許文書を仕分けする必要がある.本論文では,定期的に文献収集して関連性チェックを行った過去データを訓練データとして使い,特許文書を機械学習で仕分けして調査効率を向上させることを提案する.機械学習の言語処理モデルとしては,2018年に発表され標準的なモデルとなったBERTによる大型日本語汎用モデルも開発されているが、多くの計算機資源を必要とする.日本語版の小型の特許専用モデルを作成して,特許に関するタスクでは大型汎用モデルと同等の性能を発揮することを確認したので,その結果を報告する.

[受賞理由]

本論文は,特許の侵害回避調査のために特許文書を検索する際にあらかじめ指定した検索条件で文献を定期的に収集してチェックするSDI調査の過去の結果データを訓練データとして用いることで,調査対象となる製品との関連性により特許文書を仕分けできるように機械学習を行い,仕分けする際の評価値を用いてランキングを行う手法を提案している.この手法では,67%の作業改善が可能である.また,この手法は,科学技術論文の検索などの他の分野にも応用できる可能性がある.以上のことより,この論文は多くの活用が期待されるために表彰に値する.

秋山 賢二 君

1984年 東北大学大学院工学研究科博士前期課程修了.同年東芝入社. 2011年富士通転籍.2018年FCNT株式会社転籍. 2023年から情報通信研究機構 知財活用推進室に所属.2017年東京農工大学 生物システム応用科学府博士後期課程在籍.2023年満期退学.自然言語処理による特許業務の効率化・可視化について研究.

斎藤 隆文 君

1982年東京大学工学部計数工学科卒業.1990年東京大学大学院工学系研究科博士課程修了.工学博士.1987年NTT研究所勤務.1997年東京農工大学工学部助教授.2002年東京農工大学大学院教授.2025年定年退職.本学会フェロー,画像電子学会フェロー.