特許庁からの機械翻訳システムの受注について

〜NICTが開発した最新のニューラル機械翻訳エンジンの採用により、正確で自然な翻訳を実現〜

 

 東芝デジタルソリューションズ株式会社(以下、当社)は、特許審査官を始め、国内外の企業、研究機関が利用する「機械翻訳システム」を特許庁から受注しました。国立研究開発法人情報通信研究機構(NICT)先進的音声翻訳研究開発推進センターが開発した最新のニューラル機械翻訳エンジン(注1)(NMT)に当社が持つ自然言語処理技術を組み合わせることで、従来の機械翻訳では難しかった正確で自然な機械翻訳を実現します。さらに、日本マイクロソフト株式会社(マイクロソフト)のクラウドプラットフォームMicrosoft Azureを採用することで大量の特許文献に対して高速の翻訳処理を可能にします。本システムは2019年5月からの稼動を目指し開発を開始します。

 特許戦略のグローバル化に伴い、特許文献を翻訳する頻度・件数は急増しています。しかし、従来の人手による翻訳作業では、時間がかかる、コストが高い、大量の翻訳が難しいなどの課題がありました。これらの課題を解決する手段として、機械翻訳の活用が進んでいますが、従来のルールベース機械翻訳エンジン(注2)(RBMT)や統計的機械翻訳エンジン(注3)(SMT)では、正確さや自然さに欠けるなどの問題がありました。近年になり、人工知能(AI)を活用したNMTの登場で、翻訳品質は格段に向上しましたが、原文のパターンによっては誤訳(訳抜け、湧き出し(注4)等)が生じやすいなどの欠点が指摘されています。

 また特許文献は、内容が長文で記載される請求項部分(注5)と、句から構成される「発明の名称」「出願番号」「出願人」の定型部分が同一文書内に含まれ、請求項部分にはNMTが適している一方、定型部分はRBMTやSMTが適するなど翻訳エンジンの向き・不向きが混在しているという課題がありました。

 今回当社が開発する特許庁「機械翻訳システム」は、当社が長年培ってきた自然言語処理技術に、NICTが開発した最新のNMTを組み合わせることにより、以下のような処理を可能にします。

 当社の自然言語処理技術で、特許文献の請求項部分と定型部分を自動で切り分け、NMT、RBMT、SMTに適宜振り分けます。加えて、NMTの弱点とされる誤訳が生じにくいように入力文を整形する処理技術を実装します。これらにより、NMTの翻訳性能を最大限に活かした正確で自然な翻訳を実現することが可能になります。

 また、大量の特許文献を高速に翻訳処理するために、高速・同時・大量の処理が可能なクラウドプラットフォームMicrosoft Azureを採用します。

 当社は今後も、NICTおよびマイクロソフトと連携し、高品質の機械翻訳ソリューションの開発・改良を続け、グローバル化の進展に伴い高まる、企業、研究機関・官公庁の翻訳ニーズに応えるソリューションを提供していきます。

 ※以下は添付リリースを参照

 

 

リリース本文中の「関連資料」は、こちらのURLからご覧ください。

添付リリース

http://release.nikkei.co.jp/attach_file/0484820_01.pdf