JST(理事長 中村 道治)は、独立行政法人 情報通信研究機構(理事長 坂内 正夫、以下「NICT」)と共同で開発した英日自動翻訳システム注1)を科学技術文献データベースの作成・提供を行う文献情報事業に導入し、中国文献データベース(JSTChina)注2)内の英語の標題、抄録がある文献記事の和訳に適用し、平成27年3月30日から公開します。
近年の科学技術の発展により、科学技術に関係する文献は増大する一方であり、特に中国などの新興国から産出する文献が増えています。JSTでは、これまで英語科学技術文献の標題や抄録を日本語に翻訳し、データベースサービスとして提供してきましたが、人手による作成には、多大な費用と時間がかかり、増大する外国の文献情報を十分にカバーできない状態が続いていました。
この背景のもと、英語で記載された標題と抄録について、NICTが開発した自動翻訳システムを活用することにより、JSTは、データベース作成工程を合理化し、従来と比べて大量の文献データの提供を目指しています。
今回適用した自動翻訳技術は、NICTが開発した自動翻訳エンジンサービスである「みんなの自動翻訳@TexTra®注3)」サイトを活用しています。NICTの自動翻訳エンジンは「複雑な長文を正確に翻訳するために必要となる新技術である、語順変換と訳語選択との独立実行による統計翻訳技術の研究注4)」に基づくものです。NICTの自動翻訳エンジンに、JSTの保有する科学技術文献の日英対訳データ、および化学式などに対する自動翻訳精度改善技術を適用することにより、今回の自動翻訳エンジンが構築されました。
JSTChinaでは、自動翻訳システムの導入により、翻訳件数が約10万件/年から、約15万件/年(26年度)へ増加する見込みです。今後は、自動翻訳システムを適用する対象誌の範囲を広げるだけでなく、増大する中国語文献にも対応していく予定です。