JSTトッププレス一覧 > 共同発表

平成27年3月30日

科学技術振興機構(JST)
情報通信研究機構(NICT)

科学技術文献データベースの作成に「高精度自動翻訳システム」を導入
~平成27年3月30日より、中国文献データベース(JSTChinaファイル)に適用~

JST(理事長 中村 道治)は、独立行政法人 情報通信研究機構(理事長 坂内 正夫、以下「NICT」)と共同で開発した英日自動翻訳システム注1)を科学技術文献データベースの作成・提供を行う文献情報事業に導入し、中国文献データベース(JSTChina)注2)内の英語の標題、抄録がある文献記事の和訳に適用し、平成27年3月30日から公開します。

近年の科学技術の発展により、科学技術に関係する文献は増大する一方であり、特に中国などの新興国から産出する文献が増えています。JSTでは、これまで英語科学技術文献の標題や抄録を日本語に翻訳し、データベースサービスとして提供してきましたが、人手による作成には、多大な費用と時間がかかり、増大する外国の文献情報を十分にカバーできない状態が続いていました。

この背景のもと、英語で記載された標題と抄録について、NICTが開発した自動翻訳システムを活用することにより、JSTは、データベース作成工程を合理化し、従来と比べて大量の文献データの提供を目指しています。

今回適用した自動翻訳技術は、NICTが開発した自動翻訳エンジンサービスである「みんなの自動翻訳@TexTra®注3)」サイトを活用しています。NICTの自動翻訳エンジンは「複雑な長文を正確に翻訳するために必要となる新技術である、語順変換と訳語選択との独立実行による統計翻訳技術の研究注4)」に基づくものです。NICTの自動翻訳エンジンに、JSTの保有する科学技術文献の日英対訳データ、および化学式などに対する自動翻訳精度改善技術を適用することにより、今回の自動翻訳エンジンが構築されました。

JSTChinaでは、自動翻訳システムの導入により、翻訳件数が約10万件/年から、約15万件/年(26年度)へ増加する見込みです。今後は、自動翻訳システムを適用する対象誌の範囲を広げるだけでなく、増大する中国語文献にも対応していく予定です。

<用語解説>

注1) 英日自動翻訳システム
NICT多言語翻訳研究室では、英語から日本語への翻訳に限らず、さまざまな言語の機械翻訳について、基礎研究から応用までの各種研究に取り組んでいます。
NICT自動翻訳システムについての詳細は、NICT多言語翻訳研究室のホームページをご覧ください。
(URL:http://www2.nict.go.jp/univ-com/multi_trans/index.html
注2) 中国文献データベース(JSTChina)
JSTChinaは、中国で発行される科学技術資料のうち特に重要度の高い700誌以上について、その標題や抄録の情報を日本語で収録したデータベースです。株式会社ジー・サーチの提供する「JDreamⅢ」システムに登載され、無料提供されています。
JSTChinaは、JDreamⅢの契約者だけでなく、どなたでもご利用いただけます。利用方法について詳しくは、ホームページをご覧ください。
(URL:https://spc.jst.go.jp/database/
なお、JDreamⅢでのJSTChinaの回答表示において、機械翻訳された日本語抄録とともに原文の英語抄録を表示する機能改良も行っています。
<JDreamⅢについて>
JDreamⅢは、JSTが作成した科学技術文献データベースを株式会社ジー・サーチが提供するサービスです。JSTChinaだけでなく、日本国内または国外の科学技術文献情報を日本語で収録したさまざまなデータベースが登載されています。
詳しくは、JDreamⅢのホームページをご覧ください。
(URL:http://jdream3.com/
注3) みんなの自動翻訳@TexTra®
「みんなの自動翻訳@TexTra®」は、NICTが運営する自動翻訳エンジンサービスサイトです。「みんなの自動翻訳@TexTraR」にユーザー登録(無料)を行うと、あらかじめ登録された自動翻訳を試したり、自動でファイルを翻訳できたり、サイト上で翻訳エディタを使用して自分で翻訳することができます。また、自分で用意した翻訳データを登録し、使用することで自分だけの自動翻訳にカスタマイズすることも可能です。
詳しくは、みんなの自動翻訳@TexTra®のホームページをご覧ください。
(URL:https://mt-auto-minhon-mlt.ucri.jgn-x.jp/
注4) 統計翻訳技術の方式
NICTの自動翻訳エンジンでは、日本語と英語のように、文法が大きく異なる言語間の翻訳の際、自動学習した語順変換規則に従って、入力文を相手側の言語と似た語順に語順変換をした後、自動学習した確率付の対訳辞書を用いて訳語を選択する方式にしています。

<お問い合わせ先>

<データベースサービスについて>

科学技術振興機構 知識基盤情報部
大倉 克美(オオクラ カツミ)、矢口 学(ヤグチ マナブ)
Tel:03-5214-8444 Fax:03-5214-8460
E-mail:

<自動翻訳技術について>

情報通信研究機構 ユニバーサルコミュニケーション研究所
内山 将夫(ウチヤマ マサオ)
Tel:0774-98-6343 Fax:0774-98-6955
E-mail: