最新情報

JSTトピックス

生命科学分野のデータをより使いやすく

研究者にとって、実験をするのと同じくらい重要なことは何だと思いますか。それは、情報を活用することです。たんぱく質の立体構造やがんのゲノムなどの貴重な情報が詰め込まれたデータベースは、生命科学分野の研究には欠かせない情報基盤であり、研究の最前線です。

生命科学分野にはさまざまなデータベースがあり、それぞれが別々の用語や形式で記述されています。まちまちの情報を集約して誰もが使えるように関連付けるには、極めて高度な専門知識が必要です。手間も時間もかかります。こうした問題解決に、データを記述するに当たってRDF(Resource Description Framework)形式を利用しようという動きが国内外で進んでいます。RDF形式はインターネット上にあふれる情報を活用するためにWWWコンソーシアムが提案した形式です。 データの意味をふまえた検索と自動処理ができるようになると見込まれています。

JSTバイオサイエンスデータベースセンター(NBDC)と情報・システム研究機構ライフサイエンス統合データベースセンター(DBCLS)は、多くの研究機関が RDF 形式に変換したさまざまなデータベースを集積して公開するポータルサイトを開設しました。このサイトは、オープンサイエンスを推進し、日本の先進的な取り組みの国際的な理解を高めるものであり、今後も新たなRDFデータの登録を進めていく予定です。

各国で公開されているデータを簡単に参照したり連結したりできるようになり、新薬の開発や患者1人1人に合わせた医療など、多種多様なデータを必要とする研究に貢献できます。また、RDF形式のデータはコンピューターが理解(処理)しやすくなっているので、人工知能技術を応用すれば、これまで解き明かせなかったような生命科学の問題解明にもつながることが期待されます。


NBDC RDFポータルのデータベースリスト画面
各データベースの簡単な説明やカテゴリ情報、データベースの詳細説明へのリンクが掲載されている。リストは名称や
更新日などでの並べ替えや、カテゴリごとの表示もできる。


NBDC RDFポータルの概要
さまざまな生命科学分野のデータを、用語を統一しRDF形式に変換することで、簡単に参照したり連結したりできるようになり、
多種多様なデータを必要とする研究に貢献できる。NBDC RDFポータルではこのようなRDFデータを集積し公開している。
( 関 連 記 事:JSTnews2014年12月号『生命科学データベースを未来の産業革命に』)