バイオ基幹情報資源の高準化と共用化

代表研究者: 菅原 秀明(国立遺伝学研究所 教授)

①目的

バイオ分野の問題解決にはウエット系とドライ系の融合が欠かせません。ドライ系の観点からは、塩基配列データベースや蛋白質構造データベースを始めとする多様なバイオデータベース群と、キーワード検索やblastを始めとする検索や解析のプログラム群を、いくつも連結してデータ処理のパイプラインを組み立てて、問題を解決していくことになります。本課題では、パイプラインの部品としてのデータベースや解析プログラムというバイオ情報資源の品質を高め(高準化)かつ自在に組み合わせやすくし(共用化)つつ、パイプラインの具体例も構築・提供します。

②研究概要

既存のバイオ情報資源を分析し、ウェット系のプロセス、ドライ系のプロセスおよびバイオ情報資源の機能を記述する標準形式を考案し、日本DNAデータバンク(DDBJ)をはじめとするバイオ情報資源を対象としてその機能を標準形式で記述します。並行して、多様なバイオ情報資源をプログラムから直接利用できるようにWeb APIを用意し、そのWeb API群を部品として、いくつかのモデルについて問題解決の手順(ワークフロー)を構築します。これらのWeb APIとワークフローは広く一般に公開します。

③研究概要図

菅原秀明バイオ基幹情報資源の高準化と共用化

④成果

・PubMedに収録された論文で引用される頻度が高いバイオ情報資源を対象として、その利用に必要な情報をメタデータベースに蓄積して公開しています( メタデータベース[外部リンク] )
・論文からバイオ分野の実験・解析手法を抽出してウエット・メソッドオントロジーとドライ・メソッドオントロジーを構築する手法の開発を進めています。
・日本DNAデータバンク(DDBJ)が提供するデータベースと解析ツールを主な対象として多様なWebサービスAPIを用意し、それらを部品とするワークフローのサンプルならびにナビゲーションシステムを構築・公開しています。
Web API for Bioinformatics/Biology (WABI)[外部リンク]
WABIのCookBook(使い方の解説ページ)[外部リンク]
ワークフローナビゲーションシステム[外部リンク]
微生物ゲノムWebサイト[外部リンク]
新世代シーケンサー由来データアーカイブDRA[外部リンク]
(2010/05/07更新)