マルチモーダル統合バイオDB(Multimodal BIODB)

代表研究者: 森下 真一 (東京大学大学院新領域創成科学研究科 教授)

①目的

近年、DNA配列、組織別遺伝子発現量、バイオイメージ、パスウエイ、文献な どの異なるタイプの生物データが急速に蓄積されてきています。膨大な情報量か ら目的の情報を抽出するには BLAST, クラスタリング、PubMed などのソフトウェ アが欠かせません。しかしこれらのソフトウェアは配列・文献など単一のデータ タイプを処理するために特化しています。しかし現実には単独のデータタイプだ けが利用されることは少なく、異なるデータを組合せながら手作業で慎重に遺伝 子情報を絞り込むことが普通です。マルチモーダル統合バイオDBでは、異なる データタイプに対する問合せを容易にするシステムの実現を目指しています。

②研究概要

さまざまなデータタイプが蓄積されている出芽酵母を対象に、マルチモーダル問 合せの萌芽的研究を試みてきました。私たちは、出芽酵母だけでなく、発生遺伝 学のモデル生物であるメダカおよびショウジョウバエ、害虫研究のモデル生物で あるカイコそして、ヒトへと広げました。また近年超高速DNAシークエンサーが普 及し、未曾有の転写開始点情報、遺伝子発現情報、遺伝子多型等のマルチモーダ ルなデータが収集されました。この大量データを迅速に分析しマルチモーダル統 合バイオDBに取り込むために、新しい解析アルゴリズム、超並列クラスター型計 算機を利用した処理手法の研究開発にも取組んでいます。

③研究概要図

森下真一マルチモーダル統合バイオDB(

Multimodal BIODB)

④成果

研究成果は7つのウェブサーバーから公開されており、毎月平均で約12,000の訪 問者(Visits)により利用されています。研究論文はNature, Science, Genome Research, Proc Natl Acad Sci U S A., Nucleic Acids Research (Database Issue) 等の国際雑誌および 国際会議ACM SIGMOD等で発表されています。超高速 DNAシークエンサーが出力するゲノムデータを分析したウェブサーバーを、ヒト、 カイコ、ショウジョウバエを対象に構築し公開中です。

【関連リンク】

森下研究室 ホームペー ジ [外部リンク]
(2010/05/07更新)