JSTトッププレス一覧科学技術振興機構報 第430号 >別紙1:平成19年度バイオインフォマティクス推進事業 選定課題一覧
別紙1

平成19年度バイオインフォマティクス推進事業 選定課題一覧

課題名 酵素反応分類に基づく酵素反応予測システムの開発
代表研究者 長野 希美((独)産業技術総合研究所 生命情報工学研究センター 主任研究員)
概要  従来の酵素分類EC番号注1)は、主に基質・産物の化学構造や補酵素などに基づいた分類であり、触媒機構において重要な蛋白質の配列情報、立体構造が考慮されていない。本課題では、EC番号に代わる、より精密な階層的な酵素反応分類を網羅的に行う。これは詳細な酵素触媒機構、立体構造、リガンドの反応部位に基づいた酵素反応クラスの新しい階層分類である。また、分類を促進するために、機械学習の最新技術を駆使して、自動酵素反応予測システムを開発する。予測システムを用い機能未知酵素の酵素反応クラスを予測し、その結果を分類に反映させる。最終的には「酵素反応予測システム」の一般公開を目指す。

課題名 進化型計算と自己組織化による適応的画像分類法の開発
代表研究者 馳澤 盛一郎(東京大学大学院新領域創成科学研究科 教授)
概要  生命科学研究用、医用画像解析システムの多くは、解析の対象や目的を絞り、分野固有のドメイン知識に基づいて開発されているため、汎用性が低く、多種多様な画像やニーズへの対応が困難である。本課題では、高い汎用性を持った画像自動分類技術を新たに開発する。撮影対象、分類目的、撮影法など条件が異なる多様な画像群に対して、進化型計算法と自己組織化写像法を用いて、(1)最適な特徴量を創出し選抜するアルゴリズム、(2)画像の傾向や分布を見通しよく可視化するアルゴリズム、(3)専門家によるアノテーションに基づいて画像自動分類を行う部分教師付学習アルゴリズムの確立を目指す。

課題名 生命科学上の非構造化データの統合マイニング
代表研究者 馬見塚 拓(京都大学化学研究所 教授)
概要  生命科学においては多種多様なデータが大量に蓄積されつつあり、これら様々な形式の大量データから効率よく知識発見する手法が強く望まれている。本課題では、頻出パタンマイニング注2)およびクラスタリング注3)という2つの知識発見手法に絞り込み、構造化データ(cDNAマイクロアレイデータ注4)等)と非構造化データ(遺伝子制御や代謝パスウェイのネットワーク等)を効率よく組み合わせるシステマティックな手法を開発する。より具体的には、特に遺伝子と低分子化合物に着目し、個別の生体分子を事例とするだけでなく、遺伝子-低分子化合物の組み合わせをも事例とした新しい知識発見手法の構築を目指す。

課題名 ダイナミクスを考慮した膜蛋白質の構造モデリング法の開発
代表研究者 水口 賢司((独)医薬基盤研究所 バイオインフォマティクスプロジェクト プロジェクトリーダー)
概要  膜蛋白質は薬物ターゲットの大多数を占めるため、その立体構造情報は非常に重要である。近年X線構造解析により、構造が決定されるようになってきたが、解像度が低い、膜蛋白質複合体の立体構造が解かれていない、脂質分子との相互作用が明らかでない等の構造解析における困難が依然として存在する。本課題では、これらを克服するために、蛋白質データベースを用いた統計解析(バイオインフォマティクス的手法)と、物理化学的ポテンシャル関数を用いた分子シミュレーションを組み合わせて、ダイナミクスを考慮した膜蛋白質の構造モデリング技術の確立を目指す。

<用語解説>

注1)EC番号(Enzyme Commission numbers):
 酵素を反応形式に従って系統的に分類するための番号で、ECで始まる4組の数字からなっています。国際生化学連合(現 国際生化学分子生物学連合:International Union of Biochemistry and Molecular Biology)の酵素委員会が、1961年に酵素の命名と分類の規則を制定しました。(生化学辞典)

注2)マイニング(mining):
 膨大なデータから共通のパターンや因果関係などを見つけることで、隠れた事実や関係性を発見する技術のことです。(バイオインフォマティクス事典)

注3)クラスタリング(clustering):
 個体(サンプル)を特徴づける変数間の類似度に応じ、個体をいくつかのグループ(クラスター)に分けることです。(バイオインフォマティクス事典)

注4)cDNAマイクロアレイデータ:
 スライドガラス上に多数のcDNA(mRNAに相補的なDNA)を細密に並べたものをcDNAマイクロアレイといい、同様に、基板上でオリゴヌクレオチドを合成して高密度にDNAを固定しているものをGeneChipといい、これらを用いることにより数万から数十万の遺伝子の発現情報を一度に測定することができます。得られたデータが、cDNAマイクロアレイデータです。