事業成果

データベースを共有・統合

NBDCロゴマーク生命科学データの価値を最大化2019年更新

情報基盤強化と日本の研究成果の発信

NBDCの事業推進の構成

NBDCの事業推進の構成

生命科学データベースの統合を実現するため、研究開発とサービス提供を行っている。それにより生命科学分野の研究データを中心とした研究成果を、研究者、開発者、技術者に広く共有し、研究開発の活性化を目指している。これらの推進は、関係する府省と一丸となって取り組んでおり、研究成果が効果的に活用できる基盤を構築することにより、ライフイノベーション・グリーンイノベーションの実現を加速する。

NBDC事業の4つの柱

(1)戦略の立案:
データベースの整備・統合化の戦略企画や、データや技術のコーディネート、データベース統合化ガイドラインの策定、国内外との連携構築などを実施。
(2)ポータルサイトの構築・運用:
データベースに関連するサービス、研究開発プログラムの情報やセンターの活動を紹介するポータルサイトを構築・運用。
・カタログ:目的のDBを一覧から探せる
→データベース収録数:1,644件
・横断検索:さまざまなDBを一括で検索可能
→対象データベース数:643件
・アーカイブ:DBを丸ごとダウンロード可能
→公開データベース数:137件
・RDFポータル:様々な研究機関が作成した生命科学分野のRDF形式データを検索・ダウンロード可能
→公開データセット数:20件
・ヒトDB:個人情報の保護に配慮しつつ、ヒトに関する様々なデータを共有するためのプラットフォーム
→公開データ数:73件

(数字はすべて2017年度末時点)

(3)データベース統合化基盤技術の開発:
セマンティックウェブ技術等によるデータベース統合化に必要な基盤技術開発を推進。多種多様なデータベースをRDF形式で提供するポータルサイトやRDF化支援ツールの提供、その他、エンドユーザ向けのデータベース利用技術の開発等を行っている。
(4)バイオ関連データベース統合化の推進
統合化推進プログラムのファンディングにより、分野ごとのデータベース統合化を推進。本プログラムでは、これまで31件の研究開発課題を支援してきており、2018年度は9件の研究開発課題の支援を実施している。
PICK UP!!

日本人ゲノム多様性統合データベース「TogoVar」を開発
~ゲノム医科学研究に役立つ情報をワンストップで提供~

本データベースは、NBDCと情報・システム研究機構 データサイエンス共同利用基盤施設 ライフサイエンス統合データベースセンター(DBCLS)との共同研究により開発された。
https://togovar.biosciencedbc.jp/

薬の効き方や疾患のかかりやすさ、お酒を飲むと顔が赤くなるといった体質などの「表現型」は、遺伝子のバリアントと関係している。表現型とバリアント※1の関係を発見するためには、対象とする集団に存在するバリアントの割合(頻度)の情報が必要であり、多くのデータを活用できることが成功の鍵となる。すでに海外では大規模な個人ゲノムデータを集約したバリアントの頻度情報が公開され、広く利用されている。一方、日本国内では、これまでさまざまな研究プロジェクトごとに公開されてきたため、プロジェクトを越えて横断的にバリアントの頻度情報を活用できるようにすることが課題たった。

この課題を解決するために、TogoVarでは、各プロジェクトで生産された個人ゲノムを集計したバリアントの頻度情報や文献情報などを収集・整理し、さまざまな条件(バリアントのヒトゲノム上の位置、種類など)を用いて、ワンストップで検索する機能を提供する。これと同時に、これまでNBDCヒトデータベース※2に登録された日本人のゲノムデータから大規模なバリアントの頻度情報を集計して検索対象とするとともに、そのデータセットをTogoVarで公開した。

今後、TogoVarは、遺伝カウンセリングなど日本人を対象にした個別化医療(高精度医療)に向けたゲノム医科学の発展に寄与する日本人ゲノム情報基盤となることを目指し、バリアントに付随する遺伝子発現データなどの研究者に有用な情報を追加するとともに、NBDCヒトデータベースによりバリアントの頻度情報をさらに充実させていく。

  • ※1:ゲノム配列の個人による違い
  • ※2:NBDCヒトデータベース/Japanese Genotype-phenotype Archive(JGA)

NBDCとDDBJが共同運営する、ヒト由来試料からのゲノムデータなどを共有するための公的リポジトリ

●TogoVarのポイント 1

TogoVarでは、ゲノム配列の個人による違い(バリアント)に関するさまざまな条件を用いて、国内外のデータベースや文献情報などをワンストップ検索を可能にした。

例)7番染色体の特定のバリアントについて情報収集する場合

TogoVarワンストップ検索
  • ※上の例で示す、CinVar、ExAC、iJGVD 3.5KJPN、HGVDは、国内外のバリアント等情報のデータベースの名称
  • ※アレル頻度は対象とする集団に存在するバリアントの割合
●TogoVarのポイント 2

検索対象には、NBDCヒトデータベースに登録された日本人のゲノムデータから集計した大規模なバリアントの頻度情報が含まれており、この頻度情報のデータセットもTogoVarから公開する。

NBDCヒトデータベース
●TogoVarの画面イメージ
TogoVarの画面イメージ
●TogoVarの特長
✓バリアントの解釈に必要な情報を国内外のデータベースから広く収集し整理統合
多種多様なデータベースに散在して収録されてきた遺伝子型や表現型に関連する情報を、整理統合してワンストップでわかりやすく提供。
✓様々な条件で検索・絞り込みが可能
バリアントのヒトゲノム上の位置や頻度、バリアントの種類(一塩基置換、挿入、欠失など)、遺伝子名、既知の疾患との関連などの条件から、該当するバリアントを検索できる。
✓日本人におけるバリアントの頻度情報(JGA)を提供
国内外のバリアントDBの情報に加えて、NBDCヒトデータベースに登録されている個人ごとのゲノムデータを集約して得られた、日本人におけるバリアントの頻度情報を提供。約18万人分のデータをもとに、約1,300万ヵ所のバリアントを収録している。